Denny

自动驾驶数据闭环的三个核心问题

#autonomous-driving#data-closed-loop

自动驾驶的数据闭环,有三个核心问题: **数据采集**:什么场景需要采集?采了之后怎么筛选?成本和覆盖度的平衡? **数据标注**:corner case 的标注成本高、定义模糊。怎么提高标注效率和质量? **模型更新**:新的数据怎么高效地反映到模型里?增量训练还是全量重训?怎么验证更新后的模型? 这三个问题相互依赖,数据采集策略影响标注成本,标注质量影响模型效果,模型效果又影响数据采集的优先级定义。 很多团队把这三个问题分开优化,结果发现局部最优不等于全局最优。