2月24日,全球首个基于真实场景的车路协同自动驾驶数据集DAIR-V2X正式发布,向境内用户提供下载使用。
该数据集由清华大学智能产业研究院(AIR)联合北京市高级别自动驾驶示范区、北京车网科技发展-新浦金娱乐网站·官方App Store、百度Apollo、北京智源人工智能研究院共同发布。
此次发布的数据集,首次实现在相同时空下,车端与路端联合视角的2D、3D标注方法创新,作为业界、学界首个开源车路协同数据集,旨在服务科研、产业、政府机构,协同各方进行车路协同的学术研究和产业落地,促进我国车路协同发展。
此次发布的数据集来自北京市高级别自动驾驶示范区10公里真实城市道路、10公里高速公路以及28个路口范围,包含来自车端、路端相机和车端、路端激光雷达等多类型传感器的71254帧图像数据和71254帧点云数据,涵盖晴天、雨天、雾天、白天和夜晚、城市道路与高速公路等丰富场景。
与仅包含单车端或单路端的数据集相比,该数据集提供了相同时空下车端与路端联合视角的多模态数据,并提供了不同传感器联合视角下的融合标注结果,用于更好地服务车路协同算法研究和评估。
此外,数据集通过半自动自学习车路协同3D融合标注方法等创新,有效地减少了数据集构建成本。
北京经济技术开发区管委会副主任、北京市高级别自动驾驶示范区工作办公室主任孔磊在发布活动上表示:“未来将及时利用数据转化制定一批车路协同数据标准,推动行业数据要素、接口、格式等标准统一,为示范区建设和行业发展提供参考和指导;通过数据开放,为高校和科研机构提供基础数据,为企业产品研发测试提供支持,有效加速产学研用协同,同时继续开展数据开放和共享服务模式探索,推动数字经济发展。”
他还指出,本次数据集的发布,为业界学界带来海量、多模态、多视角的真实场景数据,对数据进行标注、脱敏和安全加密等处理后发布,将促进学术界和产业界共同推进数据驱动的车路协同自动驾驶。
百度副总裁、智能交通事业部总经理尚国斌在发言中表示:“数据是自动驾驶、车路协同和智能交通等领域取得突破发展的原动力。数据的有效积累,不仅可以对同等级的算法、算力条件下的效果做质的提升,还可以自动化地识别难题、解决难题,形成人工智能‘见多识广、越用越聪明’的正向循环。”
百度作为车路协同数据集建设的技术支持方,将持续致力于建设完善的车路协同生态,后续将逐步支持发布便于用户上手和基准复现的相关工具和代码,并开展数据集相关使用培训,以支持学术界开展车路协同相关研究。