近日,在ICVS中国自动驾驶年会—火山引擎 X NVIDIA云上创新专场上,火山引擎首次面向智驾行业集中展示了AI数据服务的能力,并分享了构建高质量、高安全性、高效的数据服务体验等方面的思路。据了解,火山引擎AI数据服务针对智能汽车领域中的自动驾驶、智能座舱两大方向,提供高质量的数据采集、标注服务,平均交付准确率已经可以实现99%以上。
在自动驾驶领域,火山引擎根据L2级别组合驾驶辅助,提供对车道和周围环境数据的采集和标注服务,通过持续不断地“投喂”高质量的数据,来提升智能汽车在路面行驶时对周围环境及物体的感知能力。
针对L3级及以上的自动驾驶等级,火山引擎借助点云标注的大方向,通过3D点云场景下的连续帧、2/3D融合、点云语义分割等标注类型,解决自动驾驶应用场景持续拓展对于多源异构数据的需求,数据精准度可达99%级别,直击数据需求痛点,加速自动驾驶算法落地。
在智能座舱领域,通常需要对车内的不同条件下的人脸、手势、语音数据采集和标注,让智能座驾能够理解驾驶员的意图并快速响应,丰富驾驶乐趣和使用体验的同时,也能进一步增强行驶安全性。
针对车内的生物识别和手势控制识别技术,火山引擎AI数据服务可提供多种设备(录音笔、手机、车机鱼眼摄像头等)、多角度(直视、45度、仰视等)、多场景(多场景下的光线条件)下的数据采集服务,对驾驶员眼球视线和人脸轮廓及手势进行标注,用于判断和识别驾驶员驾驶状态和对车机下达的操控指令,确保机器训练所用的非结构化数据来源足够丰富和多样。
在声控信息交互和情感交互识别方面,可提供多语种(普通话、方言、英语等)、多语料、多场景(车内、车外、多乘客等)及不同性别、年龄人的语音采集和标注能力,用于训练和提升语音唤醒、语音识别、NLP、情感识别等模型的效果。
在产品质量方面,火山引擎方面则表示,火山引擎通过高标准的人员准入门槛、长时间的经验累积和方法沉淀、专业的质检把关部门、灵活的平台支持把控质量。在保证产品质量的同时,火山引擎数据服务的产量也值得称赞,覆盖全国支持大规模量产。
图:产量管理
为了能保证高效、高产,火山引擎AI数据服务在三方面做了相应配置。在资源层面,在天津、龙岩、重庆、烟台等10+地方拥有自建基地,综合标注人员达万人,可解决人力缺口问题。在人员管理层面,构建完整的人员管理、人员产能分析体系,实现灵活、敏捷、大规模用工的新模式。在平台支持层面,资源管理平台科学分发任务、进度看板提前预警。通过增强三方面的能力,能够以多维度、多角度、科学精准地做好产量管控。
图:数据安全管理
在数据安全方面,火山引擎AI数据服务从人员培训、平台安全、工区场地安全再到网络及终端安全都采用了行业内最高标准,确保客户的核心利益不受损。在数据流转的过程中,提供云链接加密传输、硬盘传送、专人监督运送、阅后即焚、文档权限管理等方式来保证安全性。
在人员培训、数据平台、物理工区、网络终端安全等方面,通过一系列科学的方式和培训来提高人员对数据安全保护意识;再通过数据平台水印、飞书文档权限、数据生命周期和行为记录等方式确保数据不外传;在物理场地采用门禁、CCTV和专人巡检的方式保障职场安全;并采用抖音集团的网络及终端安全管理方法来保证数据安全。
据了解,现阶段,火山引擎AI数据服务在智能驾驶领域拥有几千名2D/3D经验生产人力,客户已经覆盖头部互联网公司无人车项目、造车新势力、传统车厂、图商、自动驾驶方案提供商等。项目能力覆盖了2D/3D融合、点云车道线、连续帧追踪标注等主要类型。标注车型覆盖商用车、乘用车及无人配送车等多类型车辆,标注场景实现全覆盖。(作者:潘珠)