4月11日,《互联网周刊》&eNet研究院、德本咨询联合发布《2021数据标注公司排行》。其中,云测数据凭借数据标注能力和场景化训练数据方案等实力,上榜“数据标注公司排行”。本次排行榜的入选,是业内对云测数据综合实力的又一权威认可。
在整个人工智能体系中,算力、算法和数据是人工智能进化的三大要素,分别承担着人工智能基础设施能力、工作指导方法和算法进化依据的角色。这三大要素相辅相成,共同推动人工智能的发展落地。“数据”作为至关重要的算法训练“原料”,从本质上决定了人工智能的智能水平。
如今,人工智能已经进入商业化落地的阶段。随着人工智能深入无人驾驶、智慧医疗、语音交互等诸多行业领域,数据维度和样本复杂性的要求正在变得越来越高,这对数据标注技术、标注平台能力、不同维度数据协同标注等都提出了挑战。
面对严峻的竞争形势和挑战,云测数据充满底气。《2021数据标注公司排行》中分析指出,作为国内头部人工智能数据采集标注服务商,云测数据的核心优势之一就是支持各种类型标注,完整的数据管理流程操作更便捷、效率更优;同时支持标注工具的定制开发,可灵活满足不同的标注需求,配合客户进行数据处理落地;99.99%的数据标注精准度可更好地应对人工智能产业落地的情况,形成企业护城河。
云测数据作Testin云测旗下AI数据标注服务品牌,通过自建数据场景实验室和数据标注基地,目前已经实现为智能驾驶、智慧城市、智能家居、智慧金融、新零售等众多领域提供高精度、场景化的数据采集、数据标注服务,全方位支持文本、语音、图像、视频等各类型数据的处理,帮助人工智能相关企业更快更好的实现产品商业化落地。
为解决产业化落地的现实问题,助力AI企业占领未来发展高地,云测数据作为国内AI数据服务头部企业,在2020年中国国际服务贸易交易会上,进行了“标注项目交付精准度99.99%”的成果展示。
为了提高数据准确度,云测数据设计了从创建任务到最后的验收等科学规范的数据处理流程;并且面对不同领域的企业都坚持场景化服务的理念,通过自有技术攻克难关,通过多样化的种类标注类型和标注方法灵活满足客户多样化的数据需求。
首创行业“场景数据实验室”
现阶段人工智能在各个领域百花齐放,应用场景越来越多。作为人工智能的基石,数据的重要性不言而喻。但想要实现在各个细分领域深层次的应用,就必须对场景化数据精确处理。为了进一步攻克场景化数据这一难题, 云测数据开创“数据场景实验室”,成为行业内规范化进行场景化数据生产的数据服务商。
如在音频领域,为保证音频数据采集的质量,云测数据开发了“音频检测”功能,通过对音频的底噪和能量值进行检测,来保证底噪和能量值在阈值范围之内。这种预处理方式可大幅提升数据的采集质量并切实提升数据采集的效率。
为了进行多角度多姿态的采集任务,云测数据专门在横店设置了“数据场景实验室”,进行特定动作和表情的捕捉。云测数据在横店的驻站采集负责人接受采访时曾表示,AI数据采集中有形形色色的项目需求,大部分项目的难点在于场景还原的把控,比如采集自然光线下的曝光、强光或背光场景等,有时需要看天,有时需要临时搭棚,但其中表情采集可以称得上最难之一。
前沿的平台技术研发能力
高质量的数据标注工作是推进人工智能技术落地的重要环节之一,数据标注的质量和规模对于提升AI模型训练效果的成功至关重要。在这一过程中,如何从技术、工具层面提升人员效率、标注精准度,成为重要课题。
云测数据的技术实力重点之一体现在数据标注平台上。云测数据标注平台属于自主研发,贯通了从创建任务、分配任务、标注流转、到质检/抽检环节和最后的验收等更完善的管理流程,由专业人员来把控节点,进行上下游衔接,在保证质量的前提下提高效率;平台支持图片、点云、视频、文本、音频、数据清洗等各类型的数据标注,针对每种类型设置了具有代表性的标注模板。如计算机视觉类的标注模板,包括图片通用标注、OCR文字转写、REID目标跟踪、语义分割、3D点云标注等。
目前,云测数据做到了视觉、语音、文本、点云等全数据类型的支撑,涵盖了计算机视觉、语音识别、自然语言处理、知识图谱等AI主流技术领域。合作伙伴包含众多世界500强企业、高校科研机构、政府机构、头部AI企业和大型互联网企业。
持续提升数据采集及标注能力 释放数据要素价值
受政策利好、人工智能发展迅猛、场景需求剧增的影响,AI数据服务行业发展利好。2020年中央公布的第一份关于要素市场化配置的文件《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》中,将数据纳入新型生产要素,并上升到国家战略层面。
面对国家政策与市场变革对数据及服务提出的巨大需求,云测数据将持续发挥高质量+场景化的独特优势,深耕数据采集标注产业,持续提升数据采集及标注能力,打造更为高品质、高标准的AI数据服务,释放数据要素价值。