数据标注是做什么?有哪三个新变化?一文了解
国家层面首次对数据标注产业进行系统谋划。今天(13日),国家发展改革委、国家数据局等多部门发布《关于促进数据标注产业高质量发展的实施意见》。
数据标注到底是做什么的?今天的数据标注产业和过去有什么不同?为什么说数据标注产业是新兴产业?
数据标注,并不是一个新鲜事物,但却是一个新兴产业。为什么这么说呢?
数据标注,简单来说,就是给文本、语音、图片、视频等各种各样的数据“打标签”。
数据标注产业的第一个“新”,新在“自动化”。
这里是北京的一个数据标注基地,每天要处理的数据量非常大,但这里的人其实并不多。这是因为很多数据标注工作都交给机器来干了。差不多三年前,这个行业的自动化率只有30%左右,现在,平均的自动化超过60%。数据标注产业正在从传统的劳动密集型产业转向知识密集型产业。
这就要说到第二个“新”,新在“专业化”。
数据标注员是一个新工种,已经被国家认可。现在这个行业又招了不少有医疗、金融、法律等等专业背景的人才。这是因为这些年,智慧医疗、金融科技等等的应用越来越广泛,那就需要给医学影像、金融文本等等做数据标注。有一个测算,未来五年,我们国家专业数据标注人才的需求将达到100万人以上。
第三个“新”,新在“高端化”。
语音转写、图片文字识别、购物网站上的个性化推荐等等,这些都是需要用到数据标注的传统领域。而现在,数据标注企业接到的大量订单都来自垂直大模型公司,包括做AI助手的、做文生视频的,标注的内容也更丰富,有时候还要对一段视频的情感色彩、人物行为意图等等做标注。
相信大家都注意到了,数据标注这个产业在今天迎来一个大消息:多部门发布《关于促进数据标注产业高质量发展的实施意见》,这是国家层面首次对数据标注产业进行系统谋划。《意见》中提到,到2027年,数据标注产业的专业化、智能化及科技创新能力水平显著提升,产业规模大幅跃升,年均复合增长率超过20%。可以说,产业前景非常可期。
(总台央视记者 刘颖 刘柏煊 黄玮)