本篇文章1864字,读完约5分钟

数据服务业企业破解乔纳情结的探索

菊花和刀这个词在诞生之初,指的是日本民族性格的两重性和矛盾性,菊花是日本皇室的象征,象征着高贵和优雅;刀是武士道文化的象征,代表暴力。在文化发展的过程中,人们经常用菊花和刀来指代同一事物上两种相反的现象。这种情况在世界范围内普遍存在,人工智能产业和为其服务的数据产业正体现出高科技和高密度劳动力的双重特征。

数据服务:AI领域的“菊与刀”

从1956年人工智能学科正式提出,到2016年3月,谷歌AlphaGo以4: 1击败围棋世界冠军李世石,开启了人工智能的新时代。经过60多年的酝酿,人工智能行业终于利用这一趋势,达到了目前的爆发期,并成为一个广泛的交叉和尖端科学。2017年,仅中国在人工智能方面的投资就超过580亿元人民币,同比增长50%。据估计,到2020年,中国人工智能核心产业规模将超过1600亿元,复合年增长率为43.6%。

数据服务:AI领域的“菊与刀”

与强劲的发展势头和旺盛的行业需求相对应,存在巨大的数据缺口。一些行业专家认为,人工智能目前的发展状况仅相当于20世纪90年代初的互联网,主要的方法论仍然是基于大数据和大计算模式,这需要大量的数据来支撑。也就是说,人工智能不像人类那样推断结论,它需要不断的实验和错误的学习,这需要大量的数据来教授和训练。人工智能应用的数据越多,得到的结果就越准确。毫无疑问,没有大数据就没有人工智能。

数据服务:AI领域的“菊与刀”

李开复可以被视为中国人工智能产业的领航者。在与搜狗首席技术官杨洪涛和今天的头套技术战略研究所所长张宏江的谈话中,他曾经说过,最好的数据就是最多的数据。他曾在富士康峰会实体经济与数字经济融合发展论坛上说:今天,我听到专家们谈到大数据对人工智能的重要性,大数据将使中国成为一个人工智能大国。什么算法或专家都没关系。只要数据很大,它最终会赢。因为人工智能现在已经足够受欢迎了,所以没有必要把世界上的三巨头看做人工智能顾问。现在人工智能接近平台化。过去,专家是国王。现在,数据为王。

数据服务:AI领域的“菊与刀”

与人工智能算法、程序和高技术要求、高素质人才的产品相比,数据服务业呈现出另一种景象。据业内人士估计,中国全职数据标注员的数量已经达到10万,而兼职人员的数量接近100万。标记工作本身是一项低收入的劳动密集型工作,这与它所服务的人工智能行业形成了鲜明的对比。一方面,它是酷技术和神奇的智能应用;一方面,每天都有大量的人反复产生机器学习的食品标签数据。人工智能产业和为其服务的数据产业是菊花和刀的复制品,它们在矛盾中成长和变化。

数据服务:AI领域的“菊与刀”

龙猫科技、数据大厅、星尘数据& hellip& hellip除了当前数据收集和标签行业的专业玩家之外,还有百度公开测试、京东中智、阿里众包、科达讯飞和迪法恩科技等巨头。除了满足他们自己开发的数据需求,他们还从外部输出数据。据不完全统计,提供数据服务的公司或大型团队有100多家,如科技、穆明大厦、艾数码智慧、海天、灵思、功能科技、标准湾科技等。

数据服务:AI领域的“菊与刀”

贵阳蒙东科技拥有一个500人的数据车间;Basicfinder与20多个数据工厂有长期的业务合作,从几十个到两三百个不等。除了标准机构外,还有三至五人至十几人的小作坊。大公司专注于R&D或保持高学历团队的比例,很少建立自己的数据标注团队,这也为数据外包提供了丰富的土壤。

数据服务:AI领域的“菊与刀”

以人工智能数据收集为标志的外包市场始于2011年,真正开始于2015年,在2016年下半年收缩,并在2017年开始新的爆发。外包之所以流行,是因为人工智能的发展需要大量的人力来为机器学习提供不同的基础数据和处理非结构化数据。许多公司采用互联网思维,使用网站和应用程序收集大量数据。然而,面对巨大的数据需求、较短的任务持续时间和激烈的行业竞争,很难保证在短时间内完成任务。因此,收集标签的外包团队应运而生,并在短短两年多的时间里迅速成长。

数据服务:AI领域的“菊与刀”

外包行业的迅速扩张从侧面反映了人工智能行业的繁荣,也反映了数据采集和标签从业人员的低门槛和低技术素质要求。除了专业技术公司提供的平台、技术支持和质量控制外,大部分工作由普通工人提供,他们提供基础数据并重复大量劳动。

数据服务:AI领域的“菊与刀”

目前,人工智能公司总支出的20%-30%用于数据。根据这一比例,内地市场的数据采集和注释规模保守估计为50亿元,2016年新三板上市公司数据大厅的收入将达到9680万元。目前,可以建模和量化的数据只占现实世界的很小一部分。随着人工智能渗透到更多的垂直行业,新的需求不断出现,不仅需要更多的数据,还需要一个质量更高、速度更快的收集和标记团队来完成这些需求。可以说,随着人工智能行业本身的发展,对从业人员的数据采集和标注工作的要求只会越来越高。

标题:数据服务:AI领域的“菊与刀”

地址:http://www.ictaa.cn/hlwxw/6542.html