历史上的今天
返回首页

历史上的今天

今天是:2024年10月24日(星期四)

正在发生

2019年10月24日 | 数据标注呈现爆发式增长,改产业是否会成下一个富士康?

2019-10-24 来源:21ic

人工智能发展带动了数据标注行业的兴起,尤其在自动驾驶领域,其广泛使用的AI深度学习算法,需要大量训练样本进行不断的算法优化,这些训练样本就是被标注过的原始数据。随着大型科技公司、银行和其他机构尝试利用人工智能来改善其产品和服务,中国对数据标注的需求正在呈现爆发式的增长。


放下农耕工具投入AI建设

“我很高兴我所从事的行业正在迅速成为中国的一个繁荣产业。”95后大学生小谭对第一财经记者表示,小谭刚毕业一年,于今年年初加入了一家海外数据标注公司,该公司今年刚宣布进入中国市场。


数据标注行业已经开始为中国一些偏远城市和农村的劳动力创造新的就业机会,他们放下农耕工具,开始投入AI发展的浪潮中。



小谭告诉记者,她的一些同事是从偏远的农村地区专门来到无锡上班的。“我们会在网上公布一些招聘信息,从其他地方赶来面试的人还是很多的。”她说,“能够接触更多的信息和技术对我们的改变还是很大的。”


现在,她和同事每天都和海量的数据打交道,具体工作包括规则的理解、员工的培训和数据的质检等等。“AI成形乃至更完善都是经过我们的操作才能够变得更智能。”


据小谭所说,普通标注员每天要处理600~700条信息,给不同的图像和语音文字进行标注。同时标注员的工作最终要质检人员进行工作审核,以达到最终客户方的要求。标注员和质检员的结构比例是1:3,也就是一个质检员需要检查3个标注员的工作。


他们所在的这家名为Appen(澳鹏)的澳大利亚数据标注企业已经在上海开设了分公司,公司还在近期启动无锡的运营中心。

澳鹏(Appen)CEO Mark Brayan告诉第一财经记者:“我们看中的是中国巨大的人工智能市场和企业对数据的需求,并且将为中国创造技术型人才的就业机会。”

澳鹏的标注对象包括语音、文字、图像和视频等领域,并将标注好的数据统一卖给分布在全球的技术、汽车和电子商务等类型的大型企业。


“无锡在人员、房价等方面有成本洼地,而且地处中国东部,能覆盖江浙沪区域,早期能与上海总部形成快速的互动,加上无锡的产业结构优势也相当明显,比如制造业和传统IT等。”澳鹏全球高级副总裁、中国总经理田小鹏告诉第一财经记者。


明年年底,无锡中心将扩张至2000人的规模,当然其中相当一部分是众包人员。此外,澳鹏还规划在中国的西南、东北等地建立第二和第三分中心,加大中国的布局力度。


创造大量零工就业岗位

数据标注公司之所以在近两年来兴起,与中国人工智能发展初期所需要的大量的数据密不可分。随着百度和阿里巴巴等中国科技巨头对人工智能的落地应用需求进一步增加,标注自动驾驶汽车拍摄素材的工作也成为数据标注公司很重要的内容之一。

数据标注人员的具体工作是,在屏幕上的每个物体周围插入一个个数码方框,并在下拉菜单上对其标注——车辆、人员、障碍物、动物。如果他们选择“车辆”,则会出现有更多选项的另一个下拉菜单——小型车、摩托车、卡车和火车等。


由于科技公司所需要的数据量巨大,数据标注公司会把很大一部分标注工作分包出去,这就创造了大量的就业。以澳鹏为例,公司全职员工仅600人,但是全球范围雇用的劳动力总人数达到了100万。“我们每个月要向50000名众包员工发放工资,创造了很多的零工就业机会。”Brayan告诉第一财经记者。


既推动了AI发展,又促进了就业,数据标注被套上了新时代“富士康”的光环。比如在距离贵阳市中心50公里的百鸟河数字小镇,就有一个规模500人的“数据工场”,500名标注员中,近一半是附近一家扶贫高职的学生。据了解,他们一个月能挣到1500元,经济上足以自立,还能补贴家用,相比餐厅辛苦端盘子或者送外卖这类兼职工作,数据标注相对轻松且体面。


小到用数据爬虫抓取互联网现存数据,并进行拉框,大到根据用户定制化的硬件以及场景需求,去完成数据的采集与多维度数据标注。数据标注行业,如今正朝着专业化、细分化、场景化的方向不断演进。而在这一过程中,一批诸如百度数据众包、云测数据等企业和团队也应运而生。


未来靠人还是靠机器

海外的数据标注市场正在趋向成熟,类似澳鹏这样的企业开始收购中小微数据平台,将自己的议价能力提高到新的水平。


今年3月,澳鹏以高达3亿美元的价格收购了另一家数据标注公司Figure Eight。Brayan认为,其技术可以和Figuer Eight互补。不过也有很多业内人士对此表示出了质疑,认为此举是将该领域带向“垄断”的局面。


与此同时,中国团队已经开发出一套人工智能的数据标注系统。该软件可将标注的人工工作总量降低,为ADAS及自动驾驶系统开发提供高质量、低成本的数据支撑。


据介绍,为了加快ADAS、智能网联、自动驾驶等相关技术发展进程,清华大学苏州汽车研究院经过近两年的技术研发与数据验证,于2019年9月成功推出了国内首个基于大数据自动标注软件的服务平台,并已与上汽、一汽、陕汽重卡等企业达成合作。


基于深度学习、集成学习、传感器融合等技术,该自动标注软件可根据客户需要提供图片、视频等多种形式的数据采集和标注服务。软件还集成方便易用的手工修改和标注工具,进一步提高工作效率。


与其配套的标注管理服务平台可以在线进行任务分发、管理、验收、修改、存档等全工作流程管理,标注人员端和管理人员端可以实现数据库共享与更好的分工协作。


不过,这个行业短时间内仍将属于劳动密集型行业。“我们认为数据标注的很多工作还是要依靠人类标注员,因为机器的能力目前可能还达不到所需的精度。我们也注意到机器在数据标注方面的发展潜力,但至少在今天这并不会对我们的业务造成影响。”Brayan说。

目前,许多数据标注公司仍然主要集中在北京和上海等大城市,但技术含量较低的标注业务正在将部分新技术资金分流到较小的城镇,为当地提供农业和制造业之外的就业机会。


推荐阅读

史海拾趣

Arctic Silicon Devices公司的发展小趣事

在电子行业的发展过程中,创新合作是推动产业进步的重要动力。Arctic Silicon Devices积极与高校、科研机构等合作,共同开展技术研发和人才培养。通过共享资源、互通有无,公司不仅获得了更多的创新灵感和技术支持,还推动了整个电子行业的技术进步和产业升级。

富信半导体(FOSAN)公司的发展小趣事

在电子行业的早期阶段,Arctic Silicon Devices以其卓越的技术研发能力脱颖而出。公司成功研发出一款低功耗、高性能的芯片,满足了市场对移动设备日益增长的需求。这一技术突破让Arctic Silicon Devices在业内赢得了良好的声誉,并吸引了大量合作伙伴和投资者。随着公司业务的不断拓展,Arctic Silicon Devices逐渐成为了行业内的佼佼者。

EiKO Global LLC公司的发展小趣事

EiKO Global LLC,简称EiKO,成立于XXXX年,由一群热衷于照明科技的先驱者共同创立。公司初期专注于照明产品的研发与生产,致力于为全球用户提供高质量的照明解决方案。EiKO凭借对市场的敏锐洞察力和技术创新,迅速在北美市场崭露头角。

在创立初期,EiKO便确立了以“质量第一、客户至上”为经营理念的方针。通过引进先进的生产设备和技术,严格把控产品质量,EiKO的照明产品逐渐赢得了消费者的信赖。同时,EiKO还积极拓展市场,与多家知名企业和零售商建立了合作关系,产品销售网络遍布全球。

Brainboxes公司的发展小趣事

Brainboxes公司成立于1984年,总部位于英国利物浦市。创立之初,公司专注于数据和I/O连接产品的设计和制造。凭借对串行通信技术的深刻理解,Brainboxes迅速在行业内崭露头角。其早期产品,如串口服务器和适配器,因高度可配置和可靠的特性而受到市场的欢迎。随着业务的发展,公司逐渐扩大产品线,涵盖IO模块等多个领域。

Electro Adapter Inc公司的发展小趣事

随着公司产品的日益成熟,EA公司开始寻求更广阔的市场空间。公司不仅在国内市场加大推广力度,还积极开拓国际市场。在海外市场,EA公司面临着文化差异、法规差异等挑战,但公司通过深入的市场调研和精准的市场定位,成功地将产品推向了欧洲、北美等发达国家和地区。同时,EA公司还加强了品牌宣传,通过参加国际展会、赞助行业活动等方式,提高了品牌知名度和影响力。

DILABS公司的发展小趣事

DILABS公司成立于XX世纪初,由一群热衷于电子技术的工程师创立。在公司初创时期,他们面临了资金短缺、技术瓶颈和市场竞争等多重挑战。然而,他们坚持创新,经过无数次实验,终于在芯片封装技术上取得了突破。这一突破性的技术为DILABS赢得了业界的关注,也为公司的发展奠定了坚实的基础。

问答坊 | AI 解惑

关于视频系统处理器选择的建议

关于视频系统处理器选择的建议基于ARM核心的Freescale的i.MX系列芯片是视频应用的佼佼者。 比如i.MX27和i.MX31 i.MX27嵌入式开发板是高清视频输入输出的首选,i.mx27芯片提供了更高的灵活性和更强大的多媒体处理能力,成为IP视频和语音(V2IP)、移 ...…

查看全部问答>

关于7行5列LED键盘指示灯的编程,请高手解惑!十万火急!万分感谢!

7行5列的LED键盘指示灯,键按下时相应的LED指示灯也会亮! 灯亮的原则:列为高电平,行为低电平。 我想问的是,如果我知道了第0行第0列的键按下了,想要第0行第0列的灯亮,那么是不是应该让列所在的存储器第0位置1,其余列置0!即将0x01输入到相 ...…

查看全部问答>

自制超级流水灯演示板

单片机的用途非常广阔,各种智能控制的产品中都少不了它的身影,前景看好,因此引起了一阵阵学习单片机的热潮。   相信很多初学单片机的朋友都是从做流水灯开始的,因为流水灯的电路较为简单。看着按照自己的设想做成的流水灯变幻着不同的花样, ...…

查看全部问答>

ARM板上如何增加显卡芯片

如题, 望版主推荐 一直以来,因ARM开发板每次换屏的时候都要重新生成NK,有没人做过在板子上驱动一个显卡IC来驱动LCD? 如果有,IC型号大家了解的有哪些? 如果增加了这个显卡IC,那么原来的Display驱动还要不要? 大家一起讨论讨论,突然想 ...…

查看全部问答>

谁能详细讲讲 uboot smdk2410.h 里面配置信息的含义?

谢谢! 我是初学者,不明白里面都在配置些什么,不明白哪些是最重要的。…

查看全部问答>

关于vs2005开发windows ce 5程序部署到机器的问题

1:首先非常感谢您的帮助,同时我找遍了google和baidu,没有找到,或许是关键字搜索的不好。所以来此提问。 2:问题描述如下    机器是广州市微嵌计算机科技的Arm9 的硬件系统,采用的是windows ce 5.0。该设备有一个特点是会将hwDir目 ...…

查看全部问答>

如何使程序某个功能运行时不响应其它操作

小弟要实现如下功能: 当我点击打印操作时,程序弹出一个对话框,显示正在打印,在打印的过程中,必须使程序无法响应用户的其它任何操作。当打印结束时,显示打印成功或打印失败,然后才让程序可以继续响应用户其它操作。 请问这个如何解决哈? …

查看全部问答>

讨论: 用fread, fwrite存取结构数据安全吗?

同样的软件,平时都用的好好的,但有半天fread出来的数据都不对。于是才产生这个疑问.…

查看全部问答>

压力传感器在汽车空调系统中是如何应用的?

在汽车空调系统中,压力传感器都应用在那部分,又是给那里提供数据,这些数据的作用。请各位大侠指点指点。谢谢!…

查看全部问答>