历史上的今天
返回首页

历史上的今天

今天是:2025年04月24日(星期四)

正在发生

2019年04月24日 | 大数据仍是大企业的游戏,机器学习并没有捷径可走

2019-04-24 来源:eefocus

O'Reilly最新的调查数据显示,大数据仍然只是1%,或者15%的企业游戏。大多数的企业(85%)依然没有破解AI和机器学习的密码。仅仅只有15%的“见多识广”的企业在生产过程中运行一些数据模型超过了5年。更重要的是,这些企业更倾向于在一些重要的领域花费时间和精力,比如模型偏差和数据隐私。相对而言,那些还属于初学者之列的企业仍然还在努力尝试着寻找启动按钮。

 

不幸的是,对于那些希望通过自动快捷方式比如Google的AutoML或者通过聘请咨询公司缩小数据科学差距的企业,我们给出的答案是:实现数据科学的确需要花费时间,而且没有捷径可循。

 

聪明的企业专注于深层次数据

首先,值得注意的是,O'Reilly的调查数据来自于其自选的一群人:那些曾经参加过O'Reilly活动的,或者参加过该公司在线研讨会或通过其他途径与之有接触的人。这些人群对于数据科学都有前瞻性的兴趣,即使(按照调查数据的显示)他们中的大部分人并没有从事太多的相关工作。对于那些沉浸在大数据体验中的人来说,最好的客户群体就是那些被称为“见多识广”的企业,它们在生产过程中使用的数据模型已经运行了5年以上。

 

从调查上可以发现一个有趣的现象,那就是这些企业是怎样称呼他们自己的数据专家的。具有丰富数据经验的企业称之为数据科学家。而那些思维尚停留在上世纪90年代“数据挖掘”模式的企业则更倾向于称其为“数据分析师”。如下图所示。

 

机器学习根本没有捷径

 

调查发现,无论企业选择如何称呼他们的数据专家,企业在AI和机器学习方面的经验越丰富,他们就越有可能依靠内部数据科学团队建立模型,如下图所示。

 

机器学习根本没有捷径

 

几乎没人关注云机器学习服务(至少现在还没有)。那些只有2年以下生产经验的企业倾向于依赖外部的顾问来搭建机器学习模型。对于这样的企业而言,这种感觉就像一种不用投入人力而享受数据科学收益的机会,但这是一个非常愚蠢的方法。

 

企业的数据越复杂,其数据科学团队就越能建立模型,并评估项目成功的关键指标。纵观所有的企业,产品经理对于项目成功的作用是36%,管理团队的数据是29%,数据科学团队的贡献是21%。

 

对于那些经验丰富的企业来说,产品经理的作用依然占到34%,数据科学团队27%,几乎与管理团队(28%)相同。

 

对那些缺乏经验的企业而言,管理团队占到31%,数据科学团队占比较少(16%)。这不是个问题,事实是这些数据科学团队最适合计算出如何使用数据并衡量其成功。

 

太多时候,是外行指导外行

这种依赖管理层来推动数据科学的想法引起了人们的注意。调查显示,不少高管自称是数据驱动的,但却无视了数据其实并不支持那些靠直觉驱使的决策(62%的人承认这么做)。

 

那些缺乏大数据悟性的企业似乎愿意口头提供数据,但他们根本不明白有效数据科学的细微差别。他们缺乏必备的经验来确保可以获得有意义的、无偏见的数据洞察力。

 

关于如何理解机器学习模型,以及如何相信该模型所导致的结果,更多有成熟经验的企业显然掌握了Gartner博客网络中的一位博主Andrew White的评估方法:

 

AI的创新之处就在于AI可以重新定义新的基线,换句话说就是那些我们认为太过复杂的东西和非常规的东西,目前都可以利用AI来实现。和之前的技术相比,AI应该可以处理更加复杂而且具有认知能力的工作。

 

这个新的现实只有在AI自动处理的结果是合理的时候才有意义。如果这个新奇的工具所得出的决策和结果让人类无法理解,那人们就会放弃这个工具。因此在某种程度上,能否理解AI所做出的决策也非常重要。

 

然而,理解决策和理解算法如何工作是两回事。人是可以掌握输入、选择、权重以及结果的原理的,而即便算法能够在一定程度上将所有这些结合到一起,但我们依然无法证明这一进程。如果结果和输入之间的差距太大,那么人对算法的信任就很有可能会丧失——这是人的天性。

 

想要达到这种理解水平是无法通过花钱雇佣咨询顾问能实现的。云端也不是现成的。运用工具比如Google的AutoML可以“使得那些具有有限机器学习专长经验的开发者能训练针对其业务需求的高质量模型。”这听起来非常好,但是想要从数据科学中受益需要有数据科学的经验。这不仅仅是调整模型的问题,更需要知道如何实现,这需要大量的试错经验。

 

另外,从事数据科学需要有人文的心态,再次强调,需要经验。没有捷径可循。实际上,这意味着那些早期投资于数据科学的企业应该发现自己领先于那些没有竞争优势的同行——这种差异很可能会持续下去。

 

对于那些希望迎头赶上的企业,Gartner分析师Svetlana Sicular最为经典的忠告仍然在耳边回响:“企业应该在内部多看看。其实内部已经有人比那些神秘的数据科学家更了解自己的数据。”只要企业明白要在企业完成好的数据科学需要花费时间,并且给予其人员学习和成长的空间,他们就不再需要寻找捷径。


推荐阅读

史海拾趣

Avery Dennison公司的发展小趣事

Avery Dennison在追求商业成功的同时,也积极履行社会责任,致力于可持续发展。公司注重环保和节能,通过采用环保材料和工艺、推广循环经济等方式,降低生产过程中的环境影响。此外,Avery Dennison还积极参与社会公益事业,支持教育、扶贫等项目,为社会和谐与发展贡献力量。

这些故事展示了Avery Dennison在电子行业中的发展历程和成就,体现了公司不断创新、追求卓越的精神。未来,随着科技的不断进步和市场需求的不断变化,Avery Dennison将继续保持创新活力,为客户和社会创造更多价值。

Advanced Milliwave Laboratories Inc公司的发展小趣事

Advanced Milliwave Laboratories Inc(AML)成立于XXXX年,最初由几位在微波技术领域具有丰富经验的专家组成。初创期,AML专注于高频微波技术的研发,通过不断的实验和创新,成功开发出多款具有高性能和稳定性的微波产品。这些产品迅速获得了市场的认可,为AML在微波技术领域奠定了坚实的基础。

Dymec公司的发展小趣事

随着业务的不断拓展,Dymec公司逐渐意识到品质对于品牌的重要性。公司决定加大对产品质量的投入,从原材料采购到生产流程,再到质量检测,每一个环节都严格把控。这种对品质的执着追求使得Dymec公司的产品在市场上获得了良好的口碑,公司也逐渐成为了电子连接器行业的知名品牌。

永丰盈(CST)公司的发展小趣事

作为一家有社会责任感的企业,CST始终关注环境保护和社会公益事业。公司严格执行环保法规,积极推广绿色生产理念,努力减少生产过程中的污染排放。此外,CST还积极参与社会公益活动,为当地的教育、文化等事业做出了积极贡献。这些举措进一步提升了CST的企业形象和社会声誉。

动运科技(DONGWOON)公司的发展小趣事

经过多年的发展,动运科技已经成长为一家在电子行业中具有重要影响力的企业。面对未来,公司将继续坚持技术创新和市场拓展的战略方针,不断推出更加优质的产品和服务。同时,动运科技也将积极应对行业变革和市场挑战,加强与全球合作伙伴的沟通和合作,共同推动电子行业的持续发展和进步。展望未来,动运科技将继续以开放的心态和创新的精神,迎接更加美好的未来。

请注意,以上故事是基于现有信息进行的概括性描述,并非具体的历史事件或详细数据。如需更详细的信息,建议查阅相关新闻报道或公司官方资料。

Analog公司的发展小趣事

随着技术的不断成熟和市场的逐步扩大,动运科技开始将目光投向国际市场。公司先后在深圳、上海、美国、日本和台湾等地设立了研发或分公司与办事处,形成了全球化的研发和销售网络。通过与全球知名企业的合作,动运科技的产品逐渐进入了智能手机、LED照明、物联网等多个领域,并取得了显著的业绩。

问答坊 | AI 解惑

ATE0V1&C1&D2是干什么用的?

嘿 各位: ATE0V1&C1&D2这个指令是干什么用的,我发现CE的注册表里面有这个东西,有哪位兄弟能否详细解释下吗?非常感谢!…

查看全部问答>

谁来帮我解决这个有点怪的摄像头啊????

从开机到同第一个人视频完都没问题,再开视频就提示说没找硬件,换个接口还是一样.重启计算机还是情况如上述一样的.这是什么原因啊???…

查看全部问答>

IBM小型机ATX公开课

6月5日 IBM小型机AIX公开课地址链接: http://uplooking.diyihui.com/tc?join=85002536         嵌入式开发技术交流群  ++112738964   …

查看全部问答>

PHYSICAL_ADDRESS中各项是什么意思?

PVOID MmMapIoSpace (     IN PHYSICAL_ADDRESS PhysicalAddress,     IN ULONG NumberOfBytes,     IN BOOLEAN CacheEnable     ) { PVOID pVirtualAddress; ULONGLONG SourcePhys; ULONG Source ...…

查看全部问答>

MOS管发烫怎么解决?

目前设计的Server电源中,用到两组MOS管给CPU供电,在持续工作条件下非常的烫手,尽管目前工作性能还比较正常,但对整体功效肯定有影响,而且我担心长期影响系统的可靠性。由于板面限制,没法多并联几个MOS,如何解决这个问题各位大侠有什么高招啊 ...…

查看全部问答>

驱动程序中的platform总线详解

驱动程序中的platform总线详解 本文摘自:http://www.xcembed.com/bbs/viewthread.php?tid=11&extra=page%3D1 在设备驱动程序中经常会见到和platform相关的字段,分布在驱动程序的多个角落,这也是2.6内核中比较重要的一种机制,把它的原理弄懂 ...…

查看全部问答>

不知道有多少人是用C而不是汇编来写程序的呢?

每次学一种新的单片机时··都感觉非常纠结啊··因为好多书上都是先教你它们的寄存器啊CPU啊是怎么工作的··我最怕就是这些了·· 我自己一直都是用C来写的··对于汇编其实还算是了解··不过我就是很烦看到这些啊·· 不知道大家有没有我这种 ...…

查看全部问答>

[兼]标准NAND FLASH控制器

NAND FLASH Controller IP Core 标准NAND FLASH Controller 标准NAND FLASH控制器 我是一位在职者(北京),专业从事FPGA接口设计,有较多的空余时间,对FPGA有比较丰富的项目经验(6年)。 熟练使用Xilinx/Altera FPGA,熟悉NAND FLASH接口 ...…

查看全部问答>

ZigBee无线模块传输时间讨论

各位好     我们现在手头有个项目,传输距离10m,需要发送64B数据,经过zigbee无线模块,要求10ms传输完毕,其次,2包间隔发送20ms,要求丢包率小于1%     请问用什么模块比较好呢?或者什么公司的产品比较好?   &nbs ...…

查看全部问答>