历史上的今天
返回首页

历史上的今天

今天是:2025年01月07日(星期二)

正在发生

2019年01月07日 | 从“傻白甜”到“杠精” AI有了认知智能萌芽

2019-01-07 来源:中国科技网

每个人身体里都有一个“杠精”:“这可不一定”“我可不这么认为”“那可说不准”……这些“杠”词要么在心里默念、要么在口中碎碎念、要么大声讲出来,无论是否表达,“杠”的意识出现均是人类独立思维的表现,所基于的正是人类的综合分析能力。

如今,人工智能(AI)也开始“杠”得有条理、有逻辑、有思路起来。日前,在百分点举办的无界智能发布会现场,IBM大中华区全球信息科技服务部总经理谢少毅介绍了人工智能做辩论的项目,“杠精”们大爱的口头禅出现在了IBM的人工智能系统 “Project Debater”口中,这背后是机器学习、自然语言处理、海量数据搜索处理、识别情绪等大量人工智能技术的应用。

越来越多的人工智能研究者发明新的技术让AI向人类“偷师”,一定程度上习得触类旁通、独立思考的能力。从“傻白甜”到“杠精”,AI向真实的“人”又贴近了一步,从“感知智能”慢慢走向“认知智能”,哪些技术是AI不可或缺的?还有哪些仍待攻坚呢?

从理解语义到“读心术”,认知智能初现

“你告诉一个AI自己有减肥计划,AI如果每天建议你吃沙拉,你就会说它不好,不符合心意;如果它天天让你吃蛋糕,你也会说它不好,不符合减肥需求。”上海纽约大学商学部主任陈宇新教授举了个连真正的人类都难以把握的两难抉择,充分说明理解语义并不一定能够真正把握要义。

“虽然主人说这是我想要的,但AI做了之后,主人仍会说这不是他想要的……”拥有“认知智能”的未来AI将充分理解这句堪比绕口令的实质,陈宇新认为,当数据足够多、算法足够强大、模型足够优秀之后,AI将从理解语义到拥有“读心术”,分析推测出人类当时可能都不确定的真正想法,在人心里矛盾时给出“挠到痒处”的答案。

将这个“减肥吃什么”的难题放大来看,就是对正反的“两难”进行一系列诸如身体指征、爱好、时间等多维度的数据综合分析后,用到大量的人类学、心理学、社会学的内容和方法,通过一系列探索性地问答获得数据,给出结果。

这种探索性的分析将使AI得到进化,并拥有更广阔的“职业”选择。据介绍,美国有公司做出了第一个人工智能律师ROSS,美国一个律师以往用上百上千个小时做一个案例的分析和调查,现在用了ROSS和人一起合作,时间减少到28分钟,ROSS,可以提供正反双方的意见让律师做决策。

“正反意见的博弈还可以帮高层做决策,可以通过一个机器人提供正反两面意见的辩论,帮助高层综合分析做更好的决策。”谢少毅认为,这方面的研究才刚刚开始。进化的AI将被用在更多需要做信息分析或做决策的领域,例如高级销售、经济分析师、企业高级管理人员等。

数据动态融合,AI走进认知智能的“基石”

从海量数据中“摘出”与当前任务关联的数据,是AI拥有综合分析能力的第一步。百分点董事长兼CEO苏萌表示,AI走进认知智能首先建立在数据融合的基础上。

以辩论项目为例,沃森化身的这位“女性”辩手,和另一位人类辩手就“是否应该把体育博彩合法化”的议题展开辩论时,能在听懂人类长达4分钟的快速陈述(700—900个单词)后,进行迅速反应,搜集资料、选取角度,给出旁征博引的辩驳;在短兵相接的短辩交锋中也能很快理解对方的观点、组织语句并做出有针对性的论述。

苏萌表示,数据目前来看仍然是人工智能的基石。不久前,德国商业软件巨头SAP以80亿美元收购全球最大在线调查公司Qualtrics,说明了数据融合的重要性。2017年,百分点也并购了中国最大的在线调研服务商极速洞察,使得百分点同时拥有高达380万的中国最大用户样本库,将双方的行为数据和态度数据进行融合。

数据融合包括拥有海量数据和实现高效融合两方面。

苏萌表示,数据融合指的是打破业务系统的烟囱融合海量的多元异构的数据,它既是一次企业内外部数据的融合,也是大小数据的融合,同时也是历史数据和实时数据的融合,只有数据融合了之后,才能洞见真相避免偏见,才能明智决策避免武断。

“知识图谱是我们让机器去了解、认识人类世界的核心,它把我们的知识构建成网状的知识结构,再通过人机交互直接输出。”苏萌进一步解释,数据融合意味着知识需要不断更新,但在更新一个知识点的时候往往需要更新整个知识系统,操作非常繁琐。

“出版行业或者媒体,甚至公安行业,所涉及的知识都需要实时动态理解,某一个知识不是固定不变的,所以知识图谱未来的发展方向是动态知识图谱。” 苏萌解释,这个世界由很多的东西构成,比如人、事、地,这些可以理解为本体,本体发生变化或者本体间的关系发生变化后,动态知识图谱能够迅速自动重构,高效地实现对一个行业的知识图谱的构建。

攻坚在路上,来自小数据的挑战

新的领域、没有海量样本、训练速度不够,是不是每遇到一个特殊场景,都要重新建模,输入大量的样本让机器重新学习一次呢?条件并不允许。

“很多客户的实际应用场景是数据量不够甚至是比较少的,在这种情况下我们结合迁移学习技术,解决了小样本的模型训练问题,标注量只有以往的10%。”百分点首席算法科学家苏海波说。

从小数据中获得学习能力,也是人工智能走向认知智能的一个重要部分。人工智能专家经常用猫举例:小孩子认得猫只要指给他看一两次就够了,AI却需要成百上千张图片,才能掌握猫的特征。

为此,人工智能科学家尝试结合迁移学习开发一系列算法,节约人工标注样本的时间,让模型在少量的标注数据上,也能取得好的效果,可以理解为赋予AI“举一反三”的能力。“例如像电商评论情感分类这样一个任务,用传统的深度学习模型需要数万条数据才能达到85%左右的效果,但是如果采用深度迁移学习技术,数百条数据就能达到同样的效果。”苏海波说,我们判断认知智能未来会迎来黄金十年的发展,为此百分点成立了认知智能实验室。除了深度迁移学习技术,实验室还会重点研发多语种自然语言处理技术,帮助认知智能实现跨种族、国际化。

“未来我们会与各大高校和研究机构开展合作,建立联合实验室,共同探索更多前沿的认知智能技术,包括各个重点行业的知识图谱构建、自动问答等等。基于这些技术,实验室会研发出更多行业落地的应用产品,为客户创造价值,用认知智能推动社会进步。”苏海波说。

推荐阅读

史海拾趣

爱特姆(ATOM)公司的发展小趣事

爱特姆科技自在美国德克萨斯州休斯顿市成立以来,便致力于电子行业的创新与发展。1998年,公司成功创立了“ATOM”品牌,标志着其正式踏入了品牌化发展的道路。起初,爱特姆以台湾、深圳、昆山为主要研发生产基地,凭借对技术的不断追求和对市场的敏锐洞察,逐渐在连接器领域取得了突破。

睿赫(crechip)公司的发展小趣事

尽管睿赫公司在电子行业中取得了显著的成就,但公司也面临着诸多挑战。随着技术的不断进步和市场的不断变化,公司需要不断创新和进步,才能保持领先地位。

面对未来,睿赫公司将继续秉承“创新、卓越、诚信、共赢”的企业精神,不断加强技术研发和人才培养,推动公司的持续发展和壮大。同时,公司还将积极关注市场动态和客户需求,不断推出符合市场需求的新产品,为客户提供更加优质的服务和解决方案。

BRIGHT公司的发展小趣事

BRIGHT公司的历史可以追溯到1985年,由一群热爱音乐的年轻人和电子工程师共同创立。在1987年,他们成功推出了全球第一支无线耳机,这一创新产品迅速在市场上获得了巨大的成功。这一成就的背后,是创始人在一次偶然中被家里的电线绊倒后产生的灵感。他意识到,将有线耳机转变为无线耳机将带来巨大的便利和舒适体验。这一创新不仅改变了耳机行业的格局,也为BRIGHT公司奠定了坚实的基础。

Advanced Technology Corp公司的发展小趣事

为了进一步提升市场份额和品牌影响力,ATC公司积极开展市场拓展活动。公司加强与国际市场的联系,与多家知名企业建立了战略合作关系,共同开拓新的市场领域。同时,ATC公司还注重品牌塑造,通过参加行业展会、举办技术研讨会等方式,提升品牌知名度和美誉度。这些努力使得ATC公司在全球电子市场中占据了一席之地。

艾迪沃德公司的发展小趣事
定期清理电源电路周围的灰尘和杂物,保持通风良好。
Dalian Dlicap Corporation公司的发展小趣事

随着技术实力的不断增强,达利凯普开始积极拓展国际市场。公司的产品广泛应用于医疗核磁共振设备、半导体设备、工业激光设备、测量及分析设备、高速铁路、5G通信等高端制造领域。凭借卓越的产品质量和可靠的性能,达利凯普成功进入了美国、日本、英国、法国、德国等40多个国家和地区的市场,并与西门子医疗、通用电气、安捷伦等世界知名企业建立了长期稳定的合作关系。

问答坊 | AI 解惑

VDSP汇编出来的代码效率很低?

各位大牛觉得VDSP汇编出来的代码效率怎么样啊? 怎么我觉得C语言汇编出来的代码效率很低,尽管使能了编译器优化,但像并行指令很少体现啊,甚至连循环零开销也做不到(并没有超过两层循环),莫非必须要自己写汇编? 听说CCS的C代码汇编效率能达到90%?…

查看全部问答>

变压器组别的测量问题

比如一个变压器组别联结情况是Yd11,现在只知道一次绕组和二次绕组的接线方式是星形和三角形,即只知道Yd,如何测出二次电压领先一次电压30度?即那个11点。 …

查看全部问答>

红外的载波频率

进行红外通信,传输速率要达到1Mb/s,想把红外发射接收的载波频率提到20MHZ,不知有没有人成功过,可行不?我用的是avr单片机进行专门控制,处理速度应该跟得上。另外,最好能提供发射接收的电路,尤其是接收放大滤波解调电路,谢谢…

查看全部问答>

驱动调试助手的使用问题

我使用驱动调试助手加载注册表是成功的,单激活驱动时出现ERROR ID:2,不知道是怎么回事,生成的DLL是直接把驱动文件放到DRIVER目录下编译的,没有改DIR,但当我把驱动改成启动时自动加载时用助手又不会出现错误,我想问下用助手调试自动加载驱动 ...…

查看全部问答>

VS2005如何通过USB和ActiveSync下载程序到开发板上直接运行和调试,不用模拟器?

VS2005如何通过USB和ActiveSync下载程序到开发板上直接运行和调试,不用模拟器?就象以前用的eVC一样,直接下载到开发板上调试? …

查看全部问答>

个人笔记《深入浅出STM8》

第二章 开发工具.rar (110.62 KB) 一点使用心得,希望对新手入门有所帮助,陆续还有新的章节 下载次数: 100 2009-12-29 20:49 第二章 开发工具.rar (110.62 KB) 下载次数:50 2009-12-29 20:49 ...…

查看全部问答>

PB安装问题

恳请高人指点:我安装PB时候没有选择shared source选择项,所以导致windowsce目录下没有private文件夹,我现在还没遇到麻烦,我想问一下如果我不重新安装PB,有没有办法解决问题,或者没有这个文件夹,做什么系统或者操作时会出现问题。…

查看全部问答>

(转帖)linux内核大讲堂-驱动基础架构

Linux内核大讲堂系列 序论 来源:Linux社区  作者:z2007b 其实我也是过来人,深知没有接触过内核开发的同志在无人指导的情况下独自学习Linux设备驱动的感受。都是买书,看BLOG,自已调个小程序,很难有同志能够坚持下去,市 ...…

查看全部问答>

用147控制GSM发短信的问题

flsafjldjfjaf [ 本帖最后由 wangren09 于 2012-5-16 18:03 编辑 ]…

查看全部问答>