历史上的今天
返回首页

历史上的今天

今天是:2025年02月25日(星期二)

正在发生

2019年02月25日 | 全球深度学习三巨头之Yoshua Bengio畅谈AI如何才能说“人话”

2019-02-25 来源:算力智库

算力说

在人工智能深度学习的研究中,科学家们发现语言学习是其中最为复杂的领域,语言本身可表达表层意思,也能表达深层语义,因此机器的语言理解能力不仅包括描述能力,也包括解读和举一反三的能力,语言的复杂性与人类文明的演变息息相关,因此科学家们在构建语言学习模型的同时,也开始将研究焦点从语言本身扩展到语言的历史、文明的演进等方面,本期焦点人物YoshuaBengio正是该领域的佼佼者。

本期编译文章来自于Yoshua Bengio于2018年发表的关于“人工智能如何理解语言”的演说。Yoshua Bengio将会讲述人工智能在语言理解方面达到人类水平的要点,并且介绍了他引以为豪的“人工智能娃娃游戏平台”,且看他独树一帜的学术观点!

oshuaBengio是深度学习三大学术巨头最纯粹的学术派泰斗级人物,蒙特利尔大学计算机科学与运算研究系教授、蒙特利尔大学算法学院MILA院长, “人工智能娃娃游戏平台(BabyAIgame)”发起人。

【算力观点】

语言学习面临两大主要难题:缺乏高度接近人脑思维的训练模型以及所需算力成本高。Bengio博士提出的“意识先验”模型了模仿人脑的认知系统并且过滤不参与思考过程的信息,有望突破语言学习模型的瓶颈以及拓宽人工智能在语言学习领域的应用范围。

强人工智能的实现当然离我们很远,但关于人工智能的道德伦理问题的讨论从来没有停止过,当人工智能也拥有“意识”时将引出两方面的问题,首先是人工智能在法律意义上的社会身份,其次是它带来的潜在威胁,需要全社会共同关注。

机器学习人类语言的步骤:先搞懂历史,再学习语言

一直以来人们都严重低估了处理语言学习的难度,甚至有一些研究已经在往错误的方向发展------依靠非常庞大的语料库。

仅仅在语料库的基础训练深度学习模型是不够的,造成的后果是,很多模型训练的效果只能是“捕获”粗糙的信息,翻译出来的句子意思词不达意,而优秀的深度学习可以预测基于句子中的其他部分。

在语言理解能力的层次上,初级和高级之间的深层差异是“常识”,以威诺格拉德模式测试(图灵测试的另一个版本)为例,通过提问的方式测试机器是否具备人类的思维能力,比如解读句子,针对“女人停止吃药因为她们怀孕了”,问题将会是‘“她们”指的是什么?是女人还是药?’,而如果将“怀孕”改为“患了癌症”,答案将会不一样。

机器达到和人类同等水平的语言理解能力是有可能的,但我们首先要明白当我们去理解句子或者文档的时候,我们的大脑到底经历了什么?

根据研究发现,答案是“知识”,但现有的方法仍然存在局限性。

以学习外星人的语言为例,学习外星语言的过程通常是观察他们的互动以及构建学习模型----关于他们的互动和语言文本关系的模型,但仅仅凭零碎的单词或者词组信息是不够的,必须理解它们的语境和意图。

解决的方法是通过结合语境升级训练模型,把信息的前因后果考虑进去。但这将会是难度极高的语言学习模型!因为我们还需要去理解外星人的社会形态。

基于这个逻辑,需要首先搭建模拟外部世界的学习模型,用于理解人与人之间的互动行为,理解外部世界是如何运作的,最后再回到语言学习的部分,最终将模糊语言与实体世界结合起来。

外部世界模型和语言学习模型的搭建应同步进行,原因是来自人类文明史的启发,在人类发展的进程中文明和语言密不可分,初级社会向高级社会演变的同时,语言也从个体化走向社区化,语言的体系也变得更加的复杂多样,反过来也促进着人类社会的进步。

机器也要“快思慢想”:构造仿人脑的认知系统

诺贝尔经济学家Kahenman在《快思慢想》中提出人脑的认知系统分为一类认知系统和二类认知系统。

一类认知系统负责完成可以快速完成的、无意识的动作,比如口渴时把水杯拿起来喝水,但某些情况下可能导致结果不严谨,由于一类认知系统不处理语言信息,只能识别出眼前的电话,而不能解释为什么认为它是电话。

二类认知系统则相反,负责耗时长、有意识的动作,所以下至语言,上至编程,它都能Hold得住。人类在学习计算机科学和逻辑学当中正是大量的用到了二类认知系统,而基于符号学的人工智能正往二类认知系统的方向靠拢。

兼具两个系统优点的人工智能是我们要实现的,这样的系统是接地气的语言学习模型,它将是未来研究的主要方向,简单来说,这样的学习模型在信息覆盖面方面是无死角的,通过细致入微的观察周边环境以及人的活动,将这些外部信息和语言联系在一起。

图片来源:论文《Grounded Language Learning in a Simulated 3D World》(如图:人工智能体接收到文本指令后,在不同的场景中尝试完成指定任务)

大家几乎都在探索“最接地气”的语言学习模型,比如通过深度强化学习模型,人工智能体在虚拟场景下接受指令完成各类任务,智能体将模糊语言和具体实体场景联系起来的能力越来越强,意味着语言能力也越来越强。

人工智能体在训练中会主动观察,而且它的行为基本不被干预,训练的效果只是被实验者持续观察,这样的框架将是未来语言学习模型的主流方向。

但这方面的语言学习研究因为还停留在虚拟环境实施而备受质疑,批评者认为不在真实环境中测试的研究都是耍流氓。

实际上很多人操之过急了,真正懂“人话”的人工智能离我们还十分遥远,这可是人类的终极目的呀。

我们步子不应该迈太大,小目标是搭建通用的学习机制和框架,让人工智能在虚拟环境中应对自如之后(走路),长远再考虑于实际环境中执行(跑步)的分步走实施才是上上策。

因果逻辑关系是机器“吃透”人类语言的关键

研究发现很多实验室数据其实是无效的,一旦环境改变了,人工智能就会“一脸懵圈”,背后的原因是关系纽带的不对,比如图像识别,实验者认为引发人工智能做出判断的因素是图片的纹理和颜色,而实际上人类在识别图像时还会考虑因果关系,这就是差别。

为了攻克这方面的缺陷,科学家们提出了深度生成模型,它的优势在于通过激励人工智能在训练中预测未来,从而通过培养模型的因果逻辑性提升输出的准确性,以及深层对抗模型可以不断提升输出的准确性,更重要的是人工智能通过训练最终具备预测未来以及制定计划的能力。

在机器学习的训练中,不仅需要注意因果逻辑,还需要注意用于训练的样本数据需要遵循独立同分布原则(Independent and identically distributed):关注用于训练的数据集的代表性和迁移性,样本数据的分布特征必须和测试用数据集、母体数据保持一致,研究发现确保数据分布一致性可强化训练模型的因果逻辑推理能力。

人工智能娃娃游戏平台(BabyAIgame)

图片来源:Yoshua Bengio

人工智能娃娃游戏平台模仿婴儿的成长过程,设置了‘学习者’和‘人类’的游戏或场景。学习者就是‘babyAI’,我们为学习者设计任务,任务以自然语言的形式出现,比如去某个地方、打开、捡、放等,通过与人类用自然语言互动帮助学习者理解周围的环境。

从科学实验的角度出发,项目的实施过程将会是趣味性十足的!

首先,大量的人机交互数据(尤其是语言)将会被收集,随着玩家(人类)越来越多,数据库也会越来越大。

另外,游戏甚至允许人类玩家在游戏中自行设计任务,任务难度逐渐提升。

该项目最大的挑战来自于样本数据的复杂性,哪怕只是非常简单的任务,比如让计算机挪动小件物体,对于训练用的数据量要求也是非常巨大的,因此我们首先需要海量的数据服务于这个雄心勃勃的计划:记录真实世界中成年人与婴儿之间互动的数据。

“意识先验”理论:过滤冗余数据,降低算力消耗

图片来源: Bengio的演讲 Challenges for Deep Learning towards Human-Level AI

传统的深度学习理论需要大量的数据,注意力机制的出现为解决训练数据容量的难题带来了解决思路,但仅仅具备无意识的认知能力(第一类认知系统)还远远不够。

为了将机器的推理能力提升到人类水平,我们在现有模型的基础上,增加预测未来的能力,即意识先验(The Consciousness Prior),直观的说就是人工智能看到“下雨”,联想到“人们会打伞”。

意识先验借用了注意力机制的部分原理筛选出少量、“高纬”的数据,用作大量的预测训练,将无意识层次的数据归类为“低纬数据”,使用少量的、更直接的高层次数据提升了模型预测和推理能力,也减少了训练用时,最终成为有“意识”的类人脑。

作者:梁文辉

编辑:生煎

推荐阅读

史海拾趣

Hitachi (Renesas )公司的发展小趣事

在电子行业中,Hitachi(日立)及其子公司如Renesas(瑞萨电子,原日立半导体部门独立后成立)的发展历史充满了技术创新、市场扩张与全球合作的精彩故事。以下是五个相关故事,每个故事均基于事实描述:

1. 从电机制造到半导体巨头的转型

日立公司成立于1910年,最初以生产电动机和矿山设备起家,旨在支持日本的工业化进程。随着技术的不断进步和市场需求的多样化,日立逐渐将业务扩展到电子领域。1960年代,日立开始涉足半导体技术,并在随后的几十年里,通过持续的研发投入和技术创新,逐步建立了在半导体行业的领先地位。1999年,日立半导体部门独立成为Renesas Technology Corporation(瑞萨科技),进一步专注于微控制器、模拟IC、电源管理IC等产品的研发与生产,为汽车电子、工业控制、消费电子等多个领域提供关键解决方案。

2. 全球化战略与市场拓展

进入21世纪,日立及Renesas积极实施全球化战略,通过在全球各地设立研发中心、生产基地和销售网络,加速其产品和技术的国际化进程。例如,Renesas在美国、欧洲和亚洲等地建立了多个研发中心,与当地企业和研究机构紧密合作,共同推动半导体技术的创新与发展。同时,通过并购和合作,Renesas不断扩展其产品线,提升在全球市场的竞争力。

3. 技术创新引领行业发展

日立及Renesas在半导体领域的技术创新是其持续发展的重要驱动力。多年来,公司投入大量资源进行研发,不断推出具有行业影响力的新产品和技术。例如,在汽车电子领域,Renesas的MCU(微控制器)和功率半导体产品广泛应用于发动机控制、车身控制、安全系统等关键系统,为汽车行业的智能化和电动化转型提供了重要支持。此外,Renesas还在物联网、工业4.0等新兴领域积极布局,推动相关技术的研发与应用。

4. 应对挑战与危机管理

在发展过程中,日立及Renesas也面临过诸多挑战和危机。例如,2011年日本东北太平洋地区地震和海啸对日立及Renesas的生产基地造成了严重影响。面对这一突如其来的灾难,公司迅速启动应急响应机制,调整生产计划,确保关键产品的供应不受影响。同时,公司还加强了供应链的多元化和风险管理,以应对未来可能发生的类似危机。

5. 可持续发展与社会责任

作为一家全球性的电子企业,日立及Renesas始终将可持续发展和社会责任视为企业发展的重要组成部分。公司致力于开发环保型产品和解决方案,推动绿色能源和节能减排技术的应用。同时,公司还积极参与社会公益活动,支持教育、环保和社区发展项目,展现了作为全球企业公民的责任感。例如,日立通过引入“光伏+储能”智慧能源体系,构建绿色生产基地,为实现“双碳”目标贡献力量。

以上五个故事展示了Hitachi(日立)及其子公司Renesas在电子行业中的发展历程和成就,体现了公司在技术创新、市场拓展、危机管理、可持续发展和社会责任等方面的努力和贡献。

锋鸣电子(Fengming)公司的发展小趣事

福斯特集团(FIRST SEMI)作为另一家以“FIRST”为品牌的企业,在半导体芯片领域也取得了显著成绩。该集团成立于2010年,总部位于中国深圳,是一家集半导体芯片研发、方案设计、封装制造、测试编带、产品销售为一体的国家级高新技术企业。公司产品广泛应用于无人机、机器人、笔记本电脑、液晶电视等多个领域。通过在全球设立代理销售公司,福斯特集团的销售网络覆盖全球多个国家和地区,服务合作客户超过3000家。

Excelitas公司的发展小趣事

为了进一步提升竞争力,Excelitas公司积极寻求与其他企业的战略合作。在一次重要的合作中,Excelitas与一家知名的半导体公司达成合作协议,共同开发新型光电传感器。通过资源整合和优势互补,双方成功推出了多款具有竞争力的产品,实现了互利共赢。这次合作不仅增强了公司的技术实力,还为公司带来了新的市场机遇。

Ferroxcube公司的发展小趣事

随着全球环保意识的日益增强,电子行业也开始面临着越来越严格的环保要求。Ferroxcube公司作为行业领军企业,积极响应环保号召,开始研发更加环保的磁性元件。

经过长时间的研发和试验,公司成功推出了一款采用环保材料制成的新型磁芯。这款磁芯不仅性能优异,而且在使用寿命结束后可以方便地进行回收再利用,大大降低了对环境的污染。

这一创新产品一经推出,就受到了市场的热烈欢迎。许多环保意识强烈的客户纷纷选择使用Ferroxcube的环保磁芯,以支持绿色环保事业。这也使得Ferroxcube在环保领域的声誉大大提升,为公司赢得了更多的市场份额和客户认可。

Hirose Electric公司的发展小趣事

在21世纪初,随着电子行业的飞速发展,对于高性能磁性元件的需求也日益增长。Ferroxcube公司,作为世界第二大磁性元件生产商,凭借其卓越的技术和产品质量,迅速在市场上占据了一席之地。公司不断投入研发,推出了一系列创新的磁芯和磁环产品,深受客户好评。

在一次重要的行业展会上,Ferroxcube展示了一款新型的高性能磁芯,其优越的性能和稳定性吸引了众多行业内人士的关注。一家知名的电源制造商对这款产品表现出了浓厚的兴趣,并表达了合作的意愿。经过几轮深入的洽谈,双方达成了战略合作协议,Ferroxcube的磁芯成为了这家电源制造商的首选元件。

这一合作不仅为Ferroxcube带来了大量的订单,还提升了公司在行业内的知名度和影响力。公司借此机会加大了研发投入,进一步巩固了其在磁性元件领域的领先地位。

格科微电子(GALAXYCORE)公司的发展小趣事

在全球经济一体化的背景下,Ferroxcube公司意识到拓展国际市场的重要性。为了进一步扩大业务范围,公司决定在欧洲、亚洲和北美等地设立分支机构,以更好地服务当地客户。

通过在各地设立销售和服务中心,Ferroxcube成功地打入了多个国际市场。公司的产品和服务得到了越来越多国际客户的认可和赞赏。同时,公司也积极与当地的研究机构和高校合作,共同推动磁性元件技术的创新和发展。

这些国际市场的成功拓展不仅为Ferroxcube带来了更多的业务机会和收入来源,还进一步提升了公司在全球电子行业中的地位和影响力。如今,Ferroxcube已经成为了全球知名的磁性元件供应商之一,为电子行业的发展做出了重要贡献。

问答坊 | AI 解惑

常见传感器资料

本帖最后由 paulhyde 于 2014-9-15 03:35 编辑 在电子设计竞赛中,肯定少不了各种传感器的应用。下面我将传感器的资料收集如下。希望能够帮到大家。多多提出疑问和意见,大家共同讨论!  …

查看全部问答>

wang1jin带您从零学PCB设计8小时视频教程下载地址

wang1jin带你从零学PCB设计8小时视频教程 原创者:wang1jin 纳米盘下载,请大家下载前装一个纳米工具。再进行下载。 如果文件不能下载请联系wang1jin@126.com。 本视频教程欢迎大家免费传播,供大家学习使用。但不能用于赢取私利,如果有什 ...…

查看全部问答>

求可以和keil联合仿真的Proteus版本

请给出keil版本和Proteus版本以及下载地址,最好可以有怎么使用的具体操作步骤 另外Proteus要有破解的,我下了几次都没有破解文件而不能用 网上给的教程版本不一样,把我都搞晕了…

查看全部问答>

新手上路 skyeye模拟内核移植bootloader能用VIVI么?

老师留得思考题  没人鸟他 但我想尝试下    高手帮帮忙好吗?? 前不久用的u-boot 进行了一次内核移植 (用skyeye模拟的) 不知道 用vivi怎么来 在vivi文件夹内写 skyeye.conf要注意什么啊?? 谢谢了啊!!!…

查看全部问答>

请教关于FLASH

各位大侠:     我的板子现在是用的32M的nor flash : rc28f256j3c ,没有nand flash 由于FLASH太小,想换成一个64M的nor flash :rc28f256p33 我看目前的BSP---driver中并没有关于NOR flash的驱动 只有在eboot中有这样两个函数是关于FL ...…

查看全部问答>

在手机上使用的嵌入式office软件除了quickoffice还有其他的吗?

在手机上使用的嵌入式office软件除了quickoffice还有其他的吗?哪位大侠知道请回答一下。…

查看全部问答>

求OrCAD 原理图仿真技巧

;P ;P ;P [ 本帖最后由 ch0721 于 2010-11-30 00:10 编辑 ]…

查看全部问答>

uart2

各位高手: 我想请教下大家,我想使用omapl138(合众达产品)的uart2 我应该如何修改arm Linux 内核的配置? (能通过测试 使示波器看到波形)…

查看全部问答>

LinUx系统问题

菜鸟问下各位大师怎么查看cpU和操作系统的位…

查看全部问答>

求大神 求帮忙 数控直流电源设计

本帖最后由 paulhyde 于 2014-9-15 03:26 编辑 设计内容:1电路原理图2元件清单3实物制作4设计报告设计要求:1输出电压:范围0-9.9V,步进0.1V2纹波不大于10mV3输出电流:500mA4输出电压值由数码管显示  求大神 求帮忙  感激不尽  有 ...…

查看全部问答>