电子头条

对于DuerOS,商业化竟然不是百度的目标

2017-07-27
    阅读数:

百度 AI 开发者大会过去20天之后,DuerOS 再次露面,这一次是在极米电视的新品发布会上。

极米激光无屏电视发布了三款搭载 DuerOS 的新品,分别是 T1、A1 Pro、A1,其中作为主打的 T1 售价接近 8 万元,当这个价格显示在演讲 PPT 上时,现场爆发了声音最大的一次“哇”声,相信受邀参与的所有人都瞬间明白了,为什么这场发布会的主题定为“重新定义人生赢家”。

雷锋网参与了随后的媒体采访,当部分媒体屡次针对该价格和选择合作客户发问时,景鲲不得不多次强调,DuerOS 在选择客户或服务对象时,是“不挑”的:

客户我们会支持,个人开发者我们也会支持,8万的电视我们会支持,8千的电视我们会支持,1888元的电视我们也会支持。

景鲲就此还说,百度 AI 开发者大会之后,DuerOS 开放平台很火爆,收到了数十家大小企业、个人开发者的咨询和合作意向。此外,雷锋网了解到,他本人特别关注个人开发者,因为这些人会写信过来,希望利用 DuerOS 做更多事情。

之所以不挑客户,是因为百度希望 AI 能够成为一种“廉价”的技术或能力,免费开放给所有的合作伙伴,形成标配。但免费模式必然影响到 DuerOS 的商业化,背后隐藏的是一个更本质的问题——百度是否能凭借 AI 成为一家赚钱的公司,回到三巨头的阵营,针对这一点,景鲲直言不讳:

现在商业化不是我们的目标,现在最大的问题是整个音箱产业,怎么让普通的消费者知道语音对话交互是一个标配。

景鲲坚信只要人机交互有一次跃升,实现商业化完全不成问题,而现在对于百度而言,这不是重点。

以下是景鲲采访实录,雷锋网做了不修改原意的删减:

国内唯一能解决听懂问题的就是百度

记者:具体到极米的 T1,投出来后有120英寸,这意味着客厅的面积也会比较大,对于远场语音的识别会不会构成挑战?

景鲲:电视的远场对现在这种技术都是有挑战的,因为电视本身的发声单元、音响特点,现在还是有一定的业内挑战。但我觉得我们基本上是站在整个技术最前沿去攻克这样的挑战,后面也会发布类似的方案。跟极米电视的合作,现在主要是通过遥控器上的语音按钮,近场识别。

其实跟业内,尤其是电视行业的人在沟通的过程当中,都是想把遥控器扔掉的。但是电视有几类用户,经常看电视的是打发时间的用户,比如我们看电视的意图可能就想看《人民的名义》,但是很多打发时间的用户就是希望浏览、逛一逛或是看哪个海报更漂亮。这个时候,只靠语音感觉还不能完全满足他们的需求,所以遥控器对他们来讲还是比较必要的一个设备。

记者:所以针对这两种人提供了不同的选择?

景鲲:是这样的,后续远场语音识别随着技术的发展肯定会越来越多。

记者:在技术方面,正在攻克哪些难点?

景鲲:我觉得在技术方面,近场语音识别基本上已经相对很成熟了,远场语音识别在不同的环境下,需要逐渐被攻克。大家现在盯的比较多的是音箱类产品的远场语音,刚刚提到电视、冰箱远场语音,车载稍微近距离偏远的语音都还是挑战。

百度是一家特别注重技术驱动的公司,在 AI 时代,我觉得对百度来说是一个特别好的机会,因为有很多问题需要技术去支持,技术一旦解决了,就会有很大的支撑。所以我们特别希望在百度 AI 时代投入更多的技术能力,收购很好的技术公司,把自己的技术优势发挥到极致。

记者:百度在听懂这个方面的一些优势和劣势在哪里?

景鲲:首先我个人比较自豪地讲,我觉得百度可能是国内唯一能解决听懂问题的(厂商)

如果我们看更长时间,假设用电影《Her》做比喻,那个里面的人工智能是懂我们所言的;还有另外一个电影叫《机械姬》,里面有一个细节,就是创作机械姬的那个人是搜索引擎的创始人,那个电影很好看,我觉得大家可以回去看一下。

这是因为搜索引擎具备了解决听懂最大的一个优势——数据的优势。你只有看到足够多的表达,你才知道用户表达的是什么意思。比如说我的儿子现在三岁,很多时候跟他说一个名词,跟他表达一个句式的时候,他第一次是不懂的。我告诉他榴莲是什么东西,我又告诉他这种表达方式,有了第一次学习之后,第二次他就懂了,所以人就会产生迁移学习的能力。

对于计算机也是一样的,你让计算机去解决一个还没有看到的问题,其实对于计算机来讲是很大的挑战。机器学习最大的能力就是在有限的集合上做训练,同时去解决他没有看到过集合上的问题。在人机交互的过程当中,其实就跟原来人们用百度搜索一样的,从关键字变成了自然语言,都是表达和需求之间的一个Match。在这个方面,搜索引擎是具备非常大的优势的。

商业化不是百度的目标

记者:小鱼到家、极米都在与 DuerOS 合作,选择合作伙伴有没有一个先后顺序?有哪些决策机制和筛选标准?

景鲲:这是一个好问题。7月5日百度开发者大会的时候,我做了一个比喻,我们希望 DuerOS 能够成为人工智能时代的 Android。在时代的变革过程中,Android 从底层消费层入手,解决了基础的门槛,让很多人更容易进入这个行业,来开发自己的手机,他们可以定义自己的手机,在解决一些基础应用需求的同时,也让整个市场更加丰富。

我们其实也在扮演一样的角色,目前来讲,我们不会去挑客户,比如说之前的开发者大会上,杜志鹏作为一位个人开发者,他没有任何的企业背景,就是给我们写了一封邮件说想实现他的梦想,我们就去支持他了。所以就现在来讲,我们在官网上开发了很多不同的套件和解决方案,其实是希望每个小企业、大企业还有个人开发者都能够开发这样的设备。

小型企业的发布会跟大企业相比,关注度会有差别,所以无论是小鱼在家还是极米,我们都希望帮他们去站台,因为他们在各自的领域是十分优秀的企业。在自身的垂类中,他们已经做得很好,我相信在加入人工智能技术之后,他们可以做到最优。我们希望一起打造高端的Case,一方面让他们自己的产品更好,另外一方面我们也能够覆盖越来越多的长尾。

跟大家分享一个很有意思的事情,最近开发者大会之后,DuerOS 开放平台特别火爆,无论是在大企业、小企业还是在个人开发者中。我特别关注个人开发者这个群体,他们会写信给我们,希望利用我们的平台去做很多事情,以后我们也会集中跟大家分享。

其中有一个例子我觉得特别有意思,这位个人开发者是一个高压工人,他的工作主要是在高压电线上,我们平时都想像不到的地方。他在高压天线上需要戴手套,所以平时的工作环境基本上都不能动手,也不能把手机这类设备拿在手里,可他其实也有很多信息类的需求,所以他特别希望有个手表或者手环能够跟他对话,或者满足他打电话的需求。

各行各业中,都有一些普通的开发者也有这样的需要,我们希望能够做一个基础的开放平台,让无论是极米、小鱼在家,还是行业巨头企业,甚至是个人开发者,都有机会能够获得他们想要的解决方案。

记者:长尾这批用户其实比较小,可能不具备完整的软硬件实力,百度考虑过如何解决这个问题吗?

景鲲:我们强调的开放是赋能每个人。小用户之前没有人给他们服务,但是他们有很强的诉求,为他们服务,能够看到真实的诉求。虽然单量很少,但是每一个都反映了很真实的角落诉求。我们还有一个例子就是,有一位用户的视力不是很好,他之前获取信息是有缺陷的,通过这种赋能可以改善这种情况,虽然 Case 小,但是满足他的需求的程度非常深。所以我觉得这对于基础的生态来讲,是很有意义的。但推出一个软硬一体化的解决方案是很有必要的,因此我们需要一个壳。

记者:在AI开发者大会之后,有没有一些新的合作意向产生?

景鲲:那天我跟我们的产品经理,去见一个很重要的国际大厂客户,他是负责音箱这个垂类的,因为看到了 Alexa 的方案,开发者大会之后,他主动来找到我们并肯定了这一方面的需求是井喷的。所以可以看出,AI开 发者大会效果非常好,无论是音箱、电视、冰箱,甚至是车载、手表,这种类型的用户雪片一样飞来。尤其是对于我们整个开放平台的开放性,我们收购 KIIT.AI 之后,对语音唤醒的开放性,都打到了他们的痛点,这种类型的客户需求特别多。

现在我们有一个烦恼,就是开发套件数量在最开始预估的时候稍微有点少了。从整个市场环境来看,这种需求特别大,有很多人在新鲜的设备上都想做语音交互,甚至包括跑步机和按摩椅。我们觉得自己想象力还不到位,通过开发者大会之后,他们特别希望把语音交互放在他们的设备上。

记者:开发者大会结束之后,有多少家厂商找过来?

景鲲:至少几十家,很多。

记者:百度开放平台定制的业务,是有盈利前景的。我想知道百度定制到什么程度?细化到哪个环节?你们目前定制的客户付费意愿怎么样?

景鲲:现在商业化不是我们的目标,现在最大的问题是整个音箱产业,怎么让普通的消费者知道语音对话交互是一个标配。而且从今年开始,大家如果回溯一下今年智能电视类似的发布会,我们去年11月跟国安广视合作,推出之后,今年所有的电视,如果不具备语音交互功能,就感觉这个电视似乎缺点什么,基本的现状就是这样。所以我觉得现在主要的问题不是商业化的问题,是让普通用户认识到这种交互是一个更加便利的方式。

说到定制化,很多定制化不是我们做的,我们是一个开放的平台。就像 Android,很多 App 不是由 Google 做,而是第三方开发者自己做。我们希望合作伙伴在我们的平台上做,给他们提供语音的识别和语义的解析。对于他们来讲,技术开发门槛降低了,完全可以自己来做。

百度知道自己的优势在哪

记者:百度在 AI 技术上有非常强大的团队,如何区分哪些技术已经急迫到需要去收购获得,哪些是依靠自己的力量研发呢?

景鲲:这是一个很好的问题。我们做技术的心态是开放的,开放的心态不仅让我们看到自己的技术,还要看到国际上领先的技术,人才在哪里,技术在哪里。很多国际优秀的创业公司在某条特定的道路上,他们其实走的是比较领先的,像 KITT.AI。在美国,Alexa 是不允许他人定义的,只能用 Alexa。我们看到中国市场上有很强的客户需求,唤醒词对他来讲需要跟品牌挂钩,这很关键。这个时候,我们需要收集全世界最优秀的技术把它放在一起。看这个行业的时候,我们就会看做相似技术的公司都有哪些,并且已经跟我们的技术有互补,或者客户有特别强的需求但我们还不具备,我们就会把他们收进来,大概是这样的思路。

记者:现在语音交互领域竞争非常激烈,呈白热化的状态,亚马逊、谷歌、苹果、微软都有投入。我想了解的是,DuerOS 在这个市场格局中充当什么角色?

景鲲:你刚才说的这些都是太平洋那边的,都是海外的。你提到的这几家公司,都是科技榜上的四家巨头,科技市值的前四家。大家看到的是一样的方向,这是一个巨大的机会,我觉得是特别好的一件事情。我特别害怕我们看重一个方向,比如百度在语音、人工智能方面投入很多,其他人不跟着我们做,这个时候我们会怀疑自己,其他人都跟着做的时候,要坚定不移相信这是一个机会。

百度是中文最大的搜索引擎,我们知道自己的优势,在人工智能变革的时代,我们希望我们的优势是最基础的生态。我们希望把这些基础生态做好之后,大家在这个生态上开发自己的应用,变得更成功。我们希望每个人是这种最基础服务能力的输出方。


实战特训:远场语音交互技术  


声智科技CTO授课,实例解析Echo音响案例深入了解AI设备语音交互关键技术,掌握远场语音识别系统如何搭建!长按识别下方二维码(或阅读原文戳开链接)抵达课程详细介绍~



最新有关Leiphone雷峰网的文章
展开↓