历史上的今天
今天是:2024年11月02日(星期六)
2020年11月02日 | 阿里语音机器人现身李佳琦直播间,反应速度是Siri的20倍
2020-11-02 来源:猎云网
10月30日消息,刚刚结束的李佳琦直播间里,剁手党通过阿里语音机器人首次实现与主播的实时互动。直播过程中,数十万用户同时用语音回答李佳琦的提问,最终机器人在50毫秒内就完成了语音识别和语音反馈全过程,反应速度是传统语音的20倍。
淘宝直播间观众用语音与李佳琦互动
今年双11期间,淘宝直播间推出 “语音猜价格”功能,观众在直播间也能实现语音交互,例如动动嘴就可以响应主播发出的猜产品价格任务。语音机器人成为决定这一互动过程能否顺畅的关键。
据介绍,一场淘宝直播的观众数量可达百万甚至千万,并且用户分布在全国各地,口音差异较大,目前主流的语音技术方案很难做到短时间内快速响应如此体量的用户语音,例如类似Siri识别用户语音的响应时长就在1秒以上,无法满足直播场景强互动的要求。
此次淘宝直播间采用了达摩院最新的移动端离线端到端语音识别技术。基于全新的网络结构和语音识别框架,即便在低配手机上,也能在50毫秒内完成语音交互过程,速度是传统语音识别的20倍;此外,该技术还解决了快语速、重口音等问题,高难度场景中的语音识别错误率降低近三成。
达摩院语音实验室技术专家万玉龙表示,“在实时性要求极高的场景,传统的云端语音方案无法满足需求,这套语音技术的创新在于同时实现了识别速度和准确度的提升,语音AI模型部署在每个用户的淘宝直播APP上,即便直播间有千万级别的用户,AI也不会漏听慢判。”
过去几年,阿里语音AI在基础研究和应用上取得了一系列突破。2019年,阿里语音AI入选《麻省理工评论》“全球十大突破性技术”,是唯一上榜的中国科技公司;今年7月IDC发布的《中国AI云服务市场半年度研究报告》显示,阿里语音AI以44%的市场份额,在云上语音AI市场中位居第一。
史海拾趣
|
高人可以帮我看下我的这个拨码开关程序老有点小我问题,,十万火急 process(clk_a) VARIABLE cnt_a : std_logic_vector(7 downto 0):=\"11111111\"; begin if (clk_a\'event and clk_a=\'1\') then if cnt_a=\"11111111\" then cnt_a:=d; full_a… 查看全部问答> |
|
Altium Designer 使用 —— 快速制作原理图封装当制作引脚数比较多的器件的原理图封装时,可以使用AD提供的“smart grid insert”功能快速制作原理图封装库。本文以制作K9F1G08为例,进行简单说明。K9F1G08的引脚分布如图1所示:1. 打开 excel ,按 ...… 查看全部问答> |
|
新建一个wince 的mfc exe,怎么在对话框中添加一个ie控件,浏览一个url(本地页面),thanks 新建的时候,选择,WCE MFC appWizard[exe] ,然后再选择Dialog base, 怎么样在该Dialog上添加一个ie控件,然后去浏览一个本地url? thanks… 查看全部问答> |
|
我想把ucos移植去2812,但是在烧写中遇到了一些问题,这个问题我在论坛见过,不过不清楚具体是怎样解决的~ 下面是遇到的状况: 使用ti的烧写插件烧写FLASH时出现以下提示: Code Composer could not locate: FlashAPIInterface.c Would you lik ...… 查看全部问答> |
|
有一个模数转换的芯片产生的数进入430之后处理,产生一系列的结果,大概有几百个数,float型的,ram存不下,所以要存在flash里,请教一下flash里哪些段可以擦除,应该怎么操作?… 查看全部问答> |




