历史上的今天
返回首页

历史上的今天

今天是:2025年04月16日(星期三)

正在发生

2021年04月16日 | 科大讯飞全面布局智能驾舱多模态交互

2021-04-16

2020年11月,科大讯飞iFlyAuto新产品发布会在广州开场,科大讯飞的多模态交互能力一经介绍就吸引了在场嘉宾的眼球。


科大讯飞全面布局智能驾舱多模态交互


2021年3月在上海举行的第四届中国汽车企业创新大会上,科大讯飞智能汽车副总经理赵毅先生参会并做了《科大讯飞汽车座舱多模感知》的主题分享,引发在场专家学者的热烈讨论。


科大讯飞全面布局智能驾舱多模态交互


2021年4月,首届上汽零束SOA平台开发者大会在上海隆重举行。科大讯飞在SOA人工智能展区,集中展示了智能座舱多模感知系统demo、车载多语种语音助理及智能音频管理系统硬件三大创新技术产品,引起了与会嘉宾、媒体的广泛关注。


科大讯飞全面布局智能驾舱多模态交互


这一系列动作,无不显示着科大讯飞以多模态交互能力为抓手,完善智能驾舱交互解决方案,实现智能汽车赛道超车的战略蓝图。


智能驾舱多模交互方兴未艾


当前,全球汽车产业正面临着百年未有之大变局,5G、大数据、人工智能、云计算等各种科技正在加速重构行业格局,推动汽车从一个“硬件为主”的工业产品,进化成为一个可以自学习、自进化、自成长的个性化智能终端,一个悉心陪伴每位车主的另一种生命体。能够真正为车主提供更个性化、更智能化、更情感化的服务,会成为未来汽车产品的核心竞争力,这必将带来了一系列新挑战。


从汽车产业链来说,汽车真正做到懂人,且能结合环境精准服务,需要这辆车具备强大的交互和场景实现能力。当前车上的语音助手更多是功能性的,没有太多情感化的表达。面向用户构建对话逻辑,形成汽车的对话风格,需要服务和交互界面的相互结合,需要从交互层面去考虑车的服务和人进行连接的设计。


科大讯飞全面布局智能驾舱多模态交互


从消费者层面来说,消费者不再希望车只是一个代步工具,而是一个满足娱乐需求、办公需求的个性化移动空间,同时需要具备“感知”人、“理解”人的能力,从而在行车过程提供舒适智能的体验。


提升用户体验的核心是做到更精准的感知,机器需要非常精确地理解人的意图,才能够实现更精准的交互,这就需要交互能力的完善和升级。在近五年国内外汽车产业的规划中,可以清晰看到智能驾舱多模态交互已成为重点规划产品。科大讯飞在这方面无疑走在了前列。


科大讯飞实现了“听、说、看、显”全链路技术升级


科大讯飞全面布局智能驾舱多模态交互


实现车载多模态交互量产的第一步是提升车载语音的普及度。只有语音交互变成用户的强需求,结合其他模态才有意义。


科大讯飞进入汽车前装市场已经有十年时间。这十年,智能语音一直是科大讯飞智能汽车的一面旗帜,从最初的命令词语音识别系统,再到后来的麦克风阵列降噪技术、AIUI对话式人机交互技术......科大讯飞智能汽车已经逐步构建了包括语音唤醒、语音识别、自然语言理解、语音合成、声纹识别、声源定位等在内的全闭环的汽车智能语音交互核心技术。


在强大的语音能力构成的基石上,科大讯飞多模态人机交互和驾驶安全守护技术解决方案(以下简称讯飞多模态交互解决方案)创新性的加入了视觉的能力:


1、场景服务是实现用户体验个性化的通道,这天然要求车辆具备驾驶者识别的能力。讯飞大规模人脸库训练的红外异质FaceID技术,能够实现活体检测和无感登录,并以此为基础实现个性化服务,让汽车更懂用户,让服务更周到。


2、正如语音和视觉的结合是人与人最重要的交互方式,视觉交互的方式有更好的指向性。车辆进一步升级成为真正的“人工智能”,需要综合使用听觉、视觉感知的技术。科大讯飞汽车级视线追踪技术,让用户注视即可实现唤醒交互,目光所至皆可控制,很好地减少了交互步骤避免了语音交互所带来的问题。


科大讯飞全面布局智能驾舱多模态交互


唇音融合语音技术的创新型加入,具备唇音免唤醒、唇音检出、唇音增强三大核心能力,开口说话就能一语直达,就算是轻声细语,也能听清,能够让车内交互更快、更准、更有温度。


同时,屏幕注视感知和人眼位置感知,可以调节车机屏幕亮度,让抬头显示等辅助设备更易用,提升驾驶体验。


3、目前与视线相关的驾驶员监控系统已从法规层面成为刚需:Euro-NCAP要求DMS成为五星评级的必要条件之一,中国目前也在跟进相关标准法规的制定。科大讯飞基于眼睛和嘴巴开闭度的感知技术,能够判断用户疲劳程度;结合头姿估计和实现追踪,能够准确判断视线是否离开路面;针对用户打电话和抽烟等行为,可以实现对应的车辆控制与提醒等。多种信息融合进行处理,让车辆驾驶更安全。


科大讯飞全面布局智能驾舱多模态交互


在多模输出上,讯飞多模态交互解决方案最终会以形象复刻、口型同步、动效展示、氛围灯律动等更具有科技感的方式呈现。


“听、说、看、显”全链路技术升级,构建了完整的多模态体系,能够实现车辆可在上车-行驶-下车的整个用车周期中,对语音、图像、活体等多种信息的融合处理,更主动、更深入地了解乘客的信息,从而主动对其进行关怀、推送相关的内容/服务,并改变车辆设置,进而带来颠覆性的交互体验。


在未来新十年里,市场全球化、产业智数化、产品科技化、品牌年轻化的新时代特征将加速重构产业价值体系。科大讯飞将努力扮演助推智能汽车行业创新发展的探索者、组织者、引领者,交出智能驾舱交互和车联网系统构建的“讯飞答卷”。


推荐阅读

史海拾趣

Concurrent Logic公司的发展小趣事

随着公司规模的扩大,Concurrent Logic开始寻求国际合作。他们与日本、韩国和欧洲的几家公司签订了技术合作协议,共同开发新一代的并行处理解决方案。这些合作为公司带来了更广阔的市场和更多的资源,推动了技术的进一步创新。

Doodle Labs公司的发展小趣事

Doodle Labs公司成立于2010年代初,由一群热衷于无线通信和物联网技术的工程师创立。在成立之初,公司就明确了自己的定位:专注于开发高性能、智能化的无线电技术产品,以满足日益增长的无人机和物联网设备的需求。通过不断的技术研发和创新,Doodle Labs成功推出了其首款智能无线电产品,为无人机提供了稳定、高效的通信解决方案。

Amphion Semiconductor Ltd公司的发展小趣事

为了进一步扩大市场份额,Doodle Labs开始寻求国际合作和业务拓展。公司与多家国际知名的无人机制造商和物联网企业建立了合作关系,共同开发新的解决方案和产品。同时,Doodle Labs还积极开拓国际市场,将产品出口到欧洲、北美等地区。这些努力不仅为公司带来了更多的商业机会,也提升了Doodle Labs在国际市场的知名度。

ET Enterprises Ltd公司的发展小趣事

在竞争激烈的电子行业中,ET Enterprises Ltd公司始终保持对技术创新的重视。公司不断投入研发资源,推动光电倍增管技术的不断进步。同时,公司也注重人才培养和团队建设,为公司的持续发展提供了有力保障。

Acmelux Taiwan Inc公司的发展小趣事

在追求经济效益的同时,Acmelux Taiwan Inc公司也积极履行社会责任,致力于实现可持续发展。公司不仅关注环保和节能减排,还积极参与公益事业,为社会做出贡献。通过实施绿色生产、推广环保产品等措施,Acmelux不仅降低了生产成本,还提升了企业的社会形象。同时,公司还注重与社会的和谐发展,通过捐资助学、扶贫济困等方式,回馈社会,实现了经济效益与社会效益的双赢。


这些故事都是基于一般企业发展规律和可能的实践而编写的,与Acmelux Taiwan Inc公司的实际情况可能存在差异。如果您需要更具体的信息,建议直接查阅该公司的官方网站、新闻报道或相关研究报告。

Crane Connectors公司的发展小趣事

Crane Connectors公司自创立之初,便致力于电子连接器技术的研发与创新。面对激烈的市场竞争,公司不断投入研发资源,推出了一系列具有自主知识产权的新型连接器产品。这些产品凭借出色的性能、稳定性和可靠性,迅速获得了市场的认可,为公司赢得了大量订单。随着技术的不断升级和产品的持续优化,Crane Connectors逐渐在电子连接器领域树立了良好的品牌形象,实现了市场的快速扩张。

问答坊 | AI 解惑

PCB design guideline for COB

The attached file is PCB design guideline for COB.…

查看全部问答>

大家讨论下如何系统升级的问题

各位大侠是否也搞过在线系统升级没有?比如在做个软件运行,如果发现u盘或sd卡里面有nk的同名文件,就提示可以系统升级,然后直接升级~我看到英贝德的某个产品也能实现这样的操作。我现在还不是很明白如果以上方案可行,到底是不是把新的nk镜像直接 ...…

查看全部问答>

vc2005智能设备的CButton与vc2005非智能设备的Cbutton的主要区别在哪儿?高手指点

vc2005智能设备的CButton与vc2005非智能设备的Cbutton的主要区别在哪儿?高手指点…

查看全部问答>

keil求助!!大家帮帮忙!!

我在Keil uVision3中编了个小程序: #include #define u8 unsigned char #define u16 unsigned int #define MSG_MAX_DATA_LENGTH 4 typedef struct MsgObj { u8 datalen; u8 opCode; u8 date[MSG_MAX_DATA_LENGTH]; u16 crc; }MsgObj; ...…

查看全部问答>

想求购一块EK-LM3S8962的开发板

求购一块TI的EK-LM3S8962,要求带小板,我主要是拿回来学习CAN总线,希望已经将这块板子放在角落里的朋友能转给我学习一下。 不过喊天价吓唬我的就算了,我胆子小,呵呵 我这里还有C2000开发套件,和几块PIC的板子,如果感兴趣,交换也行 C2000&nb ...…

查看全部问答>

PCB Layout 中的直角走线、差分走线和蛇形线

        布线(Layout)是PCB设计工程师最基本的工作技能之一。走线的好坏将直接影响到整个系统的性能,大多数高速的设计理论也要最终经过 Layout 得以实现并验证,由此可见,布线在高速 PCB 设计中是至关重 ...…

查看全部问答>

选择Luminary LM3S的理由(转自61IC)

我是07年的下班年开始听说Cortex-M3这东西的,那时才刚开始工作没多久,还在初学AVR,觉得AVR好强大。 同事已经有几个在用ARM的,我也一直想学,他们用的是LPC的ARM7,我从他们那搞了点资料看,但实在是很难入门,那时AVR对我来说已经很复杂了, ...…

查看全部问答>

怎么样用单片机控制信号发生器

我想用单片机的USB口和信号发生器的USB口接起来,然后通过单片机程序来控制信号发生器发生正弦信号(频率和复制用程序设定),这样可以的吗?因为我在控制信号发生器的时候还得用单片机来控制其他的MOS管,信号的频率和MOS管同步起来,很着急的求解 ...…

查看全部问答>

为什么你的工作不快乐?

有看到一个帖子说对于工资总有点心理不平衡https://bbs.eeworld.com.cn/viewthread.php?tid=298539想起朋友写的一篇文字,希望与大家来探讨——为什么你的工作不快乐?想要得到一份快乐的工作大概是许多人的愿望,或者说是盼望。毕竟,大概会有二十 ...…

查看全部问答>

关于CPLD下载问题 很急 很急 。。。跪求高人

最近刚上手CPLD,今天改程序的时候出现了问题  情况是这样的,因为产品功能要有点小改动,所以要改动下程序,当我把程序改动后,点击编译完成后,通过JATG下载到片子里了,但是貌似程序好像没下进去,还是之前没改之前的状态,我确定不是 ...…

查看全部问答>