历史上的今天
今天是:2026年03月05日(星期四)
2023年03月05日 | 江智机器人人机语音交互技术核心功能点探索
2023-03-05
江智机器人人机语音交互技术核心功能点探索
无疑机器人人机语音交互技能是人工智能机器人必须具有的核心功能点之一。国内的科大讯飞,百度等为代表的一些已在人机语音技术方面耕耘了多年,且取得了较大的发展。国内相关的机器人公司,科研院所等也不断的在此基础上结合市场场景进行尝试等。到现在依然还没看到人机语音交互技能能够支持市场场景可靠性实际使用的案例。
直到微软强力支持的OPEN AI多提出的Chat GPT 给世界带来了期待。Chat GPT目前的人机语音交互技能已有明显的提升。可以说是一场变革。基本上能够做到比较准确的判断人们所要表达的主要用意,并会进一步判断人们将下一句可能所要表达的内容。
但是当我们再冷静下来进一步思考:如果有了Chat GPT,我们就一定能像人与人一样,很好的进行人机语音交互吗?达到人与人交流的效果吗?
给你的答案 一定是 还不能够!原因就是讯飞的语音交互还是Chat GPT,其他们主要方法以及主要方向是基于大数据的训练深度学习。对于公共场景 大的基本面的有一定逻辑关系等内容一定会越做越好,甚至以后比人的反应回答还要快 还要准。
可是我们仔细想想:我们大家平时交流的内容有多少是“大事”?应该是更多的就是“家常” 或者生意上往来的事情等。甚至都不能对外公开的话题。还有就是临时性决定的都有可能等。而且这方面的交谈内容所占的比重更大。就目前而言Chat GPT技能还不能做到把这些内容实时采集进行模型训练。也就是说Chat GPT对这样的内容的人机语音交互,就不是他们研发的方向与目的。
我们江智机器人公司通过对市场的深入的了解分析;这几年脚踏实地的努力,现在已经把这方面讯飞以及Chat GPT所欠缺的语音交互场景所需要的技能不断的补充起来。而且这些内容也只能交给使用者或者可以依靠的人来完成。我们只是提供了具体的操作处理方法。而且这些方法仅具有高中文化程度,具有电脑基本操作能力的人都可完成。同时对昨天交互所出错的内容,随后可精准的完善训练之后,明天在问这个问题就不会再出错。
我们按照这样的方法思路所开发的软件通过这半年多的用户体验测试,已日渐显出实际交互效果优势。在不断的持续的改进下一定可以实现专业场景的语音交互,达到人与人交互的效果程度等。
深圳市江智工业技术有限公司
2023年3月5日
下一篇:基于事件相机的超分辨率图像恢复
史海拾趣
|
type char_arry is array(0 to 15) of character;constant fist_line:char_arry:={\' \',\'t\',\'h\',\'e\',\' \',\'F\',\'I\',\'R\',\' \',\'d\',\'a\',\'t\',\'a\',\' \',\'i\',\'s\'}; 报错为:Error (10500): VHDL syntax error at LCD1602.VH ...… 查看全部问答> |
|
在电驴上下载了Tornado2.2 for 奔腾,安装之后启动Tornado总是显示“Lecensing Failed...”,但是我已经把lecense.dat放到c:\\flexlm下,而且设置了环境变量。请问怎么解决这个问题?… 查看全部问答> |
|
我几天安装完SQL CE2.0以后,准备在SQL CE 2.0里建立数据库,于是在开始-程序准备打开SQL CE 2.0 结果发现只有SQL CE2.0的帮助文档。是怎么回事? 是不时还要装SQL SEVER阿 我的SQL CE2.0时从微软下载的,40多M,IIS也装了… 查看全部问答> |
|
基于LabVIEW图形界面的TI LM3S8962的开发续--ADC 以下图片为本次例程的程序框图,附件为工程文件和VI。 本例程主要是从开发板ADC0取得模拟电压值,然后简单的显示在开发板的OLED上。 注:开发板的模拟参考电压为3.3V,不是5V。 … 查看全部问答> |
|
在大家的一起努力下,“<50元的FPGA核心板,会否有朋友顶啊?”这个帖子得到热烈的回应,板子也大家的期盼中完工,为了方便大家的交流和资料的跟进,特意新开这个帖子,有兴趣的朋友可以在这个帖子进行跟新。 首先再介绍一下这个板子: ...… 查看全部问答> |
|
针对the Xilinx Virtex™ LX130 的电源参考设计 Xilinx® Virtex-6 FPGA参考设计是一款采用TPS40190控制器及TI NextFETs™的Virtex 6 LX130设计,旨在提供最高效率和最佳性能。… 查看全部问答> |




