历史上的今天
返回首页

历史上的今天

今天是:2025年04月26日(星期六)

2018年04月26日 | 三方软件深度体验 解读华为手机AI能力!

2018-04-26 来源:智东西

随着AI技术的发展,商业化与行业落地已成为近两年AI市场的核心。而作为全球第一大硬件入口的智能手机,AI又岂会放弃这块“肥肉”,也正在从芯片、语音、视觉等各个方面加速涌入手机入口。


近期华为发布了P20智能手机,这是搭载了其自研的麒麟970 AI芯片的又一款手机。自2017年9月,华为率先在全球发布麒麟970芯片后,此前这款AI芯片已经先后落地华为Mate 10、荣耀V10等系列新品。


但是AI能力绝不是芯片和算法的简单叠加,在AI芯片与AI算法的加持下,真正落地到软件应用,提供更快的处理能力以及更优的软件体验,对于消费者而言手机的AI能力才有意义。


近期,我们通过深度体验华为手机中来自系统层的软件、自有APP、第三方APP,来从这三个维度实际感受一下,华为手机的AI能力到底在软件层面表现如何。


一、系统软件:场景识物


首先我们先看一下华为手机在系统层的AI能力,这些应用直接内置到手机中,可以说是企业打造的一些标杆应用,无论是在芯片算力、AI算法以及软件适配等方面都会花大工夫打磨。在系统层的应用上我们选择了华为内置的商品识别能力进行体验。


具体而言,唤醒华为手机后,无需解锁也无需打开APP,只需从屏幕底部轻轻向上一划就可调出底部菜单栏,在华为手机的最右方有一个场景识物的功能标志。它调用了华为手机的摄像头功能,通过摄像头对物体进行“观察”识别,就可以识别出商品的信息,然后会为你推荐类似的产品。这些推荐的商品来自淘宝,如果你对那个感兴趣就可以直接进入到淘宝中进行查看购买。



我们进行了两组测试,首先先用华为手机扫描了一台空气加湿器,经过1~2秒钟的商品识别,它就识别出答案后就会推荐出类似的商品。从结果显示来看,它推荐的前两款都是巴慕达净化加湿器,无论外观还是颜色都与实际产品是一致的,可见它准确识别了这台加湿器,并且还根据物体识别推测了最接近的品牌。


此外,广大女性同胞在看到一件漂亮衣服时,是否想第一时间就知道商品的品牌信息。我们又用华为手机的商品识别功能扫描了一位小姐姐的灰色外衣,识别成功后手机就推荐了相关品牌的外衣。



目前场景识物方面取得的效果,得益于机器视觉技术较为成熟,机器通过摄像头能够对三维物体进行感知识别。更重要的是华为将场景识物功能和淘宝平台做了无缝对接,构建了一个不错的AI实际体验场景。


通过这两次体验,我们发现华为手机对于商品识别能力做了很好的优化,首先无需APP内操作,而是直接从手机系统入口直接启用,更加方便快捷;其次是物体识别时间较快,一般1~2秒内即可完成,并且准确率较高。


这对于喜欢购物的女士无疑是一大利器,街头看到一件好看的商品,直接拿出手机识别就可以推荐出相关的产品,并通过淘宝获取信息,用户可以更便捷的“剁手”了。


二、自有APP:微软翻译


华为手机中的微软翻译是由微软提供的技术支持,华为做的优化,以翻译这个自有APP为例,我们看一下华为手机中自有APP的AI能力如何。


华为手机中的翻译APP有4项功能,包括语音翻译、文字翻译、图片识别翻译、以及多人(多语种)会话,这里主要用到的AI能力就是机器翻译,也涉及语音识别、图像识别。


这里我们重点介绍语音机器翻译和图片识别翻译这两个功能。在语音翻译中,设置好语种的转换,比如中英翻译,当我说出“你好,欢迎来到人工智能的世界”,在华为手机上方就实时呈现出中文语音识别的结果,然后屏幕上实时呈现英文翻译结果“Hello,welcome to the world of artificial intelligence”。你也可以翻译的结果调整成其他语种。



可以看出语音翻译首先在识别率上已经很高,并且正常的口语机器翻译都可以呈现非常不错的翻译效果,语音识别与机器翻译的准确性都较高。此外,翻译速度采用实时翻译的形式,当你说完一句话时,相关的英文翻译已经输出,这也体现出华为手机中AI芯片能够为软件提供更多算力,来保证用户体验。


图片识别翻译是指调用华为手机中的摄像功能,将所要翻译的内容进行拍照,然后就可以立即呈现出你想要的翻译结果。


具体来说,我们找了一篇英文新闻来考验这项能力,篇章、片段对机器翻译可谓挑战很大,因为机器没有理解上下文语境的能力。首先我先用华为手机将这三段英文拍照,大约不到1秒,在英文上方就呈现了中文的翻译结果。



这里涉及到两大重要AI技术,一项是图片识别,在用华为手机拍照后,它需要调用AI芯片中的算力快速进行图片中的文字识别,然后在通过机器翻译将英文翻译成中文,其他语种之间的翻译也支持。


从结果来看,首先整个图片识别、机器翻译整个过程用时不到1秒,可以想象华为手机AI芯片提供了足够的算力,AI算法进行准确快速识别,并进行翻译,来使用户瞬间获得想要的翻译结果,无疑华为手机AI的能力增强了用户体验。


三、第三方APP:Prisma图片处理


Prisma是一个图片处理APP,可以通过AI把你手机中的普通照片模仿出著名艺术家画作的风格,在2016年一经推出便红遍全球。但这一应用需要软件对图片内容进行识别,并进行相关的渲染等,在算力上要求很高,现有手机的处理能力,往往需要很长时间才能完成。

华为除了将AI芯片的能力落地到自己开发的应用中,还HiAI移动计算平台,向第三方开发者提供人工智能计算库及其API,可以让开发者更好的调用华为手机的AI能力。而Prisma也是华为HiAI平台的一个开发者。



为了体验第三方APP在华为手机AI能力加持下效果如何,我们特意找了一位清新脱俗的妹子作为模特,随意站在办公室一角拍了一张照片,光线、背景、构图什么的都不考虑。然后调用Prisma图片处理功能,选择了图中的两种渲染效果,经过大概近3秒的处理,就自动生成了图中后面两张渲染照片,是不是随手拍的照片瞬间就有了艺术风格。


而在艺术图片生成的背后,首先需要软件对照片进行感知,识别出前后不同的物体、人像、背景,然后对不同的部门进行艺术风格的渲染,这背后需要大量的算力的支持,以及AI算法对不同物体尤其是人像的识别、边框的界定。而华为麒麟970 AI芯片中搭载的NPU(神经网络处理单元)的计算速度比CPU快了25倍,同时还将能耗效率提高50倍,无疑这为Prisma提供了强有力的算力支持。


算力加持的效果就是Prisma的图片处理速度更快,效果也更好,用户可以在更短的时间获得艺术风格渲染的照片,而不会出现处理速度过慢、卡顿等情况,从而增强手机与APP的用户体验。



有趣的是,一份Prisma在华为P20手机与iPhone X中处理耗时的对比图可以看出,华为P20处理时间为3.2秒,而iPhone X则需要9.6秒,这无疑显示出华为手机AI能力在第三方软件层面的体现。


结语:三方软件体验看华为手机AI能力


通过华为手机中系统层软件物体识别、自有APP微软翻译、第三方APP Prisma图片处理工具三方软件的体验,我们可以看到在华为AI芯片、AI算法等能力的加持下,无论是华为自有的软件还是第三方的软件都可以提升AI的处理能力,增强用户体验。


随着华为将AI的能力以HiAI平台的形式开放给第三方开发者,开发者也可以调用华为AI的能力来增强自身软件算法的处理速度,进而提升自身软件的体验。

推荐阅读

史海拾趣

ABB公司的发展小趣事

ABB公司是一家全球性的工程技术公司,提供电力和自动化技术解决方案。以下是该公司发展的五个相关故事:

  1. 公司成立和早期发展: ABB公司成立于1883年,最初名为“Brown, Boveri & Cie”,总部位于瑞士苏黎世。公司的创始人是查尔斯·布朗和沃尔夫冈·鲍弗里。在早期,ABB专注于电力系统和电机的研发与制造,为当时的工业革命提供了关键的技术支持。

  2. 国际化战略和全球扩张: 随着技术的进步和市场的变化,ABB积极推动国际化战略,加速在全球范围内的扩张。公司通过收购和合并,逐步建立了全球化的生产和销售网络。截至2022年,ABB已在100多个国家设有分支机构和办事处。

  3. 技术创新和产品多样化: ABB一直致力于技术创新,不断推出新产品和解决方案,以满足不同行业和领域的需求。公司在电力输送、工业自动化、机器人技术等方面处于行业领先地位,为客户提供了全面的电力和自动化解决方案。

  4. 可持续发展和环保责任: ABB积极推动可持续发展和环保责任,在产品设计、生产和运营过程中注重减少能源消耗和减排,促进清洁能源的应用和利用。公司致力于推动能源效率和环境保护,为全球可持续发展做出贡献。

  5. 未来展望和发展方向: ABB将继续致力于技术创新和市场拓展,加强在电力和自动化领域的领先地位。公司将加大在数字化技术和人工智能领域的投入,推动工业智能化和数字化转型,为客户提供更智能、更高效的解决方案。

Alorium Technology公司的发展小趣事

Alorium Technology是一家总部位于美国俄亥俄州的公司,致力于提供用于嵌入式系统的可编程硬件和软件解决方案。以下是Alorium Technology公司发展的相关故事:

  1. 创立和初期发展: Alorium Technology公司成立于2013年,由Jeff Waters博士和John Dey共同创立。公司最初的目标是开发基于FPGA(可编程门阵列)技术的解决方案,用于提高嵌入式系统的性能和灵活性。通过创始团队的技术专长和市场洞察力,公司迅速吸引了投资者的注意,并在成立后不久获得了初步资金支持。

  2. FPGA技术应用: Alorium Technology专注于开发基于FPGA的解决方案,以解决嵌入式系统中的性能和灵活性挑战。他们开发了一系列产品,包括FPGA模块、开发工具和软件库,为客户提供了简化的嵌入式系统设计和开发流程。这些产品广泛应用于工业控制、物联网、机器人技术和自动化系统等领域。

  3. 发展合作伙伴关系: 随着业务的不断发展,Alorium Technology开始与其他公司建立合作伙伴关系,以扩大其产品在市场上的影响力。他们与传感器制造商、嵌入式系统开发者和工业自动化公司等合作,共同推动技术创新,并开发定制化的解决方案,以满足不同行业的需求。

  4. 不断创新: Alorium Technology不断进行技术创新,推出新的产品和解决方案,以适应不断变化的市场需求。他们持续改进现有产品的性能和功能,并不断探索新的应用领域。公司在FPGA技术的基础上,积极探索人工智能、边缘计算和机器学习等新兴领域,为客户提供更多选择。

  5. 社区参与和知识分享: Alorium Technology积极参与嵌入式系统开发社区,并通过各种途径分享知识和经验。他们举办在线研讨会、技术培训课程和技术博客,与客户和合作伙伴分享最新的技术趋势和解决方案案例。同时,公司也积极参与行业展会和活动,与同行业交流经验,拓展业务网络。

以上是Alorium Technology公司发展的相关故事,展示了他们在嵌入式系统领域的创新和成就。

Extech公司的发展小趣事

随着制造业信息化的发展,企业对信息化解决方案的需求日益迫切。为了满足客户的需求,Extech公司在2003年相继推出了XTMES、XTPLM等产品,并在国内首次提出了“一体化解决方案”的概念。这一解决方案覆盖了制造业信息化的各个环节,为客户提供了全方位的信息化服务。通过这一解决方案的推出,Extech公司在制造业信息化领域进一步扩大了自己的市场份额。

General Cable公司的发展小趣事
根据应用需求,将YN5103的数据和控制引脚连接到相应的输入或输出设备。例如,数据引脚可能连接到微控制器或其他数据源,控制引脚可能用于接收外部控制信号。
Displaytech公司的发展小趣事

2008年,Displaytech推出了HDP Power,这是一项创新的电力解决方案,旨在支持公司客户的电力需求。这一举措不仅体现了Displaytech对客户需求的深刻洞察,也展示了公司在电源领域的技术实力。

Bud Industries公司的发展小趣事

2012年,Displaytech进行了公司重组,SEACOMP成为公司各部门的主要实体。这次重组不仅优化了公司的组织架构,也进一步整合了公司的资源,提高了运营效率。同时,公司还在中国东莞购买了一家制造工厂,命名为MH MFG,加强了电子合同制造部门的力量。

这些故事只是Displaytech公司发展历程中的一部分,但它们充分展示了公司在电子行业中的实力、创新精神和国际化视野。通过不断的技术创新、产品升级和市场拓展,Displaytech已经成为电子行业中一家具有影响力的企业。

问答坊 | AI 解惑

linux与wince最根本的区别是什么-扫盲

让我们逐条分析评价Linux和WinCE/Windows的优缺点。 1.支持多种硬件平台由于嵌入式设备硬件平台的多样性,CPU芯片的快速更新,嵌入式操作系统要求支持常用的嵌入式CPU,如X86, ARM, MIPS, POWERPC等,并具有良好的可移植性。另外还需要支持种类繁 ...…

查看全部问答>

C64X DSP EDMA小结及实例详解(ZZ)

C64X DSP EDMA小结 (1)EDMA概要          ①EDMA数据传输有两种发起方式:          CPU发起的EMDA数据传输(非同步方式):需要传输时,CPU设置ESR寄存器的相应位为1 ...…

查看全部问答>

C51键盘程序

各位有知道   键盘程序中  if ((P1&0xf0)!=0xf0)        ;scancode = 0xfe;                         while((scancode&0x10)!=0)  & ...…

查看全部问答>

杭州汇文怎么样?

杭州汇文怎么样?能学到很多有用的东西吗? 还是骗人的啊…

查看全部问答>

关于串口的一个小问题

#include #define uchar unsigned  char #define uint  unsigned  int unsigned char a        ,flag,i; void init() {    TMOD=0X20;    TH1=0XFD;     ...…

查看全部问答>

关于SLE4442读写问题:

关于SLE4442读写问题:     我用初始密码0XFF 0XFF  0XFF,效验成功,  读加密存储器器数据为7000FFFF ,         修改密码,0XF1 0XF1  0XF1,效验失败, 读加密存储器器数据为 ...…

查看全部问答>

WINCE60上的挂起与唤醒功能怎么做啊?有没做过的人啊?能不能通过触摸屏点击唤醒系统?

WINCE60上的挂起与唤醒功能怎么做啊?有没做过的人啊?能不能通过触摸屏点击唤醒系统?…

查看全部问答>

PCIe DMA、Nand Flash、DRAM、RocketIO/SRIO、SERDES

NAND FLASH Controller IP Core标准NAND FLASH Controller标准NAND FLASH控制器 我是一位在职者(北京),专业从事FPGA接口设计,有较多的空余时间,对FPGA有比较丰富的项目经验(6年)。熟练使用Xilinx/Altera FPGA,熟悉NAND FLASH接口时序 ...…

查看全部问答>

MSP430寄存器如何记

我们知道一款功能强大的单片机会有众多的寄存器来操作这些强大的外设和内部设备,430也是如此,因为强大所以内部结构复杂,所以TI给每个外设起名字的时候已经考虑到这些问题了,实际上所有的单片机设计商都在头文件里给寄存器起了易于记忆的名字, ...…

查看全部问答>