历史上的今天
返回首页

历史上的今天

今天是:2025年03月08日(星期六)

2018年03月08日 | 眼擎科技如何为AI机器打造超级视觉?

2018-03-08 来源:eefocus

去年以来,人工智能从技术走向应用,从云端走向终端。随之而来的是各类公司对各个应用场景的挖掘。为了满足人工智能终端设备对计算的需求,人工智能芯片趁势兴起。

 

当前,人工智能主流的应用仍是围绕图像做文章,尤其对于自动驾驶,通过摄像头看懂、看清周围环境的能力异常重要。但图像质量恰恰是其中的一个痛点——现有的摄像头对光线环境的适应力太差,远不如人眼,输出的低质量图像数据严重制约了AI算法的能力发挥。

 

但在四年之前,就有一家公司成立,力图解决这个问题。日前,智东西造访眼擎科技,与GTIC 2018重磅嘉宾——眼擎科技创始人兼CEO朱继志进行深度对话,了解了这家公司4年来在技术上的修行,以及其成像引擎将对AI应用所起到的价值。

 

一、技术研发:耗时四年打磨 目标超越人眼

北大电子系毕业的朱继志在成立眼擎科技之前,先任职于中兴视讯通讯部。在这段为期十年的工作经历中,朱继志负责视频图像的技术开发工作以及技术的产品化,对技术与产品的双重经验让他成为了图像处理这个行业的老江湖。

 

后来,朱继志又投身芯片行业,担任国内最大芯片分销商副总裁,在8年的时间里对接手机、家电、汽车等对芯片有大量需求的行业,也摸透了芯片的产品开发逻辑与下游行业的不同需求。

 

这两段经验日后被捏合,成就了现在的眼擎科技。

 

2014年,对图像处理行业仍保持高度关注的朱继志看到了一个机会——人们日常生活中的相机实在是太过孱弱:逆光、暗光、强光、多光源,任意一种复杂光线情况,都会让相机输出的图片不忍直视,不是暗部一团黑就是亮部一片白,再加上各种颜色失真、噪点爆表,与人眼所见相去甚远。而在数码摄影诞生的数十年里,尽管成像的关键元器件——CMOS图像传感器(此前也流行CCD,但已退出主流市场)一直保持着迭代,但直到今天,这些问题都没有得到有效解决。

 

当年,朱继志主导成立了眼擎科技,英文取名“eyemore”,意在使其产品的成像能力对标乃至赶超人眼。

 

朱继志认为,现有的成像系统对光线适应能力差与产业链上游的日系厂商主导的全局成像路径有很大的关系。而朱继志对此的解法是——分区域、分层成像,即将成像对象分解为大量的小格子,用自研的成像算法对每个格子中的数字信号进行分别计算,使得每个小格子中的图像都输出最好的成像效果。

 

原理听上去不难理解,公司成立的第一年,朱继志带领团队打造了一个原型,经过验证,技术可行。当年,眼擎拿到了来自柔宇科技投资人杨向阳的天使投资。

 

但事情远没有那么简单。成像算法是一个牵一发而动全身的事情,或许只是为了调整了一个暗部的亮度,整张图片的亮度就同时生变。要使成像算法能够应对各种光线条件,就需要针对一个个场景进行具体的调参。比如自动驾驶车进隧道时,光源会从自然光瞬间变成人造光,光线强度也会经历强—弱—中这样的快速变动,此时摄像头稳定输出明亮、清晰图像的能力将大受挑战。

 

要应对这种情况,只能去隧道实地测试,一遍遍地优化应对这种场景的算法。而不同的场景,还有很多, 这件事花了眼擎团队三年。

 

同时,为了满足更复杂成像架构带来的巨大运算需求,眼擎还打造了一个独立ISP(Image Signal Processor,图像信号处理器),来承载眼擎自研的算法。

 

二、产品落地:芯片承载成像引擎 为AI机器打造视觉器官

到2017年,眼擎的成像方案初步成熟,接下来该进入产品化的阶段。

 

在进行技术开发的几年中,眼擎曾面向消费者市场推出过Demo类的产品进行探索。但朱继志很快发现普通消费者对成像效果的喜好似乎是个玄学——人们根据不同的需求,对图像质量的评判各有一套主观的标准。或许某些人希望自己能被拍得更白,某些人则希望图像里的色彩更艳。眼擎准确输出图像中各种物体色彩、纹理、材质细节的能力,在这种情况下并没有形成优势。

 

不过这几年暴涨的机器视觉市场为眼擎提供了更大的机会。无论是手机上的人脸识别、还是安防、或是自动驾驶,对运行人工智能算法的机器来说,它们需要的都是客观、准确、清晰的图像数据,这正是眼擎的强项。

 

找准To B的市场,眼擎的产品应运而生——eyemore X42成像芯片。这块成像引擎芯片凝聚了眼擎创业四年的成果,针对超过500种不同场景封装了二十余种智能成像算法。同时,由于采用全新的成像架构,其单像素的计算能力比封装在SoC上的集成ISP提升了20倍。这块芯片有着推动机器视觉再向前一步的力量,而朱继志也喜欢把它称为成像引擎。

 

 

这些参数的背后,是它面对复杂光线实打实的高素质成像能力。在智东西实际体验的弱光成像演示中,搭载了眼擎成像引擎方案的摄像头在室内只有一台电脑显示屏作为光源的条件下,呈现出了明亮、清晰、色彩还原度相当高的图像,而手机在这种场景中为了拍出明亮的电脑显示屏,已经完全放弃了暗部的成像。而人眼在这样的照度下,也早已无法分辨物体的色彩。

 

▲上图为暗光环境下eyemore成像效果 下图为正常光线条件下现场图片

 

 

在不依靠红外光等主动照明的情况下,眼擎的的确确实现了弱光环境下对人眼的超越。在朱继志看来,这非常关键。

 

他很认同马斯克在自动驾驶上的一个看法——“激光雷达是自动驾驶的拐杖。”朱继志认为激光雷达之所以在自动驾驶中如此受欢迎,正是摄像头的被动光学成像没有将潜力发挥到极致,才需要激光雷达这样的主动光学成像系统。但一旦摄像头能在更复杂的情况下看得比人清楚、比人看到更多的色彩,那么人工智能会有更加优质的图像数据可用,能够进一步发挥其在识别物体、感知环境上的能力。

 

毕竟,人类依靠双眼已经能够很好地完成驾驶任务。比人眼更加优秀的成像系统,不仅将使自动驾驶变得更加容易,也能够运用在其他场景中。

 

不过,朱继志认为这还不够。因为人眼拥有的超强视觉能力,并不只在于拥有多么优秀的光学系统,更重要的是,它通过神经与大脑无时不刻地进行着交互,通过聚焦的形式屏蔽不重要的信息,将注意力放在真正关键的视觉区域和物体上。

 

要达到真正的智能,处在成像步骤前端的眼擎,需要和后端的AI进行交互,了解AI真正需要什么。于是,眼擎的团队又为成像引擎设计了一套与后端AI算法的交互架构,来获知AI对图像的需求。在必要的时候,这套设计可以像人眼的聚焦一样,将计算资源集中起来,对AI关心的某一帧图像或者图像中的某个区域进行更高质量的成像。

 

朱继志称,这种与AI系统的交互能力,将使得成像系统真正成为AI的有机器官。

 

三、商业定位:做技术方案商 已找到四大应用场景

在eyemore X42成像芯片的量产提上日后后,2018年,眼擎的工作重点开始变为将技术运用到各类终端产品。

 

这时候,朱继志在芯片行业的经验开始进一步发挥作用。目前,眼擎为其技术先确立了六大应用场景:自动驾驶(汽车)、手机、安防、工业检测、机器人、无人零售。这其中大部分,都是朱继志曾经接触过的下游。

 

在商业模式上,朱继志想得很清楚,这些行业都有不低的进入门槛,有些早已巨头林立,因此眼擎选择的方式是赋能——定位上游的技术方案商,向下游打造终端产品的公司输出自己的成像能力。

 

 

为了让成像引擎这个新生儿更好地被合作伙伴们验证、接受,在eyemore X42这枚ASIC芯片量产之前,眼擎就用FPGA打造了开发工具套件,供下游公司试用,也借此收集反馈意见。

 

到eyemore X42量产时,眼擎又提供不同能力的API接口,降低下游的开发难度。

 

目前,眼擎已经与电商行业的公司合作,打造出了一款智能3D扫描仪。在这台单目的深度相机上,眼擎提供了单次曝光同时呈现亮部、暗部细节,以及准确输出商品色彩、纹理的能力。

 

今年,眼擎正在和超过20家来自不同行业的公司合作,让eyemore X42成像芯片进入各类终端产品中。在自动驾驶这个场景,眼擎的合作伙伴不乏自动驾驶的头部明星公司。今年五月,眼擎将针对这一市场推出超宽动态辅助驾驶视觉成像方案,视觉动态范围超过100dB,并且满足车规要求。

 

 

而面向不同行业的具体需求(比如汽车行业的芯片需要过车规),眼擎也将采取IP授权的形式,让相关行业的公司来对芯片进行针对性的开发、生产。

 

结语:从底层抢占人工智能时代的视觉入口

在近两年的人工智能发展高潮中,以后端为主的人工智能算法公司层出不穷,并率先获得广泛关注。AI视觉算法公司,在其中占据了大头。

 

而随着AI的概念逐渐明晰、产业进一步发展,人工智能越来越快地走向落地、走向普通人的日常生活、从云端走向终端。这时候,承载软件算法的计算硬件重要性凸显出来。

 

而回过头看,由于硬件的高门槛,有勇气踏入这个方向并耐得住数年寂寞研发技术的公司并不多。

 

从底层入手,花四年打磨技术的眼擎,已经在产业链中占住了一个空当,分食越来越大的AI视觉蛋糕。


推荐阅读

史海拾趣

ELEKTRO-PLAST NASIELSK公司的发展小趣事

ELEKTRO-PLAST NASIELSK公司成立于上世纪九十年代,当时正值电子行业蓬勃发展的时期。创始人敏锐地察觉到塑料材料在电子元器件制造中的潜力,决定专注于研发和生产塑料外壳的电子元器件。然而,初创时期面临资金紧张、技术瓶颈和市场接受度低的挑战。创始人通过不懈努力,成功研发出具有竞争力的产品,并通过参加行业展会和建立合作伙伴关系,逐渐打开了市场。

Asia Pacific Microsystems Inc公司的发展小趣事

APM深知在电子行业中,单打独斗很难取得长远的发展。因此,公司开始积极寻求与上下游企业的合作,共同构建完整的产业链。通过与原材料供应商、代工厂商以及终端客户的紧密合作,APM实现了产业链的整合与协同发展。这不仅降低了公司的运营成本,还提高了产品的质量和生产效率,为公司的持续发展奠定了坚实基础。

Dover Corporation公司的发展小趣事

Dover Corporation的电梯业务始于1955年,当时Dover Elevator从Rotary Lift中分离出来,成为一家独立运营的公司。此后,公司通过一系列的收购,如谢泼德华纳电梯公司、Acme Elevator等,迅速扩大了其电梯业务。这些收购不仅使Dover成为美国第三大电梯公司,也为其在电梯行业中的持续领先地位奠定了基础。

睿赫(crechip)公司的发展小趣事

作为一家有社会责任感的企业,睿赫公司始终关注环境保护和可持续发展。公司在产品研发和生产过程中,积极采用环保材料和绿色生产工艺,减少对环境的影响。同时,公司还积极参与公益事业,为社会做出了积极的贡献。

在可持续发展方面,睿赫公司致力于推动电子行业的绿色化和智能化发展。公司不断加强技术研发和创新,推出了一系列符合环保要求和高性能要求的产品,为电子行业的可持续发展做出了积极的贡献。

EOZ Secme公司的发展小趣事

EOZ Secme公司自创立之初,就致力于电子安全技术的研发。在2010年代初,随着物联网技术的兴起,EOZ Secme敏锐地捕捉到这一机遇,投入大量资源进行物联网安全技术的研发。经过数年的努力,公司成功开发出了一系列具有自主知识产权的物联网安全解决方案,并在市场上获得了广泛应用。这些技术的创新不仅提高了EOZ Secme的市场竞争力,也奠定了其在电子安全领域的领先地位。

CAMBION公司的发展小趣事

随着电子行业的快速发展和变革,CAMBION公司也面临着诸多挑战。例如,新兴技术的崛起使得市场竞争日益激烈,消费者对电子产品性能的要求也不断提高。为了应对这些变革,CAMBION公司不断调整战略,加大研发投入,推出了一系列具有竞争力的新产品。同时,公司还加强与上下游企业的合作,共同推动产业链的升级和发展。

问答坊 | AI 解惑

“首届中国研发管理高峰会” 欢迎您拨冗出席!11月22-24日,北京

本帖最后由 jameswangsynnex 于 2015-3-3 20:00 编辑 “首届中国研发管理高峰会”邀请函 2007年11月22-24日 北京 产品开发是21世纪的工业战场,正如制造业曾是20世纪70年代和80年代的工业战场一样。在市场需求不断变化、技术迅速更新的趋势之下 ...…

查看全部问答>

提高开关电源待机效率的方法

摘 要:要减小开关电源待机损耗,提高待机效率,首先要分析开关电源损耗的构成。根据损耗分析可知,切断启动电阻,降低开关频率,减小开关次数可减小待机损耗,提高待机效率。本文简要介绍提高开关电源待机效率的方法。   关键词:损耗 开关电源 ...…

查看全部问答>

关于自偏置电流源的电路结构

与电源电压无关的自偏置电流源的经典结构如下图1(Razavi.  pic 11.3)所示。请教高手:如果把下面的NMOS对管与电阻左右互换(图2)可以吗?会有什么问题呢?电路稳定性会受影响吗? 下载次数:131 2009-8-6 21:02 …

查看全部问答>

未来视频监控如何做 谈网络时代监控技术

目前,在视频图像监控领域,数字化、网络化、智能化已成为一种发展趋势,IP网络视频监控系统也逐步进入大规模商业应用阶段。熟悉远程监控的人都知道,将图像摄取后进行远程传输的主要方式除了互联网,还有光纤。有人认为,通过光端机和光纤进行远程 ...…

查看全部问答>

为什么没有支持MSTP的AP

寻遍各种设备,都没有支持MSTP的AP(桥接模式下要解决环路)。请问这是什么原因呢? H3C也只支持RSTP,其他的更不用说了 MSTP是和802.11有什么冲突吗? …

查看全部问答>

如何在对话框程序上显示视频

需要在一个基于对话框的程序上做一个类似选择菜单的界面。不同的选项对应一个小视频窗口,以便说明该选项的功能。 在没有操作的情况下还需要轮流全屏幕的播放各个视频。 因为视频格式没有要求,wmv,avi等等都可以,因为视频格式可以随意转换。 ...…

查看全部问答>

udp通信接收问题(附源码)

using System; using System.Collections.Generic; using System.Text; using System.Net; using System.Net.Sockets; namespace cejie {     class Program     {         static void Main ...…

查看全部问答>

请问:在ARM9环境中,EBOOT的中断如何挂接或开启?

我的开发环境:CPU是三星的ARM9(2410),RAM是64M,FLASH是64M EBOOT是通过NBOOT引导启动的,在NBOOT是可以接到中断的,可是为什么到EBOOT中就怎么也接不到了呢??? 小弟不明白,请各位大侠多多指点呀 …

查看全部问答>

vxworks组播数据无法接收

我按网络开发的例子编写程序,在同一子网内加入到组播地址,去无法接收组播信息,但可以接收广播信息和发送组播 不知有谁遇到过该问题,可否指点一二,不胜感激!!!!!!!!!!!!!(发送端是Win2000,接收端是VxWorks) …

查看全部问答>

WAVECOM模块Q2403 如何和单片机、PC机相连????请给思路和源代码,谢谢!!!!

求 arm下驱动WAVECOM模块Q2403的源代码,包括拨打电话,发短信,串口 哪位仁兄能帮我一下!!!!!!!!!!! WAVECOM模块Q2403 如何和单片机、PC机相连????请给思路和源代码,谢谢!!!!…

查看全部问答>