历史上的今天
返回首页

历史上的今天

今天是:2024年11月06日(星期三)

正在发生

2020年11月06日 | CNN将赋予CMOS图像传感器更多的智慧

2020-11-06 来源:EEWORLD

视觉传感器正在日益成为数据采集的重要边缘设备。最初用于摄影应用的简单图像传感器,今天也将服务于人工智能和机器学习系统的高质量输入。这些系统利用新的和创新的处理器架构已经成为复杂的决策实体。

 

 

边缘数据采集

 

虽然边缘数据采集设备在本质上主要是模拟的,图像传感器的独特住处在于:

 

输出通过连续的动态光输入进行时间多路复用;

需要有能力维持转换光输入的完整性,同时处理,以交付图像输出;

输出的图像质量最佳,可进行有意义的处理;

这些需求和随后的结果可能会对视觉系统所做决策的准确性产生重大影响,而视觉系统的决策结果决定了整个自动化系统的安全性、可靠性和盈利能力;

 

基于机器学习的视觉系统

 

机器学习的出现推动了图像传感器的创新,并提高了性能水平,这是为了支持各种应用程序。你所看到输入到系统中的数据是通过视觉输入的高保真度数据。如今,人工智能算法能够检测、识别和分类这些输入,并生成准确的决策输出。这些输出的可靠性取决于输入的质量,也取决于它们的算法的准确性,以及用于处理这些算法的神经网络。

 

基于机器学习和深度学习的视觉系统主要使用卷积神经网络(CNN)算法来创建一个强大的自动识别的专用系统。增加CNN的深度层可以提高推理精度, 但更多的层也会对这些网络在训练阶段的学习时间以及系统中完成推断的延迟产生不利影响。同样,高质量的图像输出使视觉系统能够携带最小的CNN层集,同时产生高度准确的推断。这在获得一个快速部署的智能系统方面带来了显著的好处,同时提供高性能和低功耗。

 

CNN如何看懂图像

 

图像分类是对输入图像的操作,最终输出一组最好地描述了图像内容的分类(如猫、狗等)或分类的概率。对人类来说,识别是打出生便开始学习的技能之一,对成人来说更是信手拈来,毫不费力。我们只需一眼便能快速识别我们所处的环境以及环绕在我们身边的物体。当我们看到一张图片或是环看四周的时候,无需刻意观察,多数时候也能立即描述出场景特征并标记出每一个对象。快速识别不同模式、根据早前知识进行归纳、以及适应不同的图像环境一直都是人类的专属技能,机器尚未享有。

 

当计算机看到一张图像(输入一张图像)时,它看的是一大堆像素值。根据图片的分辨率和尺寸,它将看到一个 32 x 32 x 3 的数组(3 指代的是 RGB 值)。为了讲清楚这一点,假设我们有一张 JPG 格式的 480 x 480 大小的彩色图片,那么它对应的数组就有 480 x 480 x 3 个元素。其中每个数字的值从 0 到 255 不等,其描述了对应那一点的像素灰度。当我们人类对图像进行分类时,这些数字毫无用处,可它们却是计算机可获得的唯一输入。其中的思想是:当你提供给计算机这一数组后,它将输出描述该图像属于某一特定分类的概率的数字(比如:80% 是猫、15% 是狗、5% 是鸟)。

 

我们想要计算机做什么

 

现在我们知道了问题所在以及输入与输出,就该考虑如何处理了。我们想要计算机能够区分开所有提供给它的图片,以及搞清楚猫猫狗狗各自的特征。这也是我们人类的大脑中不自觉进行着的过程。当我们看到一幅狗的图片时,如果有诸如爪子或四条腿之类的明显特征,我们便能将它归类为狗。同样地,计算机也可以通过寻找诸如边缘和曲线之类的低级特点来分类图片,继而通过一系列卷积层级建构出更为抽象的概念。这是 CNN(卷积神经网络)工作方式的大体概述。

 

典型的卷积神经网络

 

 

像CNN这种深度学习算法是极其耗费资源的。现在有各种各样的处理引擎,有CPU、GPU、FPGA、专用加速器和最近的微控制器。设计一个基于CNN的视觉系统还需要强大的优化库的支持。这可以从专有的(如MVTec的HALCON & MERLIC, MATLAB的深度学习工具箱或Cognex ViDi)到标准工具(OpenCV)和软硬件的集成能力。这些选择直接关系到产品的上市时间。

 

See the source image

 

源密集型处理器通常需要更大的形式因素、散热附加组件(如散热器),或者只是大的空体积空间来通过对流散热。提供高质量输出的图像传感器可以消除对昂贵处理器、第三方库或创建新库的需求,以及优化软硬件资源所需的昂贵工具。换句话说,这些传感器极大地降低了总拥有成本(TCO),并增加了广泛应用程序和市场的采用。

 

图像传感器输入到机器学习系统

 

对于发送到CNN层级的图像传感器输出有相当多的要求,包括:

 

一个全局快门,能够捕捉场景,并保持最小化运动伪影

较高全局快门效率,确保每个像素中保留的场景不会被该像素光路以外的光输入损坏

足够的像素大小,以支持良好的图像质量,即使在挑战性的光照条件

低总噪声的图像输出,确保高完整性的输入

在运行和待机期间低功率,以满足对流换热是标准的相机系统的典型挑战。

 

 

这些特性依赖于像素结构和相关电子路径的设计。CMOS图像传感器(如AR0234CS)的结构和设计满足了这些需求,使其成为基于CNN的视觉系统的理想选择。

 

高速接口可实现快速系统

 

一个像素可能具有优秀的质量和完美的设计来生成高质量的图像,但是由于带宽限制,整个视觉系统可能仍然会受到性能差的影响。今天的传感器都配备了SerDes接口[1],但是这些接口流量数据的速度决定了整个系统的质量。

 

高帧速率要求这些接口以快速的速度传输图像数据。此外,传感器必须为每帧输出消耗低功率(fps/mW)。这些特性允许系统定时和电力预算转移到他们最需要的地方——处理引擎,并允许最先进的神经网络和复杂的算法进行合并。这使图像处理器能够提取图像数据中的细微差别,这些细微差别对于应用程序来说可能很重要。因此,视觉系统开发商可以区分他们的系统解决方案明显的竞争。

 

AR0234CS 2.3 Mp CMOS图像传感器

 

 

AR0234CS 230万像素CMOS图像传感器专为各种应用而设计,包括机器视觉摄像机、增强实境(AR)/虚拟实境(VR)/混合实境(MR)头显、自主移动机器人(AMR)和条码读取器。

 

AR0234CS捕获1080p视频和单帧图像,最高可以每秒120帧(fps)的速度运行。该230万像素传感器凭借其领先行业的快门效率,最小化高速场景中的帧与帧之间的失真,并减少其他图像传感器所遇到的运动伪像,从而生成清晰的图像。

 

 


[1] SERDES是英文SERializer(串行器)/DESerializer(解串器)的简称。它是一种主流的时分多路复用(TDM)、点对点(P2P)的串行通信技术。即在发送端多路低速并行信号被转换成高速串行信号,经过传输媒体(光缆或铜线),最后在接收端高速串行信号重新转换成低速并行信号。这种点对点的串行通信技术充分利用传输媒体的信道容量,减少所需的传输信道和器件引脚数目,提升信号的传输速度,从而大大降低通信成本。


推荐阅读

史海拾趣

永丰盈(CST)公司的发展小趣事

品质是CST的生命线。为了确保产品质量的稳定性和可靠性,公司建立了完善的质量管理体系,严格执行ISO9001质量体系及ISO14001环境体系。同时,公司还注重员工的培训和教育,提高员工的质量意识和操作技能。这些措施使得CST的产品质量得到了客户的广泛认可。

Hamlin ( Littelfuse )公司的发展小趣事

深圳市永丰盈电子有限公司(CST)成立于2003年,初始阶段,公司只有几名员工和几台设备,专注于电子接插件产品的生产与销售。在创始人坚定的信念和团队不懈的努力下,CST逐步在市场上崭露头角。公司秉持“诚信、踏实、齐心、努力”的经营理念,通过严格的质量控制和持续的技术创新,赢得了客户的信任。

ECS公司的发展小趣事

为了进一步扩大市场份额,ECS公司开始积极拓展全球市场。他们与全球各地的云服务提供商建立了紧密的合作关系,共同为客户提供更加全面、便捷的服务。同时,ECS公司还积极参加国际云计算展会和论坛,与国际同行交流经验和技术,不断提升自身的竞争力。通过这些努力,ECS公司的品牌知名度和市场份额得到了显著提升。

CWIND公司的发展小趣事

CWIND公司非常重视人才培养和团队建设。公司建立了完善的培训体系,为新员工提供全面的职业技能培训;同时,公司还鼓励员工参与各种技术交流和培训活动,提升自身的技术水平。在团队建设方面,CWIND注重营造积极向上的工作氛围和团队合作精神。通过定期举办团队建设活动和员工表彰大会等方式,公司成功打造了一支高效、协作、创新的团队。

Elite公司的发展小趣事

Elite公司成立于20世纪90年代末,由一群热衷于电子技术的年轻人创立。在初创阶段,Elite面临着资金短缺、市场竞争激烈的挑战。然而,公司凭借其独特的创新理念和过硬的技术实力,成功研发出一款具有高性价比的智能手机,迅速在市场上获得认可。这款产品不仅帮助Elite实现了初步盈利,更为公司后续发展奠定了坚实基础。

飞翼科技(FEIYI)公司的发展小趣事

进入21世纪后,电子行业迎来了新的发展机遇和挑战。面对行业内的激烈竞争和技术的快速迭代,Elite意识到必须加快转型升级步伐。公司开始涉足智能家居、物联网等新兴市场领域,并成功推出了一系列具有竞争力的产品。这些新产品不仅为公司带来了新的增长点,也进一步巩固了Elite在电子行业的领先地位。

问答坊 | AI 解惑

请问有人实现了wince6.0下的hive注册表吗?

我的wince6编译环境中,我发现在platform.reg和common.reg中都存在; HIVE BOOT SECTION标签,并且都有相同的内容,如下         \"SystemHive\"=\"\\\\NandFlash\\\\system.hv\"         \"ProfileDir\"= ...…

查看全部问答>

你心中最好的画图软件是哪个?

电子工程中画图软件太多了,哪个是你认为最好的?或者你最想学会的?…

查看全部问答>

FPGA怎样实现10倍频

在virtex-5中DCM的最低输入频率在32M,但是,要想实现10M到100M的倍频,应该怎样去做…

查看全部问答>

招聘硬件工程师

上海东现船舶设备有限公司招聘硬件工程师,要求如下:1. 精通模电,数电。2. 5年以上的硬件开发经验,有EMC经验更佳。3. 熟悉现场总线,如can总线。4. 熟悉arm且有项目经验。5. 有测控或仪器仪表行业经验有限考虑。工作地点:上海徐汇区。一经录用 ...…

查看全部问答>

【MSP430共享】基于微控制器 MS P 4 3 0的智能型电导率仪设计

阐述了一种智能型电导率仪的软硬件结构及工作原理。本设计综合应用了低功耗、 高性能的微控制器及外围芯片。整个系统具有测量精度高、 智能化处理、 操作方便、 功耗低、 稳定性好的特点。  [ 本帖最后由 鑫海宝贝 于 2011-10-12 09:17 编辑 ]…

查看全部问答>

手头有EKK-LM4F232 开发板的朋友动手试试看!

就出厂自带的例子 然后用手触摸PWR EN(PM6脚 这个过孔上面)这个过孔,看看有什么结果!…

查看全部问答>

uip_input()处理的是什么数据?

uip_input()处理的是什么数据?是帧数据?还是IP数据报啊?底层驱动发送或者接受数据到uip_buf中,是帧数据?还是IP数据报。。。帧头和帧尾是在哪儿处理的啊? uip_arp_ipin() 和uip_arp_out()啥用啊,哪位大侠帮帮忙啊,谢谢哈…

查看全部问答>

关于block ram的综合问题

我在代码里例化了3个block ram, 第一个128x144(width x depth),共18432bit(18k),综合出来却用了4个36k的block ram; 第二个128x36,共4608bit(4.5k),综合出来用了2个36k的block ram; 第三个32x96,共3072bit(3k),综合出来用了1个18k的bloc ...…

查看全部问答>

430驱动nokia5110LCD为什么有那么多的小黑点?

请问该怎么解决? 写满字就没有小黑点了! [ 本帖最后由 qinkaiabc 于 2013-8-12 15:42 编辑 ]…

查看全部问答>