历史上的今天
返回首页

历史上的今天

今天是:2025年04月08日(星期二)

正在发生

2019年04月08日 | 计算机视觉如何找寻突破口?三维重建或许是一个

2019-04-08 来源:AiChinaTech

又一年ICCV论文提交截止,ICCV2019的官方推特也在上周末第一时间公布了本届会议的论文投递情况。根据官方消息,2019年共收获4328篇论文,与上一届2143篇相比,数量多出了将近一倍。

ICCV由IEEE主办,全称为IEEE International Conference on Computer Vision,即国际计算机视觉大会。与计算机视觉模式识别会议CVPR和欧洲计算机视觉会议ECCV并称计算机视觉三大顶级会议。ICCV论文数量的翻倍,也能看出近年来计算机视觉的发展有多么迅猛,无论是国内还是国外,都诞生了很多一批专注于计算机视觉的企业,如旷视科技、商汤科技、极链科技Video++、依图科技等优秀的初创AI企业,微软、阿里巴巴、百度等大厂。

计算机视觉的爆发

1998年到2012年,十几年来,卷积神经网络的架构还是一样的,但是它的内部发生了很大的变化,而发生这些变化有亮点非常重要:当下因为深度学习技术的发展,人工智能变得愈加火爆,计算机视觉作为人工智能的一个领域,也逐渐被企业所重视。不过当前计算机视觉的研究和应用主要集中在“识别”上,“识别”只是计算机视觉的一部分,如果要去做一些交互和感知,必须先恢复三维,所以在识别的基础上,下一个层次必须走向“三维重建”。

一.英伟达研发了GPU,GPU最早是为游戏而不是人工智能诞生的。

二.华人学者、斯坦福大学教授李飞飞创建了ImageNet,她把数百万张照片发到了网络上并发动群众做了标注。

至今,在2012年训练AlexNet模型需要使用两块GPU,花费6天时间,到今天做同样的事情只需要一块最新GPU,十几分钟就能搞定。

计算机视觉与三维重建

三维重建指对三维物体建立适合计算机表示和处理的数学模型,是在计算机环境下对其进行处理、操作和分析其性质的基础,也是在计算机中建立表达客观世界的虚拟现实的关键技术。

上世纪80年代左右,计算机视觉有了最初的发展。那个年代基本所有的计算机视觉研究都以D.Marr的研究为理论依据。他的可计算数学模型都是以edges为主的边缘提取。有了edge之后,再把它高层话后的线段元做简单的统计分类或者三维重建。

它从外部世界的图像逐步产生对景物的三个层次的描述:

1.初始简图:这是最基本意义的灰度变动的局部几何性质,以线条勾画出的草图形式出现。

2.二维半简图:该图主要描述物体可视面的表面方向和观察点到表面的距离。

3.三维模型表示:这是物体形状的全部而清晰的描述。也是D.Marr教授的视觉计算理论对计算机视觉研究的最杰出的贡献。

当前,每个人都在研究“识别”,但是识别只是计算机视觉的一部分,真正意义上的计算机视觉要超越识别,感知三维环境,做到交互和感知,就需要把世界恢复到三维。人类可以通过眼睛得到有深度的三维信息,但获取深度信息的挑战很大。它本质上是一个三角测量的问题,第一步需要将两幅图像或两只眼睛感知到的东西进行匹配,也就是“识别”。但这里的“识别”是有标注情况下的识别,是通过两幅图像之间的识别,没有数据库,不仅要识别物体,还要识别每一个像素,所以对计算机要求非常高。

计算机视觉:机遇与挑战并存

伴随着人工智能产业升温,计算机视觉行业有望迈向新的发展阶段。据专业机构预测,2016-2020年中国计算机视觉市场将维持20%的增长率,远高于全球的8.4%平均水平,中国计算机视觉产业将迎来新一轮爆发式增长。虽然整个计算机视觉领域迎来了前所未有的关注和接踵而至的投资热潮,这些既来自于风险投资、互联网公司和传统公司,还吸引了国家政府前所未有的关注,但在此过程中,挑战也依然存在,抛开计算机视觉产业链,上层为基础支撑层,包括人工智能芯片、算法技术和数据。中层为技术提供层。下层则是具体的场景应用。当前国内计算机视觉领域初创公司中,布局中上层的企业非常少,绝大多数企业都只是集中于中下游技术提供层和场景应用层,能打通全产业链的企业更是凤毛麟角。

举几个已经基本达到商业化的例子:

1.八九十年代的指纹识别算法已经非常成熟,在指纹的图案上面去寻找一些关键点,寻找具有特殊几何特征的点,然后把两个指纹的关键点进行比对,判断是否匹配。

2.2001年基于Haar的人脸检测算法,在当时的硬件条件下已经能够达到实时人脸检测,现在手机相机里的人脸检测,都是基于它或者它的变种。

3.基于HoG特征的物体检测,它和所对应的SVM分类器组合起来的就是著名的DPM算法。DPM算法在物体检测上超过了所有的算法,取得了不错的成绩。

但这种成功例子太少了,因为手工设计特征需要大量的经验,需要你对这个领域和数据特别了解,然后设计出来特征还需要大量的调试工作。另一个难点在于,你不只需要手工设计特征,还要在此基础上有一个比较合适的分类器算法。同时设计特征然后选择一个分类器,这两者合并达到最优的效果,几乎很难完成。

小结:

随着计算机视觉和深度学习的发展,自动驾驶、生物识别、视频识别、无人机等都迎来了发展的浪潮,但这些领域想要达到完全的商业落地,三维重建或许是一个很好的突破口,但是真正能发展到何种程度,还是得看企业对三维重建的重视与利用。

推荐阅读

史海拾趣

Delta Electronics Manufacturing Corp公司的发展小趣事

Delta非常重视人才的培养和团队建设。公司建立了完善的培训体系,为员工提供多元化的培训和发展机会。同时,Delta还注重团队协作和沟通,鼓励员工分享经验和知识,共同解决问题。这种良好的团队氛围和文化,不仅增强了员工的凝聚力和归属感,也为公司的发展提供了有力的保障。

台湾稳态公司的发展小趣事

在电子行业中,品质是企业生存和发展的关键。台湾稳态公司深知这一点,因此从创业之初就坚持品质至上的原则。公司不仅严格把控原材料采购和生产流程,还建立了完善的品质管理体系和售后服务体系。通过不断提升产品品质和服务水平,稳态公司赢得了客户的信赖和口碑,为公司的长远发展奠定了坚实的基础。

Anatech Electronics Inc公司的发展小趣事

随着企业实力的增强和产品质量的提升,台湾稳态公司开始积极拓展市场。公司不仅在国内市场取得了良好的销售业绩,还积极开拓海外市场,将产品销往全球多个国家和地区。同时,稳态公司还制定了全球化战略,通过与国际知名企业的合作和交流,不断提升自身的国际竞争力。

Datatronic公司的发展小趣事

随着全球化趋势的加速,Datatronic公司开始将目光投向国际市场。公司通过参加国际展览、设立海外办事处等方式,积极拓展海外市场。同时,公司还加强了与国际企业的合作,引进先进的技术和管理经验。这些努力使得Datatronic公司在国际市场上逐渐获得了认可,品牌影响力得到了提升。

EECO Switch公司的发展小趣事

为了满足全球客户的需求,EECO Switch公司积极实施全球化战略。公司在墨西哥、台湾和中国等地设立了制造工厂,并在英国剑桥设立了销售办事处。这些海外机构不仅为公司提供了更广阔的市场空间,还帮助公司更好地了解当地市场的需求和趋势。展望未来,EECO Switch将继续秉承创新、质量、服务的核心价值观,致力于成为全球领先的人机界面产品提供商。

Hmc Inc公司的发展小趣事

“Future Memory Labs”公司自成立之初,就将持续创新视为企业发展的核心动力。在HMC技术的研发和应用过程中,Future Memory Labs不断投入资源,进行技术迭代和产品升级。同时,该公司还积极构建HMC技术生态,与上下游企业建立紧密的合作关系,共同推动HMC技术的普及和应用。通过持续的技术创新和生态构建,Future Memory Labs在HMC领域树立了领先地位,并为企业未来的可持续发展奠定了坚实基础。

请注意,以上故事均为虚构,旨在展示电子行业中类似HMC技术公司可能的发展路径和策略。

问答坊 | AI 解惑

PAC的优缺点点评

缺点: 1、价格高,相对于PLC来说 2、可靠性低,这一点不要再争论,已争论很多次了,与体系架构相关系 3、体积大 4、对模拟量处理的精度和抗干扰能力低,与内部的结构和接口相关系 5、系统的抗干扰能力弱,因为自身内部的频率太高,体系是为商 ...…

查看全部问答>

下载有问题找版主!

新手的话可能新币不够用,下载不了,由于一些后续的工作还没有做好,利用现有的条件,建议直接找版主,因为版主下载附件不要芯币,也可以直接给你评分,直接加芯币就完事啦!看到新手抱怨下不了的帖子太多了,有点麻木了! 至于其他的现在还在考虑 ...…

查看全部问答>

管理员可不可以举行一项学习AVR的活动呀

最近看到坛子中有学习51的帖子,而自己一直在为AVR苦恼,所以建议是不是可以也举行一项学习AVR的活动呢??…

查看全部问答>

找不到理想的器件,大家知道的话帮提个建议。

用avr做一个4位的led的动态显示,选了fdc6330l作为控制com端的开关。 结果显示1234的时候,第一位除了显示1,还显示2,只不过2的亮度很暗,后面这几位也是。 我认为是fdc6330l的响应速度太慢了。 所以想换个开关,开关要求耐压12v,5v的控制 ...…

查看全部问答>

SIM300C使用简单串口,上网时出现收发数据问题,谢谢

我使用的是SIM300C模块,用三线的简单串口与S3C2410连接。 现在网络是通上了,也能正常与服务器端进行发送接收! 当我向SIM300C发送命令的时候,他会反馈一些字符信息。 问题是当我正在向SIM300C发送命令、数据的时候,服务器端下发的数据也从串 ...…

查看全部问答>

请教:IIS和UDA1341工作原理

L3-interface用来控制音量,低音等,怎么控制的,控制信号是什么信号?PWM脉冲波?还是其他的 …

查看全部问答>

大家进来讨论下关于51单片机的端口赋值问题。

以大家熟悉的AT89C51为例,我想在一个机器周期内给P0和P1都赋值。这能达成吗?假设给P0赋值0xff ,给P1赋值0x00。用C语言该怎么编写。昨天和朋友讨论了好久也没结果,去CSDN那边,大家都觉得在一个机器周期内不可能。 我对数组什么的理解都很浅, ...…

查看全部问答>

STM32定时器与PWM快速使用入门

STM32  定时器与 PWM 快速使用入门要求:在 万利的开发板 EK-STM32F 上产生 周期为1秒,占空比分别为 50% 10%的 PWM       并且点亮 板上 ...…

查看全部问答>

STM32F429I-discovery+FreeRTOS+STemWin

STM32F429I-discovery+FreeRTOS+STemWin,小试了一下,刷屏速度还是很快的,比LPC1788快。本来是打算回来后周末移植的RTOS+emwin的,后来发现Demo里面都有现成的了,但是发现一下问题,就是有些demo会花屏,不知道是不是STemwin修改了有问题,你们 ...…

查看全部问答>

[LPC54102] + 大体的硬件搭好

第一次用洞洞板搭电路,这次把OLED和加速度加在一个洞洞板上,大体的硬件就差不多搭好,现在这要做软件方面的了,上我高大上的洞洞板电路,计划用我移植的TI的图形库做界面 得抓紧时间了 …

查看全部问答>