历史上的今天
返回首页

历史上的今天

今天是:2024年11月01日(星期五)

正在发生

2019年11月01日 | 研究人员开发算法生成真实路标图像,可用于计算机视觉训练

2019-11-01 来源:盖世汽车网

汽车若要自动安全地在街道上行驶,就必须能够识别路标,即使是在夜晚、雨雪天气,或者在道路标志被苔藓、污物、杂草覆盖着苔藓的情况下。因此,自动驾驶汽车需要大量来自不同季节、一天中的不同时间和天气条件下的所有路标的样本。

据外媒报道,波鸿鲁尔大学神经计算学院(RUB Neural Computation Institute)的Sebastian Houben教授解释道,“为所有道路标志拍照将会非常耗时,尤其是有些标志相当罕见。”为此,Sebastian Houben与Dominic Spata和Daniela Horn合作,开发了自动生成交通标志的方法,可用于计算机视觉训练。

该项目初期使用了真实的路标图片。2011年,该团队拍摄了43个德国标准化路标的视频,研究人员将它们称为类(classes)。根据这些视频,他们从不同的角度生成了大约5万张独立的标志图像。总体而言,基于机器的过程比人类更善于识别这些图像中的标志。人类识别的正确率为98.8%,而图像识别软件的正确率为99.7%。Sebastian Houben表示,“我们希望开发算法,可学习生成道路标志图像,其他程序可以利用该算法训练其识别能力。”

为此,研究小组使用了两种算法。第一种算法是输入简单的官方道路标志的象形图,然后将它们转换成类似照片的图像。此外,该算法还必须能将输入的标志转换回原来的象形图。 Daniela Horn解释说,“我们防止算法将路标图像扭曲,从而与路标完全不同。”第二种算法必须判断第一种算法生成的图像是否是真实的照片。目标是确保第二种算法无法再分辨出它是什么。Sebastian Houben表示,“第二种算法向第一种算法表明,选择过程可能会变得更加困难。因此,这两种算法相当于练习对手。”

一开始,训练过程并不特别顺利。如果道路标志的图片颜色正确,并大致呈方形,就算成功。但该图片会不断完善。Daniela Horn解释道,“两三天后,我们会查看路标的图片。如果这些图片在人眼看来不好看,我们就会修改算法。”在图像识别软件方面,两种算法比人类表现更好。在使用数量相当的人工图像进行训练后,视觉计算机系统的表现仅比使用真实图像训练后的表现差10个百分点。

此外,研究小组正使用技巧,优化图像生成算法。研究人员解释道,“例如,由于图像识别算法很容易被愚弄,我们可以创造森林背景。”该团队通过改变原始象形图的背景颜色来解决这个问题。Sebastian Houben表示,“我们只能通过初始输入和修改算法来影响这一过程。这些算法随后做出的决定不受研究人员的控制,这也是AI的特点之一。”

推荐阅读

史海拾趣

Digital Core Design公司的发展小趣事

1988年,Core Design由Jeremy Heath-Smith创立,起初仅有8名员工和1万6千英镑的注册资金。这家新兴的游戏开发公司很快凭借其首款游戏《Rick Dangerous》在英国游戏市场崭露头角。这款游戏凭借其独特的游戏机制和引人入胜的故事情节,迅速登上英国游戏销量榜的榜首,并赢得了欧洲年度游戏奖,为Core Design的未来发展奠定了坚实的基础。

汇科公司的发展小趣事

与山东汇科电气技术有限公司不同,苏州汇科技术股份有限公司成立于2000年,是一家专业从事开发、设计、制造各式工业窑炉的技术型企业。公司位于江苏省常熟市辛庄工业开发区,凭借对技术的执着追求和对品质的严格把控,逐渐在行业中崭露头角。多年来,苏州汇科技术股份有限公司通过不断的技术创新和产品升级,赢得了客户的广泛认可和市场的信赖。

Gang Song Electronics Co Ltd公司的发展小趣事

GainSpan公司成立于行业技术日新月异的时代,专注于超低功耗WiFi系统芯片和模块的设计、开发和制造。其创始团队凭借对物联网(IoT)市场的敏锐洞察,认为低功耗技术将是未来智能家居、可穿戴设备和工业物联网等领域的关键。通过不断的技术研发,GainSpan逐渐在行业内建立了自己的技术优势,为后来的并购奠定了基础。

BUSSMANN公司的发展小趣事

1992年,Bussmann开始了第一款芯片保险丝的开发工作。这款保险丝将可熔性材料沉降到陶瓷基底上,大小只有3mm*1.5mm,可以通过自动装配机安装到印刷电路板上。这一创新不仅大大提高了熔断器的性能和可靠性,还降低了生产成本,为电子行业的发展注入了新的活力。

CAO Group Inc公司的发展小趣事

随着公司的发展壮大,CAO Group开始面临来自各方面的竞争压力,其中包括知识产权的争议。近期,公司针对其在美国注册的三项专利——Lumist美白贴、SPRAY BOTTLE HEAD喷雾瓶头和透明氟塑料,发起了维权行动。公司积极应对,通过法律手段保护自身的知识产权,展示了其维护合法权益的决心和实力。

Fujisoku Corporation公司的发展小趣事

随着全球化进程的加速,“未来电子”意识到单一市场已无法满足公司的长远发展需求。于是,公司制定了全球化战略,通过设立海外研发中心、生产基地和销售网络,积极拓展国际市场。在欧洲、北美和亚洲等地,“未来电子”的产品和服务得到了广泛认可,市场份额逐年攀升。这一战略不仅提升了公司的国际影响力,还为公司的持续增长提供了强劲动力。

问答坊 | AI 解惑

三星2440芯片

三星2440芯片结构…

查看全部问答>

从第四个起隔一个丢一个,困扰两天了

以下程序段的功能是:     以2400bps从计算机发送任一字节数据,当单片机收到该数据后, 在此数据前加上一序号然后连同此数据一起发送至计算机 出现的问题:     当发送abcdefgh时,收到的是1a2b3c4e5g    &nbs ...…

查看全部问答>

请问硬件设备控制方式都有哪些

我只知道telnet和http,还有其他方式吗?有C/S方式没有?…

查看全部问答>

S3C2410技术交流QQ群

S3C2410技术交流QQ群68766459…

查看全部问答>

一个CAN接口卡,两个SJA1000

我是搞单片机软件开发的,有一个问题,想问大家:一个CAN接口卡,两个SJA1000怎么协调工作?怎么工作的?能给解释以下吗?谢谢了!!…

查看全部问答>

Interfacing op amps to high-speed DACs, Part 3 Current-sourcing DACs simplifie

 Interfacing op amps to high-speed DACs, Part 3 Current-sourcing DACs simplifie…

查看全部问答>

stm32103xx请教DMA(DMA_Mode)使用问题!

DMA的正常(Normal)模式:采集到DMA_BufferSize 的个数后,DMA停止。DMA的循环模式:采集到DMA_BufferSize 的个数后,重新回到设置的RAM的起点位置,如此循环。 …

查看全部问答>

求助,也是449液晶的显示问题(P5.0和p5.1复用问题)

我用的是449驱动液晶显示,我把P5.1和P5.0作为输入的I/O口线使用,P5口的其余引脚作片内外设,我在程序中加了设置: mov.b #0fch,&P5SEL mov.b #00h,&P5DIR 程序输入芯片后,上机运行,发现P5.0和P5.1还是有 ...…

查看全部问答>

使用PLCXpresso快速定位

使用PLCXpresso时,怎么快速定位到函数?????????     少了个X。。。 [ 本帖最后由 zhaojun_xf 于 2012-4-25 20:27 编辑 ]…

查看全部问答>

C2000™ Piccolo LaunchPad 你想用它做什么?

最近看到坛子里好不热闹,都在上TI教室,争取免费的开发板? 大家都来说说如果拿到C2000™ Piccolo LaunchPad 你想用它做什么? 有什么特色创意? 咱也可以开群一起玩。…

查看全部问答>