在汽车产业不断提高安全性的趋势下,车辆需要整合越来越多的外围摄影传感器和智能图像处理技术,以便实现先进的驾驶辅助系统(ADAS),如车道偏离警告、碰撞避免、盲点监视、先进的倒车摄影以及具有物体识别功能的周边环境观察系统等。制造商想要创建完全安全的驾驶环境这一共同目标推动着这一趋势的发展。例如,Volvo公司的“Zero-by-2020”目标,就是希望到2020年乘坐新款Volvo汽车的人不会再因车祸而死亡甚至受伤。
这些系统面临的挑战在于需要建立这样一个平台:能够保持这些计算密集型应用要求的处理性能,只需消耗较低功率以避免散热问题,能够提供整合商愿意采用的高成本效益解决方案,并且系统尺寸要小,能使系统“大脑”与影像传感器共处一地,并装配进智能摄影机(如果要求的话)内。共存于传感器上的图像处理可构成系统解决方案,在这种系统中,相同的智能摄影平台可应用于车辆的不同位置,如后保险杆——实现具有物体/人体检测功能的增强型倒车摄影机;反光镜——用于实现盲点监视;后视镜背后——用于实现前向碰撞和车道偏离警告;以及其它外围摄影机——用于周边环境观察。此外,这种分布式智能摄影模型不会因额外处理要求而加重汽车中央控制台的负担。
图1:先进的驾驶辅助系统。
市场报告指出,在今后几年中,ADAS不仅会广泛用于高阶汽车,而且还会用于更普通的中低阶汽车。除了要求每个应用提供更强的运算性能外,还有在相同的硬件平台上结合来越多ADAS应用的需求。但这也升高了一项疑虑——目前的DSP和FPGA解决方案够用吗?
DSP 算法执行方案中最大的瓶颈之一,是为了跟上读写访问速度而负担越来越重的外部内存。传统的DSP提供有限的并行执行能力,为了满足处理要求,通常要求工作在越来越高的频率频率。而随着频率频率的不断攀升,DSP将消耗更多的功率,进而产生更多的热量需要散发。虽然FPGA的并行执行能力要比DSP强,但比较难编程序,且经常需要用RISC处理器进行资料的后处理。FPGA也具有很大的功耗,而且系统尺寸大,总之是一种成本较高的解决方案。
影像识别的未来:多核心平行处理
由CogniVue影像识别处理器(ICP)执行的多核心平行处理性能在许多方面都已超越DSP和FPGA。在单位面积、单位毫瓦功率内,ICP能提供更好的性价比。
CogniVue APEX架构整合了用于管理算法执行的工业标准RISC核心和高度平行的单指令多数据(SIMD)数组处理引擎(APU),可用于执行图像处理和分析算法中固有的低层运算密集型并行操作。这种架构中除了RISC和APU外,还有新设计的串流DMA,用于确保高效的数据移动;以及设计用于自动和高效排序操作以确保最大效率的排序器。第二个RISC核心在APEX外部独立运作,用于处理系统级常驻程序。
APU内部为每个计算单元准备了本地专用内存。影像数据取自外部内存,然后流进APU内存,在数据流出和存回系统内存之前,所有处理工作都在APU内存中完成。由于APU内存与 APU单元位于一处,因此可以大幅地减少外部内存存取的次数,不必提高频率频率就能维持高运算性能。APEX处理核心与ICP的其余部分也是分开的,这意味着APEX核心工作频率独立于SoC的其余部分,允许组件其余部分工作在较低的频率频率,从而节省功耗。透过将外部内存堆栈在封装内部,这种方案可以实现更小的系统尺寸,达到节省电路板占用面积的目的。
由于采用了平行处理器核心和基于串流程序设计的独特软件范例,CogniVue ICP可以调度复杂的向量操作,并在数据移动最少的情况下执行程序代码。这些处理器只要有可能就会实现算法原语的自动管线式操作,并透过一个全面的API 撷取这种复杂性,从而隐藏掉系统负载平衡的复杂度,消除开发人员面临的多核心同步问题。
高度并行机制加上高ALU带宽架构展示了一个可行的平台,它提供足够富余的功能和处理能力,可在相同的硬件上并行执行多个应用。灵活的开发平台和SDK使得用户能够灵活程序设计APEX,并建构极具竞争力的差异化应用。这种多核心平行平台之所以能够得到开发人员的青睐,不仅因为它能提供先进的性能、功耗和尺寸特性,而且能保证在未来ICP中的程序代码再使用,从而确保最少的开发工作和时间。
图2:可编程设计的平行架构。