MulticoreWare

移动和交通

空中透视的力量——聚焦鸟瞰法

2023年11月8

 

作者简介

Selventhiran Rengaraj 是MulticoreWare移动和运输业务部门的副技术项目经理。他在为地面和水下机器人开发机器人软件方面拥有实践经验,并在领先的汽车半导体平台上从事尖端的人工智能和ADAS感知堆栈优化工作。

介绍

在我们之前的博客 (BEV-A自主机器人范式转变入门), 中,我们深入研究了鸟瞰图(BEV)的迷人世界及其在自主中的非凡应用。现在,我们将更深入地研究BEV变换的迷人领域,并探索用于生成这种神奇观点的各种方法。

透视图到鸟瞰图的转换

将透视图(PV)转换为鸟瞰图(BEV)的能力简直是一个技术奇迹。研究人员和实业家采用以下关键方法进行透视图(PV)到鸟瞰图的转换:

.

1.同源法

近几十年来,计算机视觉中基于单应性的方法,特别是逆透视映射(IPM),利用与透视图(PV)的几何投影关系,促进了鸟瞰图(BEV)的解释。IPM有效地连接PV和BEV,能够投影感知任务的关键图像和特征。它的简单性依赖于矩阵乘法,而不是复杂的机器学习,使其成为计算机视觉中的可靠解决方案。

但是,也存在某些限制,例如:

  • 基于IPM的方法假设所有点都在平坦的地平面上,简化了PV-BEV变换,但由于缺乏深度信息,限制了它们在3D场景中的使用。
  • 单应图形方法取决于相机的内在和外在参数。对相机校准的任何修改都将显著影响PV-BEV转换。
  • IPM只有在路面平坦且无障碍的情况下,摄像头相对于道路保持静止时才能正常工作。

2.基于深度/点云的方法

为了解决同源法的局限性,需要深度信息来将2D像素和特征提升到3D空间中。引入了基于深度的PV到BEV方法,并建立在明确的3D表示上,该表示可以根据所使用的表示分为基于点或基于体素的方法。

  • 基于点的方法直接利用深度估计将像素转换为分散在连续3D空间中的点云。这些方法更简单,可以很容易地集成单目深度估计和基于激光雷达的3D检测的成熟技术。
  • 基于体素的方法使用均匀的深度矢量或明确预测的深度分布来将2D特征提升到3D体素空间并执行基于BEV的感知。该方法由于其计算效率和灵活性,最近受到了极大的关注。

3.基于NN变换的方法

基于NN的方法,主要利用Transformer架构,由于其将透视视图转换为鸟瞰视图的能力而不断提高。它们越来越受欢迎是由于基于Transformer的视图投影仪令人印象深刻的性能和强大的关系建模。这些方法使用基于变换器的编码器-解码器结构来将来自多个相机的图像特征转换为鸟瞰图,利用单个图像内的上下文信息和来自不同视图的图像间关系。

BEV的一个典型的基于神经网络的模型:

  • 首先,它使用骨干网络对输入数据进行编码,并使用转换器执行BEV投影。
  • 然后,BEV特征将在时间和空间上进行融合。
  • 最后,BEV特征将根据应用使用不同的头部进行解码,如分割和对象检测。

在自然语言处理(NLP)中创建大型变换器模型的流行趋势中,自动驾驶的研究人员正在探索变换器在使用BEV感知为跟踪和预测等任务生成鲁棒表示方面的有效性。

总体而言,基于Transformers和Depth的方法在计算机视觉社区中越来越突出。

4.语义占用网格——BEV

在我们之前关于纯电动汽车的博客中,我们强调了占用网格和BEV之间的相似性。这两种技术都涉及将环境划分为网格内的单元,每个单元对应于环境内的占用或特定位置。

在语义占用网格的上下文中,网格中的每个单元都被分配了特定的类,例如道路、地形、人行道和交通信号,尤其是在感知应用中。与二进制占用表示不同,语义占用网格包含了语义信息,可以通过使用高级深度神经网络进行训练来进一步细化。这样可以进行对象检测并生成鸟瞰图。

尽管已有几十年的历史,但占用率网格仍然是一个高度相关和有力的代表。它们与BEV等现代方法无缝集成,在增强自动驾驶汽车的导航方面具有巨大潜力。

BEV 感知的局限性

尽管基于BEV的感知在自主和机器人领域有许多应用,但几乎没有局限性,例如:

  • 遮挡: 俯视图可能被高大的物体或悬垂物遮挡,这可能会遮挡地面上发生的重要细节和事件。
  • 垂直感知: BEV感知通常缺乏关键的垂直信息,如建筑和车辆高度,限制了其对3D环境的理解。
  • 有限的环境条件: 在大雨、雾或雪等不利天气条件下,基于摄像头的BEV感知可能不太可靠,导致能见度和感知准确性降低。

McW在BEV和SOAT视觉技术方面的专业知识

  • 我们为各种汽车级AI加速器优化了基于SOAT(最先进)BEV的视觉转换器,即BEV Former、BEV SegFormer、Lift Splat Shoot(LSS)。
  • McW在量化相机和基于激光雷达融合的神经网络模型方面拥有专业知识,如从FP32到INT8的DeepFusion、BEV Det、DeepInteraction,而不影响精度
  • 我们的专业知识扩展到为微型移动、两轮和四轮车辆量身定制的BEV投影构建算法。
  • 我们对80多种人工智能模型有着深入的理解和熟练掌握,我们专门为低功耗边缘设备、DSP、NSP等进行优化。

结论

在MulticoreWare,我们有能力通过开发为您的独特用例设计的自定义基于Transformer的传感器融合模型来增强和加速您的感知解决方案。

欲了解更多信息,请联系我们info@multicorewareinc.com

Share Via

Explore More

Nov 17 2025

深入vSOC:守护从ECU到云端的软件定义车辆

引言 在汽车网络安全领域,车辆安全运营中心 (vSOC) 是保护车辆免受复杂网络攻击的关键安全解决方案之一。自 2023 年以来,包括主机厂(OEM)、以及一级和二级供应商在内的汽车行业厂商在维护和提升软件定义车辆 (SDV) 的安全性方面面临着诸多挑战,因为针对汽车本身的网络攻击的数量和复杂性近年来显著增加。 2024年,公开报告的汽车和智能出行网络安全事件数量为409起,较2023年的295起增加了39%。为了应对不断涌现的网络安全威胁及相关风险,ISO/SAE 21434和UNECE WP.29 R155/R156等合规标准确保安全贯穿整个汽车供应链。 此外,为了主动检测和应对威胁、加强安全态势以及在事件发生后调查威胁,汽车行业正越来越多地采用人工智能解决方案并将其集成到汽车网络安全生态系统中。虽然人工智能解决方案具有诸多优势,但其集成也带来了新的风险领域,例如供应链攻击和电动汽车充电基础设施威胁,这些风险领域本身就存在漏洞。此外,为了负责任地实施人工智能解决方案,还必须考虑与隐私、透明度和监督相关的新的伦理问题。 什么是车辆安全运营中心 (vSOC)? 车辆安全运营中心 (vSOC) 扮演着数字安全卫士的角色,通过提供持续的实时监控和对安全事件的有效响应,保护联网车辆、移动终端及其相关服务。通常,vSOC 是一个综合平台,它既包含先进的工具(分析、自动化和人工智能),也配备专门的人员团队,以实现高效的检测和响应。 vSOC助力汽车安全 在汽车安全领域,vSOC通过聚合和分析来自车辆ECU、传感器、远程信息处理单元、车队管理平台和其他联网服务等多个来源的数据流,并将这些数据安全地共享到云端。安全团队使用高级分析工具对这些共享数据流进行规范化和分析,以扫描异常情况和恶意活动,并根据情况通过自动化事件响应工作流程做出相应的响应或升级,从而确保快速控制事件并符合合规要求。 行业创建车辆安全运营中心的方法 方法 描述 优点 缺点 合并 扩展现有SOC,增加汽车安全能力 更快的实施速度 更容易与现有IT系统集成 缺乏对汽车领域的深度聚焦 可能存在规模化限制 自建 为汽车需求新建一个专用的vSOC 针对车辆威胁进行全面定制 对操作拥有极佳的控制力 前期投入成本高 前期准备时间长 外包 将车辆安全运营中心 (vSOC) 运营外包给托管安全服务提供商 (MSSP) 获取专业知识 成本效益高且可扩展 内部控制薄弱 对第三方的依赖性强 制造商和供应商在采用车辆安全运营中心 (vSOC) 时广泛采用的方法是“基于混合云的托管服务”模式,其中安全专业知识、高级工具和合规性管理由外部托管安全服务提供商 (MSSP) 提供,因为这种模式具有可扩展性、协作性和成本效益。 人工智能在虚拟安全运营中心 (vSOC) 中的应用及效率提升:威胁检测与响应  … Read more

Read more
Mar 28 2025

用 Perfalign 解锁 AI 性能分析与优化

在人工智能和机器学习领域,跨不同硬件平台优化性能是一项关键挑战。开发者和人工智能工程师经常面临复杂模型可视化、性能瓶颈分析以及工作负载微调以提高效率的难题。Perfalign 旨在通过提供先进、直观的 AI 软件栈开发和优化工具包来解决这些挑战。

Read more
Mar 25 2025

Gen AI 如何改变流媒体和广播行业的视频增强功能?

开发者经常面临跨平台移植应用程序的挑战。无论是从 x86 过渡到 ARM 或 RISC-V CPU,还是将工作负载迁移到新架构的 AI 加速器,这个过程都绝非易事。虽然移植看似只是重新编译或进行少量代码调整的简单操作,但实际情况远比这复杂得多,尤其是在 HPC 领域。

从架构差异到性能瓶颈,移植应用程序需要具备硬件架构、系统集成、性能优化和平台特定调优方面的深厚专业知识。本篇博文探讨了为什么移植应用程序不仅仅是一项“直接迁移”的任务,以及如何采用结构化、专业知识驱动的方法克服挑战。

Read more

GET IN TOUCH