MulticoreWare

实例探究

利用 Cadence Tensilica ConnX 220 DSP 进行多物体追踪

March 15, 2024

客户

Cadence是电子设计领域的杰出企业,利用其在计算软件方面的专长,提供软件、硬件和IP的全方位解决方案,助力各行业的公司开发尖端电子系统。Cadence还提供各种DSP,从功耗小巧型到为ADAS、自动驾驶、V2X、5G/LTE/4G、无线通信、无人机和机器人中的雷达、激光雷达和通信应用高度优化的DSP。

挑战

在中国一家领先的半导体公司提供的真实硬件平台上展示用于实时多物体追踪的Cadence CONNX 220 DSP的高性能。

解决方案

MulticoreWare通过在Tensilica ConnX DSP系列上部署基于统计卡尔曼滤波的优化追踪流水线,成功提供了得到完全优化的雷达多物体跟踪(MOT)工作负载演示,如下图所示:

多物体追踪流程图

  • 原始雷达数据: 系统通过捕获来自雷达的原始 ADC 数据启动。
  • 智能聚类: 获取的数据通过智能算法处理,有效地将单独的数据点分组成簇,尤其是在物体非常近的情况下。每个簇代表一个潜在的物体。
  • 轨道初始化: 利用这些簇,为每个潜在物体建立单独的轨道,从而能够持续监测它们的位置和特征。
  • 优化多目标跟踪(MOT): 最终,优化的MOT算法同时利用当前帧和历史数据中的信息。它识别新物体,跟踪现有物体,并将检测结果准确地与它们各自的轨道进行关联。这确保了即使在复杂场景下也能进行可靠的跟踪。

以下为提升性能而部署在Tensilica DSP 上的经优化的MOT模块:

  • 聚类
  • 扩展卡尔曼滤波器准备
  • 扩展卡尔曼滤波器预测
  • 数据关联
  • 扩展卡尔曼滤波器更新
  • 追踪器更新

影响

  • 每秒实现最高1640帧及更低的DSP周期数。
  • 我们优化的雷达处理方案将性能提升了惊人的30倍。

其他用例

ADAS/自主移动

交通监测

机器人与自动化

情报监控

医疗保健 - 患者监控

体育分析

总结

本案例研究有效展示了 MulticoreWare 在 DSP、低功耗和高性能软件优化方面的能力。通过在 Tensilica ConnX 220 DSP 的真实硬件上成功运行多物体追踪,我们展示了我们在高要求的嵌入式硬件平台上提供卓越性能的能力。

了解我们如何帮助您在自主移动和机器人方面取得突破性成果。 请联系我们的 DSP info@multicorewareinc.com

Share Via

Explore More

May 29 2026

优化 Android 应用在远程 GPU 渲染平台上的性能

客户 该客户是一家专注于GPU虚拟化中间件的技术公司,其产品能够将独立计算单元聚合到共享资源池中,并通过标准网络基础设施进行远程访问。他们的平台旨在帮助企业和汽车开发团队将图形密集型计算工作负载卸载到集中式或分布式GPU基础设施。 问题陈述 随着图形密集型Android应用程序越来越多地利用远程GPU基础设施,在分布式环境中保持接近原生体验的 UI 响应性和渲染性能成为一项重大挑战。通过该平台在基于远程服务器-客户端的架构上运行Android Automotive应用程序引入了性能瓶颈,对渲染效率和最终用户体验产生了负面影响。 客户观察到,与原生Android执行相比,通过该平台执行Android模拟器工作负载时,帧速率降低,渲染延迟增加。远程渲染管线在帧生成、同步和呈现过程中引入了延迟,导致UI响应速度下降,交互体验下降。 该平台面临以下几个关键挑战: 在远程渲染环境下,Android Automotive 模拟器执行时帧率低 由于渲染管线和同步瓶颈,导致每帧延迟增加 在非原生 Vulkan 路径中,由 Mesa 转译引入的额外开销导致渲染效率低下 Vulkan 的阻塞式等待机制影响帧调度和渲染吞吐量 远程执行期间,对 GPU 及渲染管线层级性能瓶颈的可观测性有限 为了应对这些挑战,客户需要一个结构化的优化框架来对性能进行基准测试,识别渲染瓶颈,并提升整个平台的帧传输与交付效率。 解决方案概述 MulticoreWare 开展了一项全面的性能优化计划,旨在提升客户平台上 Android 模拟器的运行性能。该计划首先对 Android 应用的性能与原生 Android 应用的性能进行基准测试,以建立帧率(FPS)和延迟的性能基线。 MulticoreWare 利用先进的性能分析工具,对渲染管线进行了端到端的分析,以识别帧生成、同步与显示过程中的瓶颈。基于这些发现,团队对渲染栈实施了针对性的优化,从而降低帧延迟并提高吞吐量。 该解决方案的主要功能包括: 基于队列的帧呈现机制 实现了将帧接收与渲染解耦的带缓存的解耦帧呈现机制,从而减少等待时间和延迟瓶颈。 工作负载感知超时优化 在 Mesa 中用基于计算公式的超时机制替换了无限 Vulkan 等待,提高了同步效率并减少了渲染停顿。 启用原生 Vulkan 渲染能力 启用了 Android 模拟器 Vulkan 模式所需的缺失 Vulkan 功能,绕过了 Mesa  … Read more

Read more
May 14 2026

面向无线接入网(RAN)可观测性、可解释性和编排的智能体人工智能

客户
一家全球性的电信和网络基础设施公司,致力于为构建、管理和优化大型电信及企业网络提供先进的软件、硬件和服务。

Read more
May 13 2026

先进无人机系统的嵌入式平台优化:激光雷达与电机控制的集成

客户 一家领先的无人机与机器人公司,致力于开发高性 能无人机平台,用于复杂或受限环境中的自主作业、工业检测及测绘。

Read more

GET IN TOUCH