MulticoreWare

实例探究

提升 AI 加速器功能

September 12, 2024

客户

客户是一家基于RISC-V的AI加速器公司。

挑战

客户的加速器硬件只能通过其 NN 软件生态系统支持最低限度的机型。该项目的目标是扩展对其他各种模型的支持。

MulticoreWare 使用自定义 API 为其架构中的各种 CNN 和 NLP 模型运行端到端推理流水线。我们必须为其架构中的各种 CNN 和 NLP 模型编写模型演示,并在客户自己的 AI/ML 编译器堆栈中将不支持的 TVM 操作与支持的操作进行分解。

解决方案

凭借我们在过去和现在在各种客户硬件上对端到端模型推理管道的专业知识,我们的解决方案架构师团队能够为客户硬件的不同架构添加对ShuffleNet、YoloV5、HardNet、DDRNet、DLA及其他各种CNN、NLP和基于Transformer的模型及其变体的支持。在支持上述模型的同时,我们还处理和支持不同的故障和错误。

我们使用 PyTorch 和 ONNX 参考代码以及 PCC 指标测试了模型推理管道的正确性。在快速开发应用程序接口和功能的过程中,我们也适应了应用程序接口,并通过理解内存布局和配置,以最少的文档提升了一些模型。

尽管面临文档有限和快速发展的仓库开发的挑战,我们的团队成功适应了新API,确保满足了客户的需求。这一成就突显了我们快速学习和应用新技术的能力,克服障碍,提供高质量的结果。

项目中采用的技术

解决方案亮点

  • 我们的团队开发了端到端模型推理管道,并使用其API将20多个基于CNN和NLP的模型集成到其微架构中。
  • 我们进行了单元测试,并报告了所有模型中不受支持的操作变体和问题。

商业影响

MulticoreWare通过提供全面的AI生态系统,增强了客户的市场竞争力,吸引了更广泛的客户群。该项目还通过增加对其AI硬件和API的采用,创造了更多的收入机会,从而推动了客户的业务增长。

结论

总之,MulticoreWare展示了对各种模型的支持能力以及在AI加速器、优化、RISC-V和AI架构、TVM、PyTorch、Tensorflow、ONNX等方面的专业知识。了解我们如何帮助您实现创新成果。请通过info@multicorewareinc.com 联系我们的团队。

Share Via

Explore More

May 29 2026

优化 Android 应用在远程 GPU 渲染平台上的性能

客户 该客户是一家专注于GPU虚拟化中间件的技术公司,其产品能够将独立计算单元聚合到共享资源池中,并通过标准网络基础设施进行远程访问。他们的平台旨在帮助企业和汽车开发团队将图形密集型计算工作负载卸载到集中式或分布式GPU基础设施。 问题陈述 随着图形密集型Android应用程序越来越多地利用远程GPU基础设施,在分布式环境中保持接近原生体验的 UI 响应性和渲染性能成为一项重大挑战。通过该平台在基于远程服务器-客户端的架构上运行Android Automotive应用程序引入了性能瓶颈,对渲染效率和最终用户体验产生了负面影响。 客户观察到,与原生Android执行相比,通过该平台执行Android模拟器工作负载时,帧速率降低,渲染延迟增加。远程渲染管线在帧生成、同步和呈现过程中引入了延迟,导致UI响应速度下降,交互体验下降。 该平台面临以下几个关键挑战: 在远程渲染环境下,Android Automotive 模拟器执行时帧率低 由于渲染管线和同步瓶颈,导致每帧延迟增加 在非原生 Vulkan 路径中,由 Mesa 转译引入的额外开销导致渲染效率低下 Vulkan 的阻塞式等待机制影响帧调度和渲染吞吐量 远程执行期间,对 GPU 及渲染管线层级性能瓶颈的可观测性有限 为了应对这些挑战,客户需要一个结构化的优化框架来对性能进行基准测试,识别渲染瓶颈,并提升整个平台的帧传输与交付效率。 解决方案概述 MulticoreWare 开展了一项全面的性能优化计划,旨在提升客户平台上 Android 模拟器的运行性能。该计划首先对 Android 应用的性能与原生 Android 应用的性能进行基准测试,以建立帧率(FPS)和延迟的性能基线。 MulticoreWare 利用先进的性能分析工具,对渲染管线进行了端到端的分析,以识别帧生成、同步与显示过程中的瓶颈。基于这些发现,团队对渲染栈实施了针对性的优化,从而降低帧延迟并提高吞吐量。 该解决方案的主要功能包括: 基于队列的帧呈现机制 实现了将帧接收与渲染解耦的带缓存的解耦帧呈现机制,从而减少等待时间和延迟瓶颈。 工作负载感知超时优化 在 Mesa 中用基于计算公式的超时机制替换了无限 Vulkan 等待,提高了同步效率并减少了渲染停顿。 启用原生 Vulkan 渲染能力 启用了 Android 模拟器 Vulkan 模式所需的缺失 Vulkan 功能,绕过了 Mesa  … Read more

Read more
May 14 2026

面向无线接入网(RAN)可观测性、可解释性和编排的智能体人工智能

客户
一家全球性的电信和网络基础设施公司,致力于为构建、管理和优化大型电信及企业网络提供先进的软件、硬件和服务。

Read more
May 13 2026

先进无人机系统的嵌入式平台优化:激光雷达与电机控制的集成

客户 一家领先的无人机与机器人公司,致力于开发高性 能无人机平台,用于复杂或受限环境中的自主作业、工业检测及测绘。

Read more

GET IN TOUCH