MulticoreWare

实例探究

面向无线接入网(RAN)可观测性、可解释性和编排的智能体人工智能

May 14, 2026

客户

一家全球性的电信和网络基础设施公司,致力于为构建、管理和优化大型电信及企业网络提供先进的软件、硬件和服务。其解决方案利用人工智能、自动化和端到端可视化技术,帮助运营商提升性能、确保可靠性,并高效管理复杂的多域网络环境。

问题陈述

无线接入网(RAN)是现代蜂窝基础设施的基础层,负责通过由无线单元(RU)、分布式单元(DU)和集中式单元(CU)组成的分布式架构,将数百万台终端用户设备连接到核心网络。随着RAN演变为高度分布式和动态的系统,传统的仪表盘监控和AI辅助工具仍需大量人工干预。

运营商必须持续监控遥测数据流,手动分析海量指标,并在出现异常时确定纠正措施。这种被动应对的方式不仅延缓了故障排除速度,还增加了运维复杂性。

客户现有的监控框架缺乏自主分析网络行为并响应运维问题所需的智能能力。尽管该平台能够从多个网络元素和层级收集遥测数据,但在没有人工干预的情况下,它无法有效关联事件、识别根本原因或协调修复工作流。此外,该平台既没有自动化的故障管理工作流,监控管道中也缺乏可追溯性和可信度。

该平台面临以下若干运营限制:

  • 在分布式无线接入网(RAN)环境中准确识别根本原因的能力有限
  • 解读原始遥测指标、日志和事件信号需要大量人工操作
  • 缺乏主动性洞察,无法在服务中断发生前预测服务质量下降。
  • 无法在无需人工干预的情况下自动修复问题
  • 监控工作流中的可追溯性、可观测性和可解释性有限

为应对这些挑战,客户需要一个智能且可扩展的框架,能够持续分析网络遥测数据、关联事件,并自主协调修复工作流

解决方案概述


MulticoreWare 设计并实施了一个基于智能体人工智能的框架,旨在增强无线接入网(RAN)的可观测性、可解释性和自动化编排能力。该解决方案整合了来自 RAN 组件的实时遥测数据(包括性能指标、日志和事件信号),并通过一个由人工智能代理组成的协同生态系统对其进行处理。

该架构基于智能体间(A2A)通信和模型上下文协议(MCP)构建,支持跨代理的结构化上下文共享和协同推理。遥测数据被持续采集、标准化处理,并近乎实时地进行分析,以检测异常并评估网络状态。

通常,在大规模网络中,大多数问题都是未经处理的原始问题,且未按任何顺序进行聚类。要解决这些问题,通常需要人工操作员介入,或者采用 HITL(人在回路)流程——在该流程中,针对每个决策或告警,人工操作员仍需调整并批准自动化系统提供的建议。根据问题规模的不同,这一过程通常需要数分钟到数小时不等。这正是本解决方案的用武之地。

该解决方案通过专用的基于机器学习的检测模块,针对两类主要的无线接入网(RAN)故障:PCI 冲突和 RU 故障。在 RU 健康监测方面,系统持续跟踪一套全面的硬件和前传信号:

    
  • 前传链路状态
  • PTP 锁定状态
  • 前传时延
  • PTP 锁定状态
  • VSWR
  • 光接收功率
  • GPS 锁定状态
  • 发射功率电平
  • 每个扇区的输出功率
  • 关键告警激活
  • 输入电压电平
  • 活跃 UE 数量
  • RU 可用性
  • 前传数据包丢失率
  • 前传链路状态
  • PTP 锁定状态
  • 前传时延
  • PTP 锁定状态
  • VSWR
  • 光接收功率
  • GPS 锁定状态
  • 发射功率电平
  • 每个扇区的输出功率
  • 关键告警激活
  • 输入电压电平
  • 活跃 UE 数量
  • RU 可用性
  • 前传数据包丢失率
Fronthaul Link Status PTP Lock Status GPS Lock Status Critical Alarm Active RU availability

PA temperature

VSWR
Transmit power level
Input voltage level
Fronthaul Packet loss rate

Fronthaul latency

Optical RX Power
Output Power per sector
Optical RX Power

在PCI碰撞检测方面,系统会按基站采集包括RSRP、RSRQ、SINR、基站ID、EARFCN以及同频段切换成功率在内的射频关键指标,并计算滚动统计数据,基于拓扑重叠以及这四个维度上的同步信号退化情况,识别出受活跃碰撞影响的基站。

共开发了11个专用AI代理,每个代理负责不同的功能,如异常检测、验证、情境推理和修复。一个中央协调代理负责管理工作流执行,维护各代理之间的上下文关联,并确保决策的同步性。

该解决方案的主要功能包括:

  • 多代理协调: 分布式代理通过A2A消息传递进行协作,实现遥测数据的并行处理,并加快根本原因的识别。
  • 实时遥测处理: 持续采集和规范化RAN数据,实现近乎实时的异常检测和状态评估。
  • 基于上下文的推理: MCP使代理能够共享结构化上下文,从而提高工作流中的决策准确性和一致性。
  • AI 洞察生成: 基于大型语言模型(LLM)的引擎通过关联事件并解读遥测数据,生成可操作的运维洞察。
  • 自动化问题报告: 检测到的异常会触发自动创建 JIRA 工单,并根据严重程度和影响进行优先级排序。
  • 自主修复工作流: 修复代理执行纠正措施,并通过 Microsoft Teams 网络钩子通知传达更新。
  • 模块化: 整个系统易于扩展,从代理间通信到代理本身皆然。代理间通信采用总线架构,其设计灵感源自消息队列。
  • 平均修复时间:
    • 对于每个问题的解决流程,首先会检查该问题是否为持续性问题。随后,将根据问题的严重性级别创建相应的 JIRA 工单。最后,由修复代理对问题进行修复。
    • 在进行持续性检查时,将对该问题进行一段时间的观察。
    • PCI 冲突: 2 分 49 秒
    • RU 故障:
      • RU 完全故障: 3 分 51 秒
      • PA 热故障:: 3 分 30 秒
      • 前传故障:2 分 53 秒

代理功能:

该解决方案采用了一个结构化的多代理框架,旨在确保可解释性、可靠性,并在整个网络中协调决策。

  • 代理可解释性: 所有代理的输入、输出及与工具的交互均被记录,从而实现完全可追溯性。基于人工智能的评估机制会评估每项操作的正确性、相关性和影响。
  • 代理护栏机制: 每个代理执行预定义任务,其输出由下游代理进行验证,以确保可靠性并防止错误传播。
  • 多代理工作流: 任务在验证、推理和修复代理之间进行分配,从而实现高效的根本原因分析和自动化协调。

技术栈

  • 模型:Z.AI GLM 4.7
  • 令牌生成速率:约 200 个词元/秒
  • 框架与工具:LangChain、模型上下文协议 (MCP)、自定义代理间 (A2A) 总线

业务影响

智能体人工智能 框架通过减少人工监控工作量并加快问题解决速度,显著提升了网络运维效率。自动化的遥测分析、事件关联以及修复工作流,有助于更快地查明根本原因,并缩短平均修复时间(MTTR)。

该架构具有高度的可扩展性和可延伸性,支持与更多网络设备、API 以及 NETCONF 等协议集成,从而能够在不断演进的电信基础设施中实现面向未来的部署。

结论

通过部署由智能体人工智能驱动的 RAN 可观测性和编排平台,该客户将其传统的监控框架转变为一个能够进行实时分析和自主修复的智能、自主系统。

该解决方案支持主动问题检测、自动化决策以及提升运维透明度,为自愈型网络运维奠定了基础。

MulticoreWare在AI驱动的自动化、智能可观测性和可扩展网络编排方面的专业能力,促成了此次转型。如需了解我们如何帮助您的组织利用Agentic AI构建智能、自愈型网络运维体系,请联系 info@multicorewareinc.com

Share Via

Explore More

May 13 2026

先进无人机系统的嵌入式平台优化:激光雷达与电机控制的集成

客户 一家领先的无人机与机器人公司,致力于开发高性 能无人机平台,用于复杂或受限环境中的自主作业、工业检测及测绘。 问题陈述 随着无人机平台的演进,出现了两个主要挑战,这些挑战影响了系统的性能和可扩展性。 挑战 1:高速传感器集成 该无人机需要配备高速激光雷达模块以实现实时感知与导航。传感器的集成带来了硬件和软件兼容性方面的挑战。团队需要稳定的 90 FPS 帧率捕获、针对驱动程序适配的嵌入式 Linux 支持,以及可靠的设备树覆盖。这些能力对于在狭窄或动态环境中安全导航至关重要。 挑战 2:高级电机通信 该平台需要精确的多通道电机控制。PX4 固件更新启用了 DSHOT 协议和 3D 模式,而 STM32 固件则模拟了 VOXL IO 适配器功能,以实现多通道 ESC信号传输。这确保了电机响应迅速且无人机飞行性能稳定,支持在复杂的操作场景中进行敏捷机动。 解决方案概述 M30 传感器集成 在嵌入式 Linux 构建中添加并配置了 M30 激光雷达驱动程序,以确保传感器可靠运行。 配置了设备树叠加层,以保持向导航系统传输帧数据的连续性。 实现了稳定的 90 FPS 帧捕获,为实时自主导航提供输入感知流水线。 优化处理,以维持整体平台效率. DSHOT 电机通信功能实现 更新了 PX4 固件,以支持 DSHOT 协议和 3D 模 式。 开发了 STM32 固件,用于模拟 VOXL  … Read more

Read more
Jan 8 2026

面向自愈网络的AI驱动动态策略管理

该客户是网络管理软件领域的全球领导者,为企业、电信、工业和数据中心网络提供端到端的网络和服务管理解决方案。

Read more
Dec 8 2025

面向新一代笔记本电脑的AI驱动的可执行故障排除

一家领先的消费计算技术公司,以人工智能驱动的创新不断突破用户体验的界限而闻名。

Read more

GET IN TOUCH