2026年初CES展上,AMD推出锐龙AI嵌入式P100系列处理器4-6核,针对下一代数字座舱和人机界面HMI 进行优化,实现车载信息娱乐显示屏的实时图形功能、AI 驱动的交互以及多域响应能力。
而在刚刚举行的Embedded World 2026上,AMD正式宣布扩展锐龙RyzenAI嵌入式P100系列处理器产品矩阵,推出全新8-12核版本。这次升级不仅是处理器核心数量的增加,GPU、AI算力也得到显著提升,为工业与AI边缘解决方案提供可扩展的高效AI计算能力。
Ryzen嵌入式处理器高级产品营销经理Ioseph Martinez表示,工业市场正从单一功能设备转向集成视觉、AI控制和实时分析的整合系统。医疗终端设备开始整合临床推理功能,移动机器人在感知与导航领域对算力需求激增。嵌入式GPU平台的规模化计算与AI加速能力是P100系列扩展的核心驱动力。
从4-6扩展至8-12核,显著提升GPU和AI加速能力
据介绍,新款处理器具备8至12 颗“Zen 5”核心,最高可达 80 TOPS 的系统级算力用于物理 AI 加速,AMD RDNA™3.5 图形处理能力可实现实时可视化,以及神经处理单元(NPU)基于 AMD XDNA™2 架构、实现低时延、高能效 AI推理,这些所有功能集成在一颗芯片中。
在核心数、GPU算力、TOPS性能上,新款处理器与此前发布的P100 系列处理器相比大幅提升。具体来说,新款处理器可提供最高2倍的CPU核心数量、最高8倍的图形处理单元GPU算力,且系统级每秒万亿次运算TOPS性能预计提升36%。
而与上一代 AMD 锐龙嵌入式 8000 系列相比,P100 系列预计可提供最高提升 39% 的多线程性能和最高提升 2.1 倍的系统级总TOPS。
与现有 P100 系列相比,新款处理器提供了卓越的 AI 每瓦性能,并可支持近 2 倍数量的虚拟机以及更大规模的大语言模型(例如 Llama 3.2-Vision 11B),从而推动更先进的 AI 与混合型工作负载。
此外,P100系列建立完整的产品矩阵,具有兼容性和可扩展性,实现引脚兼容,具有相同的BIOS与硬件设计方案,简化开发,并满足厂商对性能、能耗的不同需求。
构建软件生态,ROCm 软件支持与虚拟化参考堆栈
在软件工具层面,支持AMD ROCm 开放软件生态系统,为嵌入式应用带来了一套业经验证的开源 AI 软件栈。开发人员可以在依赖开源编译器、运行时和库的同时运行标准 AI 框架,并且无需重写代码即可即时访问适用于嵌入式的模型。
在编程层面,ROCm 软件采用开源的 HIP (Heterogeneous-computing Interface for Portability),将 GPU 编程从硬件中解耦,消除了软件栈和硬件之间的供应商锁定。
Ioseph Martinez说道,紧密集成的 CPU、GPU 和 NPU 架构能在混合工作负载下实现高效的工作负载分配,并确保可预测的时延;同时,使用熟悉的框架和软件栈有助于在广泛的用例中简化和精简开发与部署。这种集成水平还能在无需额外外部组件的情况下实现先进的计算与图形处理能力,使 OEM 厂商和系统集成商可以更轻松地设计可扩展的平台。
此外,AMD 还为工业领域的混合关键型应用提供了一个封装式、垂直整合的虚拟参考堆栈。该堆栈基于 Xen 虚拟管理程序构建,可在隔离域中运行Linux、Windows、Ubuntu和RTOS环境,从而实现安全性、实时性能与灵活性。最终形成一个可扩展的、开放的架构,为下一代嵌入式系统简化设计并加速开发。
三大典型应用:工业PC、自主移动机器人、智能医疗
新款处理器支持从视觉到控制到推理的实时AI、提供先进的图形处理能力,同时还支持工业温度范围(−40°C 至105°C)、7×24 小时连续运行以及 10 年产品生命周期。
针对工业 PC 的智能机器视觉,新款处理器能实现将可编程逻辑控制器(PLC)、机器视觉与人机界面(HMI)整合到同一台工业 PC,同时为实时监测与处理优化提供所需的 CPU 性能。集成的 GPU 和 NPU 可加速多路摄像头视觉与丰富的 HMI 仪表板,并支持利用 DeepSORT、RAFT-Stereo、CenterPoint、GDR-Net、PaDiM 和 Llama 3.2-Vision 等模型的低时延异常检测。
用于自主运行的物理AI场景上,针对移动机器人,该处理器可在 CPU 上管理导航、运动控制与路径规划,而 GPU 则处理多路摄像头数据,实现空间感知、Visual SLAM(视觉 SLAM) 以及视觉-语言-动作(vision-language-action, VLA)模型等高级 AI 工作负载。CPU 与 GPU 之间的统一内存实现了低时延,从而提升了响应速度。NPU 可提供始终在线的低功耗推理,支持基于 YOLOv12 和 MobileSAM 等模型的目标检测与场景理解。
3D 医学成像与临床智能领域,利用 U-Net、nnU-Net 和 MONAI 等模型,该处理器可在边缘端支持超声、内窥镜、组织分类以及肿瘤检测等 3D 成像。处理器可借助 MedSigLIP 加速从成像到报告的工作流程,并支持通过 Med-PaLM2 实现临床推理与问答能力。医疗领域原始设备制造商(OEM)能在可扩展的长生命周期 x86 嵌入式平台上整合成像、AI 分析与报告功能。
多家ODM提供量产解决方案
目前,基于AMD 锐龙AI 嵌入式P100 处理器的量产解决方案现已可供选用,合作伙伴包括研华科技(Advantech)、康佳特(congatec)和控创(Kontron)。
研华科技推出由可扩展的 AMD 锐龙 AI 嵌入式 P100 处理器产品组合提供支持的全面产品线。该产品组合涵盖计算机模块(Computer-on-Modules)、单板计算机(Single Board Computers)以及边缘 AI 与智能系统,利用增强型集成 AI 架构实现高效的多任务处理,推动下一代边缘 AI 的发展。
congatec康佳特以一款高度通用的平台扩展其面向嵌入式计算和边缘应用的计算机模块产品组合。该平台提供了 4 至 12 颗 CPU 核心以及高度可扩展的 GPU 性能,使客户能够根据其具体应用需求,精准定制性能、功耗和成本。
控创基于 P100 的 K4131-Px mITX 将配备 4 核至 12 核 APU,在相同的紧凑封装尺寸下,为客户提供一系列具备高算力性能与 AI 加速能力的解决方案。
产品线计划
据悉,P100 系列 4 至 6 核处理器目前也已提供样品,预计将于 2026 年第二季度量产。配备 8 至 12 颗核心的 AMD 锐龙 AI 嵌入式 P100 系列处理器现已提供样品,预计将于2026 年 7 月开始量产出货。
据介绍,AMD计划在2026年下半年推出更高端的X100系列,最高配备16颗Zen 5 核心,进一步满足物理AI与自主系统的极致算力需求,形成从4核到16核的完整嵌入式处理器产品矩阵,全面覆盖边缘AI场景的算力需求。
小结:
可以看到,工厂自动化、移动机器人中的物理 AI 以及其他 AI 驱动的边缘应用正在快速演进,嵌入式系统对多核异构计算平台的需求愈发强烈。AMD的锐龙AI嵌入式处理器系列以其CPU核心能力的提升、GPU算力的增长、以及AI性能的加速,还有软硬件协同,产业链生态伙伴协作,共同推动着嵌入式领域全面转向AI战略。