NXP Semiconductors Ara240离散神经处理单元 (DNPU)

NXP Semiconductors Ara240离散神经处理单元 (DNPU) 可在边缘和嵌入式计算系统上实现实时生成式AI、大型语言模型 (LLM) 和视觉语言模型 (VLM),提供低延迟、较低的运营成本和增强的数据隐私。其创新架构将均衡的计算能力与高芯片外带宽结合起来,以高效执行大型模型。

Ara240架构旨在支持高级多模态和基于变压器的工作负载,可实现高达40 eTOPS(等效每秒万亿次运算),并支持高达16GB的LPDDR4内存。此功能可直接在边缘端流畅执行大型复杂模型,而无需依赖高成本的云计算资源。

凭借集成的安全启动和硬件信任根处理器,Ara240为工业、企业和嵌入式部署环境提供强化的安全保障。其PCIe Gen4和USB 3.2主机接口允许轻松集成到边缘计算平台、PC/笔记本电脑和支持AI的嵌入式系统中。

NXP Semiconductors Ara240得到了NXP AI/ML生态系统的支持,包括NXP eIQ工具包和Ara Software Development Kit (SDK),从而加速了模型的开发、优化和部署。

特性

  • 处理器
    • Ara240离散神经处理单元 (DNPU) 每秒可提供高达40 eTOPS(等效每秒万亿次运算)
    • 专有神经网络处理器 (NNP) 运行速度高达900MHz
  • 存储器
    • 支持最多16GB外部低功耗双倍数据速率4 (LPDDR4)
    • 包含用于启动、配置和运行时间数据的4MB SPI NOR闪存和8KB I2C EEPROM
  • 安全
    • 安全启动功能确保模块经过身份验证后启动
    • 可信根处理器为安全的AI部署奠定了硬件基础
  • 接口和连接性
    • PCIe Gen4主机接口,可配置为x1、x2或x4通道,以实现高带宽数据传输
    • USB 3.2 Gen 2,用于灵活的主机通信
  • 易于使用
    • 操作系统支持(运行时间)- Linux
    • Ara Software Development Kit (SDK)
  • 17mm x 17mm x 0.65mm间距倒装芯片球栅阵列 (FCBGA) 封装
  • 在边缘运行LLM、VLM、多模态和生成式AI工作负载的高性能实时 AI,最高可达40 eTOPS
  • 本地推理执行延迟低,运营成本低,减少往返延迟和对云服务的依赖
  • 支持大型模型执行,具有高片上存储器和高达16GB LPDDR4(X),可高效处理大型变压器模型
  • 内置安全启动和可信根处理器,确保安全部署
  • 灵活的主机集成,支持PCIe Gen4和USB接口,适用于嵌入式、PC和边缘服务器平台

应用

  • 边缘生成式AI
  • 计算机视觉和多模态系统
  • 工业自动化
  • 高级机器人技术

方框图

框图 - NXP Semiconductors Ara240离散神经处理单元 (DNPU)
发布日期: 2026-04-15 | 更新日期: 2026-04-21