高通技术公司发布AI200 和AI250,重新定义AI 时代机架级数据中心推理性能
 
黄转青  编译  发布日期:2025年10月28日

电子信息
 
  高通技术公司日前宣布推出了专为数据中心设计的新一代人工智能推理优化解决方案:基于高通? AI200 及AI250 芯片的加速卡产品,以及相应的机架式解决方案。Qualcomm AI200 是一款专为机架级应用设计的AI 推理解决方案,旨在实现较低的总体拥有成本,并显著提升大型语言模型及多模态模型推理等AI 任务的性能。该产品每张卡支持768GB 的LPDDR 内存,不仅提供了更大的内存容量,还降低了成本,从而极大地提升了AI 推理应用的扩展性及灵活性。AI250 解决方案采用了基于近存计算的创新内存架构,其在效率与性能方面实现了飞跃性提升——有效内存带宽提升了10 倍以上,同时功耗却大幅降低。这一技术支持分布式人工智能推理功能,有助于高效利用硬件资源,同时满足客户的性能与成本需求。
 
《全球创新型企业动态监测快报》2025年06期
仿站