首页 > 新车上市 > 新车上市 > 高通发布AI200/AI250数据中心AI加速卡:最早2026年商用,主打机架级推理

高通发布AI200/AI250数据中心AI加速卡:最早2026年商用,主打机架级推理

发布时间:2025-10-30 19:35:28

10月28日,高通技术公司今日发布两款面向数据中心市场的AI推理芯片解决方案——Qualcomm AI200与AI250。这两款产品以加速卡和机架系统形式提供,专门针对大语言模型和多模态模型的推理场景进行优化。

高通发布AI200和AI250芯片:重新定义AI机架 明年起商用

据了解,Qualcomm AI200的单张加速卡可支持768GB LPDDR内存,采用机架级设计架构。该方案通过提升内存容量并降低成本,试图在AI推理的扩展性与灵活性上寻求平衡点。而Qualcomm AI250则引入了近存计算(Near-Memory Computing)技术,官方数据显示,这一架构能够使有效内存带宽提升超过10倍,同时降低功耗表现。

从散热与扩展能力来看,两款机架方案均支持直接液冷技术,并具备PCIe纵向扩展与以太网横向扩展能力。整机架功耗控制在160千瓦,同时配备机密计算功能以保障数据中心工作负载的安全性需求。

高通发布AI200和AI250芯片:重新定义AI机架 明年起商用

高通技术公司高级副总裁兼技术规划、边缘解决方案和数据中心业务总经理马德嘉(Durga Malladi)在发布时表示,这两款产品重新定义了机架级AI推理的能力边界,软件层面覆盖从应用层到系统软件层的完整技术栈,并兼容主流机器学习框架和推理引擎。开发者可通过高通的高效Transformer库以及Qualcomm AI Inference Suite实现模型快速接入,支持Hugging Face模型的一键部署流程。

值得注意的是,AI250方案中提到的解耦式AI推理架构,旨在提升硬件资源的利用效率,这也是当前数据中心AI部署中较为关注的技术方向之一。

从商用时间表来看,Qualcomm AI200预计于2026年实现商用,AI250则计划在2027年推向市场。高通方面透露,未来将以年度迭代节奏推进数据中心产品线,持续在AI推理性能、能效和总体拥有成本方面进行技术演进。

新车上市更多>>

佳能无线麦克风WM-E1-R渲染图曝光:热靴直插+蓝牙传输 马年春节晚会AI 模型大战,谁是最大赢家? Counterpoint报告:TCL登顶2025年12月全球电视出货量榜首 纽约叫停自动驾驶出租车扩张计划,Waymo表示失望 免注册、免费用:DuckDuckGo上线AI修图功能 扎克伯格大砍成本资助AI 上万名Meta员工股权奖励又降了 谷歌Gemini 3.1 Pro发布:推理能力翻倍,专为复杂任务而生 亚马逊成全球营收最高企业,终结沃尔玛13年《财富》500强霸榜 扎克伯格:Meta的目标是让Instagram更具“实用价值” 马斯克亮相达沃斯:FSD最快2月在中国获批 Optimus明年开售 当短视频从流量工具跃升为产业连接器,2025年企业家视频IP正式迈入“生态价值”深水区 阿里拟拆分AI芯片制造部门平头哥上市 京东推出Au99.99黄金手机壳:最高售价超11万,现已无法购买 百川发布医疗大模型Baichuan-M3 Plus:采用“证据锚定”技术 幻觉率降至2.6% GEO火了,流量革命近了? AI硬件爆火这一年,是虚假繁荣还是时代拐点? 余承东:车辆120km/h时 风阻消耗能量可达70% 天籁史无前例大幅降价:B级车杀入A级价格带,最高降5.5万引市场震荡 不得了,这个新技术把视频压缩到了0.02% 乐道L60“马到成功”版车型1月16日上市交付:内饰加入“金马” 社交出海大年,成也AI败也AI 千问App全面接入阿里生态场景,向所有用户开放测试 一代股神巴菲特警告AI技术存在失控风险:堪比“核武器” 苹果全新MacBook Pro将在本月上架:首发M5 Max芯片 Anthropologie、OpenAI和SpaceX已开始筹备IPO 顺丰控股与极兔速递宣布83亿港元战略相互持股 共建全球一体化物流网络 智元成立灵巧手子公司“临界点”,前腾讯Robotics X熊坤带队 软件ETF(515230)涨超2.3%,技术突破与需求回暖驱动行业前景 农村取暖是关乎民生的必答题 勇担上游责任 守护碧水东流——重庆筑牢长江上游生态屏障观察