Ampere与高通合作推出基于Arm的AI服务器

Ampere和高通并不是最明显的合作伙伴。毕竟,两家公司都提供用于运行数据中心服务器的基于Arm架构的芯片(尽管高通最大的市场仍然是移动领域)。但正如两家公司今天宣布的那样,他们现在正在联合力量提供一款专注于AI的服务器,该服务器使用Ampere的CPU和高通的Cloud AI 100 Ultra AI推理芯片来运行模型,而不是进行训练。

和其他芯片制造商一样,Ampere也希望从人工智能热潮中获利。然而,该公司的重点一直是快速和高效的服务器芯片,因此虽然它可以使用Arm IP向其芯片添加一些功能,但这并不一定是其核心业务。这就是为什么Ampere决定与高通合作(并与SuperMicro整合这两个解决方案),Arm首席技术官Jeff Wittich告诉我。

Wittich告诉TechCrunch:“这里的想法是,虽然我将向您展示只使用CPU在Ampere CPU上运行AI推理时取得伟大性能,但如果您想扩展到更大的模型-比如多达1000亿个参数的模型-就像所有其他工作负载一样,AI并非一刀切。”“我们一直与高通合作,结合我们的超高效Ampere CPU执行您正在与推理一起运行的一般任务,并使用他们的非常高效的卡,我们拥有一个服务器级解决方案。”

图片来源:Ampere

至于与高通合作,Wittich表示,Ampere希望提供最佳解决方案。

他说:“我们与高通在这方面有非常好的合作。”“这是我们一直在努力的事情之一,我认为我们分享许多非常相似的兴趣,这就是为什么我认为这非常引人注目。他们正在构建市场的许多不同部分中真正高效的解决方案。我们在服务器CPU方面构建了非常高效的解决方案。”

高通合作是Ampere每年路线图更新的一部分。路线图的一部分是新的256核AmpereOne芯片,采用现代3纳米工艺制造。这些新芯片目前还没有普遍推出,但Wittich表示它们已经在工厂准备就绪,预计将于今年晚些时候推出。

除了额外的核心之外,这一新一代AmpereOne芯片的定义特征是12通道DDR5内存,这使Ampere的数据中心客户能够根据自己的需求更好地调整用户的内存访问。

这里的销售宣传不仅仅是性能,还包括在数据中心运行这些芯片的功耗和成本。特别是在涉及AI推理时,Ampere喜欢将其性能与Nvidia的A10 GPU进行比较。

图片来源:Ampere

Ampere今天还宣布了另一个合作伙伴关系。该公司正在与NETINT合作构建一个联合解决方案,将Ampere的CPU与NETINT的视频处理芯片相结合。这款新服务器将能够并行转码360个直播视频频道,并同时使用OpenAI的Whisper语音转文字模型为40个流添加字幕。