核心提示:Arm公司昨日(7月10日)发布博文,为了满足未来生成式AI的需求,扩展提供更多先进智能功能,推出了可以加速AI工作负载的可扩展矩阵扩展2(SME2)技术,开发者无需修改代码,即可集成至现有模型和应用中。
Arm公司昨日(7月10日)发布博文,为了满足未来生成式AI的需求,扩展提供更多先进智能功能,推出了可以加速AI工作负载的可扩展矩阵扩展2(SME2)技术,开发者无需修改代码,即可集成至现有模型和应用中。
该公司指出,在移动设备上的生成式AI应用不再局限于传统的聊天机器人和虚拟助手,而是逐渐发展到生成文本、声音、图像和视频,执行数学推理、以及群聊摘要等诸多高级智能功能。
SME最初出现在Armv9架构中,是一组可选的高级CPU架构扩展,专门设计用于加速矩阵数学运算。
SME2在2022年底首次亮相,在此基础上增加了新功能,据Arm称,它能够实现实时的移动端推理任务,涵盖生成图片、自然语言处理任务等。
安卓手机将拥抱Arm SME2技术,AI性能迎来飞跃
Arm还分享了一些数据,这些数据确实让SME2看起来非常可靠。根据Arm的说法,Google的Gemma 3模型在SME2增强的硬件上,比没有SME2的硬件快6倍。
它可以在单个CPU核心上不到一秒钟内运行800字的文本摘要,IT之家注:这里Arm所指的CPU型号尚不清楚。
对于消费者来说,公告中的关键部分是,未来安卓手机即将具备SME2硬件能力。
到目前为止,SME主要保留给服务器和工作站级处理器,因为其要求较高。然而,SME2被设计为更加可扩展,能够部署在笔记本电脑、平板电脑,以及高端智能手机上。
重要的是,安卓已经准备好支持SME2。SME2在Google的XNNPACK库中启用,并支持llama.cpp、阿里巴巴的MNN和微软的ONNX等框架。
本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至whzhuomai@163.com 举报,一经查实,本站将立刻删除。