【新智元导读】苹果昨日发布了一个分支版本的 TensorFlow 2.4,这是为其最新的 M1芯片版本的 Mac 电脑优化的。苹果公司表示,通过利用 macOS Big Sur 上的 ML Compute 框架,TensorFlow 2.4的 Mac 优化版本允许开发人员在 M1 的 8核 CPU 和 8核 GPU 等硬件上加速处理器(CPU)和图形卡(GPU)的训练。
长期以来,Mac 一直是开发人员、工程师和研究人员喜爱的平台。随着苹果上周包含新 M1芯片的 Mac 电脑更新阵容,苹果的 Mac 优化版 TensorFlow 2.4 释放了 Mac 的全部能力,在性能上有了巨大的飞跃。
一直以来,训练复杂的人工智能模型对于开发人员来说代价都过于昂贵。
Google 曾花费了大约6912美元来训练 BERT,重新定义了11个自然语言处理任务的最新技术。虽然像 BERT 这样的训练可能仍然超出像 Macbook 这样的普通硬件的范围,但新的 Mac 优化的 TensorFlow 软件包有望降低进入门槛,使企业能够比以前更容易、更便宜地训练和部署模式。
根据苹果公司的说法,TensorFlow 2.4 的新 macOS 分支从应用更高层次的优化开始,比如融合神经网络的 Layers,选择合适的设备类型,编译和执行图,以及在 CPU 上的 BNNS 和 GPU 上的 Metal Performance Shaders 上加速。
M1芯片包含了一个强大的新的8核 CPU 和多达8核的 GPU,这些都是针对 Mac 电脑上的机器学习训练任务进行优化的。
苹果声称,TensorFlow2.4 的用户在13英寸的 MacBook Pro 上使用 M1芯片可以获得最高 7倍的训练提速。
根据苹果内部的 benchmark 显示,像 mobileenetv3 这样的模型在配备 M1 芯片和新版 TensorFlow 的13英寸 MacBook Pro 上只需要1秒钟,而在配备英特尔(intel)驱动的13英寸 MacBook Pro 上运行老版 TensorFlow 则需要2秒钟。
此外,该公司声称,在Intel版本的2019年 Mac Pro 上使用 TensorFlow 优化训练一种风格转换算法,可以在2秒左右完成,而在未优化的 TensorFlow 版本上只需6秒。
苹果对 TensorFlow 的改进,是新版 M1 Mac 吸引开发者使用 Mac 平台的首批例子之一。新 Mac 中的 M1 芯片取代了英特尔x86处理器的使用,但通过采用苹果的 Rosetta2 二进制转换技术,还可以运行为x86编译的软件。
然而,Rosetta2 转换的应用程序会导致性能下降,有些基准测试的运行速度慢至本地速度的59% 。对于性能敏感的应用程序,可以编译它们并在 M1上运行。
苹果推出的新框架 ML Compute 为在 Mac 上进行 TensorFlow 模型的训练提供了动力,现在你可以在 M1和 Intel 驱动的 Mac 上利用加速的 CPU 和 GPU 进行训练。
谷歌内部人士在一篇博客文章中写道: “凭借 TensorFlow 2,在各种不同平台、设备和硬件上的最佳培训表现,开发人员、工程师和研究人员可以在他们喜欢的平台上工作”,“这些改进,再加上苹果开发者通过 TensorFlow Lite 在 iOS 上执行 TensorFlow 的能力,继续展示了 TensorFlow 在支持苹果硬件上高性能机器学习执行方面的广度和深度。”
苹果和谷歌都表示,用户不需要修改现有的 TensorFlow 脚本就可以使用 ML Compute 作为 TensorFlow 的后端,未来这两家公司计划开始将分支版本的 TensorFlow 2.4集成到 TensorFlow 主分支中。
而现在,用户不需要对现有的 TensorFlow 脚本进行任何更改,就可以使用 ML Compute 作为 TensorFlow 和 TensorFlow 插件的后端。
在不久的将来,Tensorflow 官方还表示将通过把分支版本集成到 TensorFlow 主分支中,让用户更容易获得这些性能数据,想必使用搭载M1芯片的Mac进行开发,会释放出更大的潜力。