微软发布Phi-3，性能超Llama-3，可手机端运行-阿里云开发者社区

微软发布Phi-3，性能超Llama-3，可手机端运行

2024-05-09 99

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【5月更文挑战第8天】微软新发布的phi-3-mini是一款拥有38亿参数的语言模型，可在手机上运行，性能媲美GPT-3.5。通过扩展版筛选数据集和对齐训练提升效能，phi-3还包括70亿和140亿参数的变体，表现更优。此模型的出现标志了移动设备上部署大型语言模型的可能，但也面临计算资源限制和潜在偏见问题，需更多研究确保可靠性和公平性。[链接](https://arxiv.org/abs/2404.14219)

微软最近发布了一份名为Phi-3的技术报告，介绍了一种名为phi-3-mini的新型语言模型。该模型拥有38亿个参数，训练数据达到3.3万亿个标记，其性能在学术基准测试和内部测试中可与Mixtral 8x7B和GPT-3.5等大型模型相媲美，例如在MMLU测试中获得了69%的成绩，在MT-bench测试中获得了8.38分。然而，令人惊讶的是，phi-3-mini的规模足够小，可以在手机上运行。

Phi-3的创新之处在于其训练数据集，这是phi-2所使用的数据集的扩展版本，由经过严格筛选的网络数据和合成数据组成。此外，该模型还经过了进一步的对齐训练，以提高其鲁棒性、安全性和聊天格式的适应性。微软还提供了使用4.8万亿个标记训练的70亿和140亿参数模型的初步参数缩放结果，分别称为phi-3-small和phi-3-medium。这两个模型在MMLU和MT-bench等测试中的表现都明显优于phi-3-mini，例如在MMLU测试中分别获得了75%和78%的成绩，在MT-bench测试中分别获得了8.7和8.9分。

Phi-3的发布对于语言模型领域来说是一个重要的里程碑。首先，它展示了在保持高性能的同时，可以在移动设备上部署大型语言模型的可能性。这为开发人员提供了新的机会，可以在各种移动应用程序中利用语言模型的功能。其次，Phi-3的训练数据集和对齐方法可能为其他研究人员提供了有用的经验教训，以改进他们自己的语言模型。

然而，Phi-3也存在一些潜在的问题。首先，尽管phi-3-mini可以在手机上运行，但其性能可能受到移动设备的计算能力和内存限制的影响。因此，在实际应用中，phi-3-mini可能无法达到与大型模型相同的性能水平。其次，Phi-3的训练数据集和对齐方法可能存在一些偏见和限制，这可能会影响模型的鲁棒性和公平性。因此，在将Phi-3用于实际应用之前，需要进行更多的研究和测试，以确保其性能和可靠性。

Phi-3 技术报告：https://arxiv.org/abs/2404.14219

微软发布Phi-3，性能超Llama-3，可手机端运行

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

微软发布Phi-3，性能超Llama-3，可手机端运行

热门文章

最新文章

相关课程

相关电子书

相关实验场景