Sora背后团队大揭秘!天才00后?

简介: 当 OpenAI 出手发布 Sora 之后,给人一种降维打击的感觉 —— 效果和之前的技术相比高出了几个档次。这就难免会让人好奇,到底是什么样的人才能做出这样炸裂的工具的呢?今天我们就来盘点一下Sora背后的团队成员。

Sora背后团队大揭秘!天才00后?

现在世界上最受关注的技术团队是哪一支?

Sora 团队,已经来到聚光灯中心。

不仅项目负责人评论区被挤爆,成了𝕏最火“景点”

当 OpenAI 出手发布 Sora 之后,给人一种降维打击的感觉 —— 效果和之前的技术相比高出了几个档次。这就难免会让人好奇,到底是什么样的人才能做出这样炸裂的工具的呢?今天我们就来盘点一下Sora背后的团队成员。

这些参与者中,已知的核心成员包括研发负责人: Tim Brooks、Bill Peebles、系统负责人: Connor Holmes 等。这些成员的信息也成为了众人关注的焦点。

重点来介绍一下Sora的几位主要负责人,包括 Tim 和 Bill 在内,Sora 的主要负责人一共有三名(以下排名不分先后)


Sora的总负责人Tim Brooks,博士毕业于 UC Berkeley 的「伯克利人工智能研究所」BAIR,导师为 Alyosha Efros。

Tim 本科就读于卡内基梅隆大学,主修逻辑与计算,辅修计算机科学,其间在 Facebook 软件工程部门实习了四个月。

2017 年,本科毕业的 Tim 先到 Google 工作了近两年,在 Pixel 手机部门中研究 AI 相机,之后到了伯克利 AI 实验室攻读博士。

在伯克利读博期间,Tim 的主要研究方向就是图片与视频生成,他还在英伟达实习并主导了一项关于视频生成的研究。

回到校园后,Tim 与导师 Alexei Efros 教授和同组博士后 Aleksander Holynski(现在谷歌)一起研制了 AI 图片编辑工具 InstructPix2Pix,并入选 CVPR 2023 Highlight。

Tim在X上的社交帐号上发布了Sora的视频,评论区也是热潮不断,彻底的引爆了24年初的话题

23年1月,Tim 顺利毕业并取得了博士学位,加入了 OpenAI,并且参与了 DALL-E 3 的工作

除了业务能力在线之外,Tim 还是个多才多艺的人。

据 Tim 自己介绍,他还喜欢摄影和音乐,高中时他拍摄的照片获得过 National Geographic 颁发的奖项,本人到过百老汇演出,还获得过 B-box 国际奖项


而与 Tim 师出同门、的 William Peebles,也是 Sora 的另一名负责人。他在 2023 年刚刚获得博士学位,同样也是 Alyosha Efros 的学生。在本科时,Peebles 就读于麻省理工,师从 Antonio Torralba。

Bill 主修计算机科学,参加了 GAN 和 text2video 的研究,还在英伟达深度学习与自动驾驶团队实习,研究计算机视觉。 其发表的论文《Scalable diffusion models with transformers》,入选了计算机视觉顶会 ICCV 2023。这篇论文提出了一种基于 transformer 架构的新型扩散模型即 DiT。在该研究中,研究者训练了潜在扩散模型,用对潜在 patch 进行操作的 Transformer 替换常用的 U-Net 主干网络。他们通过以 Gflops 衡量的前向传递复杂度来分析扩散 Transformer (DiT) 的可扩展性。

论文链接:https://arxiv.org/abs/2212.09748

Bill在X上的社交帐号同样也是赞声一片,大家对Sora这款大模型都抱有着巨大的期待,目前Sora还没有正式的发布,预计可能在四月中旬左右发布,目前据说只有1000个内测名额,且获取资格的要求非常严格,并且用Sora制作的视频不能够外传,现在我们只需要静静地等待它正式发布


Connor Holmes,他是Sora的系统负责人,毕业于科罗拉多矿业大学,电气电子工程学士、高性能计算博士,他在微软工作时以外援形式参与了 DALL・E 3 的推理优化工作,后来直接加入 了OpenAI 。


目前Sora 团队的不少成员都是 DALL-E 3 的作者,包括两位华人 Li Jing 和 Yufei Guo。

Li Jing 是 DALL-E 3 的共同一作,2014 年本科毕业于北京大学物理系,2019 年获得 MIT 物理学博士学位。在 Meta 做了 2 年多博士后之后,Li Jing 于 2022 年加入 OpenAI。

华人作者中还有 Ricky Wang,今年一月刚刚从 Meta / Instagram 跳槽到 OpenAI,另外两位 Yufei Guo、Clarence Ng 没有太多公开资料。

从团队的组建情况和研究基础来看,Sora 应该是 OpenAI短期内的研究成果,毕竟是在Dell-3的基础上展开的研究,并非网传Sora历经了至少一年的的研究。

从ChatGPT到文生图,再到文生视频,那下一个又会是什么呢?

后续

Sora目前还未正式对外上线,后续估计先在GPT Plus覆盖,后续sora 肯定和 文生图一样先给 PLUS 用户使用,所以可以预计未来开放后,很多人需要开Plus 才能去体验 sora。

相关文章:chatgpt学习升级

http://fangze666.com/

相关文章
|
6月前
|
存储 运维 数据可视化
驾驭数据的能力,如同使用ChatGPT一样,是现代职场人的必修课
现代职场所比拼的除了聪明才智、过往经验之外,很多软性技能也尤为重要。现在已经不是像网络游戏开局拿着一根小木棍打天下的时代了,这将是一场武装到牙齿的较量,对于各类“装备”的驾驭能力有时候甚至可以决定胜负。
驾驭数据的能力,如同使用ChatGPT一样,是现代职场人的必修课
|
3月前
|
人工智能 搜索推荐
Science研究揭GenAI双刃剑:GenAI让个人创作出彩却令集体创意趋同
【8月更文挑战第19天】近期《Science》刊载的研究揭示了GenAI对个人创作与集体创意的双刃剑效应。GenAI能显著增强个人创作力,为艺术家提供新颖灵感,协助设计师优化作品,并通过个性化反馈帮助作家提升技能。然而,它也可能导致集体创意趋同,削弱多样性与创新。为平衡二者,研究建议鼓励创作者独立性、加强跨领域合作并建立多元评价体系。论文详情参见:https://www.science.org/doi/10.1126/sciadv.adn5290。
47 1
|
6月前
|
机器学习/深度学习 数据采集 人工智能
人类生产力的解放?揭晓从大模型到AIGC的新魔法
本文从介绍大模型的概念延伸到大模型的革命意义。作者讲述了通过大模型的加持,让AIGC有了更多的可能性。
126985 6
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
【周末闲谈】感受AI时代魅力,创意无界限
【周末闲谈】感受AI时代魅力,创意无界限
73 0
|
SQL 机器学习/深度学习 自然语言处理
个人眼中的大模型
纵观最近两年互联网科技圈,大模型在自然语言工程领域的崛起确实给我们带来了很多新的可能性和机遇。结合我最近阅读了阿里开发者写的《应用开发者的疑问:大模型是真正的银弹吗?》这篇文章,是否可以将大模型视为真正的银弹呢?关于这个问题,我有一些个人观点想要分享一下,分享一下个人是否觉得大模型就是真正的银弹。
165 1
个人眼中的大模型
|
SQL 人工智能 自然语言处理
只有 1% 的人才知道的 ChatGPT 写作技巧
只有 1% 的人才知道的 ChatGPT 写作技巧
2107 0
|
人工智能 缓存 自然语言处理
ChatGPT颠覆者来了,能替代90%的人的工作?
ChatGPT颠覆者来了,能替代90%的人的工作?
|
机器学习/深度学习 人工智能 自然语言处理
ChatGPT的狂欢背后:短板犹在,启发甚多,2023有这些事可以做……
ChatGPT 的强大能力是与生俱来的吗?它有哪些短板?未来它会取代搜索引擎吗?它的出现给我们的 AI 研究带来了哪些启发?针对这些问题,几位 AI 研究者展开了深入对谈。
610 0
ChatGPT的狂欢背后:短板犹在,启发甚多,2023有这些事可以做……
|
人工智能
人工智能创作的一件艺术品获奖引发争论
一名游戏设计师在艺术比赛中提交了由人工智能文本转换图像生成器生成的图像,并获得了一等奖,这引发了争议。
118 0
人工智能创作的一件艺术品获奖引发争论
|
机器学习/深度学习 人工智能 算法框架/工具
机器学习应用行业浮躁、产品差?身为工程师的你是否想转行
十几个小时前,一位机器学习工程师在 reddit 上发帖求助:ML 领域浮躁、门槛低、产品差,无法专心做东西,该不该换个领域?帖子一经发布,立刻引起了大量讨论。
138 0
机器学习应用行业浮躁、产品差?身为工程师的你是否想转行
下一篇
无影云桌面