Transformer作者创建,Hinton、李飞飞、Goodfellow等大佬投资,这家新公司要做什么?

简介: 这家公司的早期投资人包括 Geoffrey Hinton、Ian Goodfellow、李飞飞等一众大佬。

今天,Transformer 作者之一 Aidan Gomez 在推特上宣布,他们创办了一家名为 Cohere 的自然语言处理公司,基于自己训练的大型 NLP 模型为外界提供 API 服务。

微信图片_20211205105811.jpg


那么这家公司是做什么的?为什么今天如此受关注呢?

该公司在主页上写道:

语言对于人类来说至关重要,但计算机在解析语法、语义和语境方面存在困难,这一障碍限制了我们与技术沟通的能力。因此,Cohere 的使命就是构建一种能够理解世界的机器,并让所有人安全地使用它们。


微信图片_20211205105813.jpg


Aidan Gomez 表示,为了达成这一使命,他们训练了一个数十亿(未来可能数千亿)参数的语言模型。利用该模型的 API,我们可以完成文本补全、从文本中提取有语义意义的向量、测量段落语义相似性等任务。用户只需要在自己的系统中载入三行代码就可以调用该模型的能力。

微信图片_20211205105815.jpg

微信图片_20211205105829.jpg


Aidan Gomez 表示,他们将分阶段开放 API,目前官网已经开始接受内测申请。


微信图片_20211205105818.jpg


官网地址:https://cohere.ai/

比公司业务更令人瞩目的是投资阵容。据报道,这家公司的早期投资者包括图灵奖得主 Geoffrey Hinton、GAN 之父 Ian Goodfellow、Uber 首席科学家 Raquel Urtasun、英伟达多伦多研究实验室主任 Sanja Fidler 以及斯坦福大学教授李飞飞等。

团队的创始成员也都是预训练模型领域的资深研究者。其中,联合创始人共有三位。

Aidan Gomez 本科就读于多伦多大学,是牛津大学 Yarin Gal 和 Yee Whye Teh 的博士生。他曾在谷歌大脑团队的 Geoffrey Hinton 和Łukasz Kaiser 组内工作。

他是《Attention is all you need》论文作者之一:

微信图片_20211205105823.jpg

此前,Aidan Gomez 曾领导过一个叫做 FOR.ai 的研究团队,主要成员多来自 Google Brain、牛津大学等,其中也包括 Cohere 的另一位联合创始人 Ivan Zhang。

微信图片_20211205105835.jpg

Cohere 团队成员。

Ivan Zhang 本科同样就读于华盛顿大学,不同的是,他选择了辍学并进入生物技术公司 Ranomics 工作。


另一位联合创始人 Nick Frosst 是 Geoffrey Hinton 在多伦多谷歌大脑实验室的第一位员工,他在那里度过了三年的机器学习研究生涯,主要研究兴趣为胶囊网络、对抗样本和可解释性。本科阶段,他就读于华盛顿大学,完成了计算机科学和认知科学的相关课程。学术领域之外,他也是一支独立摇滚乐队 Good Kid 的成员。

其余二十位 Cohere 创始员工分别负责机器学习、ML Ops、产品等工作。正如官网所表示的那样:「我们有的来自全球顶尖的实验室和高校,但有的辍学了,或者根本没有上过学。」

Aidan Gomez 表示,目前他们还在招人。

GPT-3 等模型的问世让人们看到了大规模预训练模型的潜力,也在国内外掀起了一场创业热潮。前段时间,循环智能与华为联合开发的「盘古 」模型问世,将中文预训练模型的参数量提升到了千亿级别。

「超大规模预训练模型的出现,很可能改变信息产业格局。继基于数据的互联网时代、基于算力的云计算时代之后,接下来可能将进入基于模型的 AI 时代。」清华大学计算机科学与技术系教授唐杰在前段时间接受机器之心采访时曾表示。

循环智能联合创始人杨植麟也同意这一观点。他在采访中提到,这些大模型将来可能开启一种新的商业模式。在这种模式中,开发者可以基于通用 API,结合业务场景,灵活高效地定制行业应用,解锁更多此前想象不到的场景。

在不久的将来,我们也许就能看到大模型为人工智能带来的新的惊喜。


参考链接:https://www.reddit.com/r/MachineLearning/comments/n4s6aq/n_transformer_and_capsule_coinventors_launch_new/

相关文章
|
存储 分布式数据库 Hbase
HBase scan过程简析
HBase scan过程简析。 scan过程总体上是分层处理的,与存储上的组织方式一致,脉络比较清晰; 具体来说,就是region->store→hfile/memstore,分别都有对应的scanner实现进行数据读取; scan请求本身设置的条件,以及server和table层面的一些参数限制,会根据需要分布在不同层次的scanner中进行处理; 2.
2566 0
HBase scan过程简析
|
人工智能 数据挖掘 数据库
拥抱Data+AI|破解电商7大挑战,DMS+AnalyticDB助力企业智能决策
本文为数据库「拥抱Data+AI」系列连载第1篇,该系列是阿里云瑶池数据库面向各行业Data+AI应用场景,基于真实客户案例&最佳实践,展示Data+AI行业解决方案的连载文章。本篇内容针对电商行业痛点,将深入探讨如何利用数据与AI技术以及数据分析方法论,为电商行业注入新的活力与效能。
拥抱Data+AI|破解电商7大挑战,DMS+AnalyticDB助力企业智能决策
|
JavaScript 前端开发 Java
通过Gtest访问C++静态、私有、保护变量和方法
通过Gtest访问C++静态、私有、保护变量和方法
367 1
用图直观上理解梯度算子(一阶)与拉普拉斯算子(二阶)的区别,线检测与边缘检测的区别
用图直观上理解梯度算子(一阶)与拉普拉斯算子(二阶)的区别,线检测与边缘检测的区别
743 1
|
机器学习/深度学习 自然语言处理 搜索推荐
大模型时代了,智能客服就不能智能点?
大模型时代了,智能客服就不能智能点?
254 0
|
安全 Java 关系型数据库
基于springboot的大学生智能消费记账系统的设计与实现(程序+数据库+文档)
基于springboot的大学生智能消费记账系统的设计与实现(程序+数据库+文档)
|
传感器 前端开发 机器人
基于单片机的智能循迹避障小车STC89C52红外对管L298N驱动PWM波控制速度
利用红外对管检测黑线与障碍物,并以STC89C52单片机为控制芯片控制电动小汽车的速度及转向,从而实现自动循迹避障的功能。其中小车驱动由L298N驱动电路完成,速度由单片机输出的PWM波控制。
|
Java
java8 中List根据某一字段 去重 【延伸介绍另外一种方式】
java8 中List根据某一字段 去重 【延伸介绍另外一种方式】
789 0
java8 中List根据某一字段 去重 【延伸介绍另外一种方式】
|
存储 分布式计算 资源调度
MapReduce(一·)
MapReduce(一·)
259 0
MapReduce(一·)