LinkedIn公司工程副总裁兼数据和人工智能业务主管徐雅日前在接受行业媒体采访时表示,该公司最近发布的一款生成式人工智能工具的开发过程只用了短短三个月的时间。
LinkedIn公司如何在3个月内发布了基于ChatGPT的人工智能工具音频:00:0004:27
LinkedIn公司工程副总裁兼数据和人工智能业务主管徐雅说,考虑到工程和产品团队基于OpenAI公司最新的GPT模型(包括ChatGPT和GPT-4)以及一些开源模型实施了许多变化,这个时间表对于像LinkedIn这样的大公司来说是前所未有的。该工具包括生成式人工智能协作文章、职位描述和LinkedIn个人资料的个性化写作建议等功能。
徐雅解释说,她带领的开发团队能够在短短一个月内自动生成工作描述,并为实时流量提供服务,拥有共同目标的跨职能团队是关键。她补充说:“这不是说我们每天工作20个小时或下班很晚,而是放下其他事情,专注于完成重要的工作。”
徐雅表示,由于LinkedIn公司是微软旗下的子公司,她确实提前看到了这项技术的未来。在去年秋天,她与LinkedIn公司首席执行官Ryan Roslansky和其他同事一起,迅速开始设想ChatGPT和其他GPT模式如何为LinkedIn公司会员和客户创造更多的应用和服务机会。
LinkedIn公司优先考虑的是工程哲学
徐雅表示,她的团队早期优先考虑的工程理念是“根植于探索,而不是构建成熟的最终产品”。她解释说,适当功能和体验的成熟将随着时间的推移而发生,但通过将生成式人工智能技术交给每个感兴趣的工程师和产品经理,就会鼓励进行这种探索。
通过创建LinkedIn Gateway,可以访问OpenAI模型和来自Hugging Face的开源模型,以及提供LinkedIn的Generative AI Playground,能够使工程师使用来自OpenAI公司和其他来源的高级生成式人工智能模型来探索LinkedIn数据,从而促进了这种探索。该公司还召集数千名工程师参加了LinkedIn公司有史以来规模最大的内部黑客马拉松活动。
此外,LinkedIn公司的员工都需要更好地理解大型语言模型的工作原理,包括如何进行即时工程,以及模型存在哪些潜在问题和限制。
徐雅说:“我们提供了不同层次的教育,例如公司会议、午餐和学习课程,以及为那些更深入参与人工智能开发和研发的人提供更深层次的教育。”
协作也是集成和支持生成式人工智能的重要组成部分。她说,“由于我们的协作文化,我们鼓励不同的团队共享资源。这样他们就可以在能够访问某些生成人工智能模型的开发人员数量由于容量而受到限制的情况下快速开发。我们在团队之间传递关于配额、访问、激励模式和其他最佳实践的经验,以便他们能够更好地相互帮助。”
跑得很快,但要一起跑
徐雅还强调,LinkedIn公司意识到,在生成式人工智能过程中,有些领域需要集中完成。她解释说,虽然在快速运行和共同运行之间总是存在一些紧张关系,但该公司试图保持这些制衡,特别是在涉及负责任的人工智能时。她说:“尽管这可能会放慢团队的速度,但我们需要深思熟虑。”
例如,该公司通过评估管道发布人工智能生成的文章,有经过人工审核的迭代输出,并改变他们的即时工程,直到得到满意的分数。徐雅解释说,LinkedIn公司非常慎重地考虑什么样的是可以容忍的风险,什么是不可以容忍的风险。该公司对不良内容没有容忍度,对灰色地带内容的容忍度也很低。它依赖于工作人员来标记那些要被删除的内容。
她补充说,希望避免任何不良和破坏性的信息,只允许生成和发布安全的和有信息量的内容。例如,她提到Kevin Roose最近在《纽约时报》发表的文章中包括他与微软必应(Bing)聊天机器人聊天的文字记录。文中指出,如果有人分享了如何制作炸弹的指南,那么就会令人担心,但如果有人在与聊天机器人的聊天中给出了如何完成任务的糟糕建议,或者在Roose的案例中评论了他的婚姻,那么就不那么令人担心了。
徐雅说,“这项技术不能只存在于实验室中,必须将投入实际应用中。这样人们就能够以在实验室中从未预料到的方式充分利用它,但需要确保有正确的流程。”她援引了微软首席技术官Kevin Scott最近在这个话题上提出的观点。