最近云栖大会也是出了一些段子,笔者这里不谈事情,想聊一聊这件事背后透露的一个点:AI大模型相关职业已然成为现在市场急需的主流职业之一,并且目前AI尖端人才存在较大缺口。
那么问题来了:
到底招募什么类型人才,有利于模型研发?
如何培养大模型研发人才?
到底招募什么类型人才,有利于模型研发?
招募人才,“选择”大于“培养”。根据昆仑万维董事长兼CEO方汉的说法,大模型训练应该分成两大块,训练推断与应用开发。按照模型训练的环节,又把人才分为算法侧人才、架构侧人才以及应用开发侧人才,核心算法人才又细分为预训练、数据处理、微调推断优化等等。
目前看,最稀缺的肯定是核心算法人才,为什么呢?这里有一个很有意思的现象,目前各个大学算力是严重不足的,大模型相关方向又是当下热点,能转向这个研究领域的人才特别多,比如NLP,所有做NLP的人才全在转向大模型。
而对于大模型开发者的能力,方汉认为:“在学术成果、实践经验、学历背景和创新意识这几个方面,我们优先考虑的是实践经验和创新意识:首先,大模型训练本质上是个工程问题,那么实践经验肯定是非常重要的。其次,大模型是创新项目,因为所有大模型企业都在齐头并进地去竞争,如果没有创新意识,很难领先于其他人的,因为这是全新的工程方向。我理解的创新与大众定义的创新不太一样,以往更多是算法创新。我所说的创新,首先是紧跟大模型的前沿进展,全球范围内研究大模型训练的人非常多,这个方向进展很快,每天有几百篇新论文出来,在各个方向、领域做改进。第二个是能够从实际需求出发,用新方法来解决在工程上遇到的问题,这里的创新更关注的是如何在技术和工程角度创新地解决问题、提高指标。”
如何培养大模型研发人才?
培养大模型研发人才需要一系列战略和实践的方法,对于高校而言,需要从以下几个关键方面入手:
1 、提供良好的教育和培训:
设立内部培训计划:建立系统的培训计划,包括机器学习、深度学习、自然语言处理等相关领域的基础知识和技能。可以根据不同级别和专业领域制定不同的培训课程。
邀请外部专家进行讲座:邀请具有丰富经验的专家,为团队成员提供特定话题的深入讲解和指导,帮助他们了解最新的技术进展和领域趋势。
合作项目:与高校或科研机构合作开展项目,建立实践和学术交流的渠道,提供机会让团队成员参与到真实的研究和开发中。
2 、实践和项目驱动:
提供丰富的数据集和资源:建立内部数据集和资源库,包括大规模的语料库、预训练模型等。这将有助于团队成员在实际项目中获得更多的实践经验,并进行模型的改进和优化。
定期举办hackathon或项目驱动的比赛:组织内部竞赛,鼓励团队成员合作解决问题,并在真实场景中应用他们的模型。这将促进团队的合作能力和创新思维。
3 、跨学科合作:
搭建合作平台:与其他领域的专家建立合作关系,如语言学家、认知科学家、心理学家等。组织定期会议、工作坊或研讨会,促进跨学科讨论和合作项目的开展。
鼓励交叉培训:组织团队成员之间的交叉培训,让他们了解其他领域的基础知识和技术,加深对多学科融合的理解和应用能力。
4 、寻求导师指导:
设立导师制度:为每个团队成员分配一位有经验的导师,提供个人指导和支持。导师可以定期与成员进行讨论,分享经验和建议,帮助他们克服困难并提高技术能力。
组织导师演讲和经验分享:邀请资深人士进行演讲,分享他们在大模型研发方面的经验和教训。这将激发团队成员的学习热情,并为他们提供学习和成长的机会。
5 、设立科研项目和创新平台:
建立实验室或创新中心:提供良好的工作环境和资源支持,让团队成员能够开展自主研究和创新项目。这些实验室或创新中心可以与高校、科研机构建立合作关系,共享资源和人才。
创建项目孵化器:鼓励团队成员提交自己的创新项目,并提供孵化支持,包括资源、资金和导师指导。这将帮助他们将创新想法转化为具体的项目和成果。
6 、参与学术界和行业交流:
资助参会和研讨会:提供经费支持,鼓励团队成员参加重要的学术会议和研讨会,与其他研究人员进行交流和合作。这有助于他们了解最新的研究进展和技术动态,提高专业水平。
组织内部技术交流会:定期组织内部技术交流会,团队成员可以分享自己的研究进展和项目经验,互相学习和启发。
7 、激励措施和职业发展规划:
设立奖励制度:建立奖励机制,如技术突破奖、项目成果奖等,激励团队成员积极努力,取得优秀成绩。
制定个人职业发展计划:与团队成员一起制定个人职业发展计划,明确目标和发展路径。提供晋升通道和培训机会,帮助他们在大模型研发领域获得更高级别和更广阔的发展空间。
通过以上具体措施的实施,可以建立一个全面的大模型研发人才培养体系,为团队成员提供全面的技术培训、实践机会和交叉学科合作,从而推动大模型研发领域的进步和发展。