ACL2024 | OceanGPT(沧渊):面向海洋科学任务的大型语言模型初探

简介: 本文提出了为海洋领域打造的大型语言模型OceanGPT,它能够处理面向海洋科学的问答等生成任务。

 

image.gif

我们在去年发布了OceanGPT并初步探索了其在海洋科学问答、内容生成和水下具身智能能力,该工作近期被自然语言处理顶级会议ACL2024(CCF-A类会议)录用为主会论文。近期我们对OceanGPT进行了进一步的优化和升级,并将其中的部分能力以开源形式进行了更新发布,主要能力升级包括:

  1. 在OceanGPT-7b基础上升级发布OceanGPT-14B/2B两个新版本;
  2. 新增基于Qwen2的中文基座的OceanGPT,提供支持中英文双语能力;
  3. 开源了20K规模的海洋大模型指令数据集OceanInstruct;
  4. 新训练OceanGPT-V多模态版本(提供在线演示,即将开源),支持多模态海洋数据(声呐、科学图片等)处理能力。

背景

海洋覆盖了约 71% 的地球表面,它在全球的气候调节、天气模式、生物多样性以及人类的经济发展都扮演着至关重要的角色。海洋科学的研究关注于海洋的自然特性、其变化规律以及与海洋资源开发和利用相关的理论、方法与应用。因此,本文提出了为海洋领域打造的大型语言模型OceanGPT,它能够处理面向海洋科学的问答等生成任务。另外本文还尝试验证大模型模拟操控水下机器人的潜力,初步探索了大模型驱动的水下具身智能的可能实现方法。

OceanGPT的训练(OceanGPT-7B)

image.gif

数据质量是训练海洋领域大模型的关键。为训练OceanGPT,我们收集了海洋科学语料,其包含多个子领域。由于每个子领域和主题都有独特的特征和模式,我们提出了一种名为 DoInstruct的领域指令生成框架,采用多智能体协作的方式来生成海洋科学的指令微调训练数据。这种方式即可以确保数据的专业性和准确性,也能够实现高效并行的数据生成性能。DoInstruct框架利用智能体(如 GPT-3.5-turbo)作为每个海洋主题的专家,主要包含三大类角色:

  • 演化式的数据合成智能体: 具体来说,智能体主要采取两种协同式的策略,一是补充拓展种子样本的背景知识,二是对种子数据包含的知识点进行细化分析增强和改进;
  • 经过微调的文献阅读智能体: 首先对大模型进行微调得到专门用于文献抽取的智能体模型,从而能够使用智能体从海量海洋语料库中提取高质量文本;
  • 确保数据质量的审核智能体: 在这里预定义了特定海洋科学相关的句法和语义规则,通过提示的方式构建该智能体,最后能够过滤数据来确保生成数据的质量。

基于上述得到的指令数据,我们基于开源模型llama2-7b-chat训练得到OceanGPT-7B,其中部分的指令数据已开源到OceanInstructions

image.gif

image.gif

从实验结果可以看到,本文研究的模型在绝大多数任务上优于基线语言模型。与此作为对比,现有的开源大型语言模型并不能够很好地处理一些需要专业知识的海洋任务。另外我们设计的多智能体数据生成框架能够有效地在海洋领域的各个子领域充当专家,这表明OceanGPT在各种海洋领域是更好的专家模型。

image.gif

我们进一步在微调过程融合了一些符号化的机器人控制指令和代码,然后在模拟器中初步验证OceanGPT对于海底机器人控制(比如轨迹规划)的能力,可以为大模型驱动的水下具身智能的实现提供参考。

新升级能力(OceanGPT-14B/2B)

在前述工作基础之上,近期我们对OceanGPT进行了多方面的升级,包括:

1. 对模型基座(基于Qwen和MiniCPM)进行了更新优化并开源发布OceanGPT-14B/7B/2B三个模型,其中2B模型可支持端侧或边缘侧硬件设备部署,以便更好适配海洋环境下端侧或边缘侧的低计算能力设备。

2. 基于Qwen 2.0基座模型,提升模型的中英双语能力。

3. 对海洋指令数据集进行了扩展,覆盖更为广泛海洋领域知识,并基于部分指令数据集开源了海洋指令数据集OceanInstruct(20K)

4. 新训练OceanGPT-V多模态版本(提供在线演示,即将开源),支持多模态海洋数据(声呐、科学图片等)处理能力。

下面以OceanGPT-14B为例,展示模型的部分能力。

如给定中文问题“请生成一份东海海域海底管缆的建设方案”,可以发现OceanGPT具备较好的海洋科学知识问题的回答能力。首先,从生成内容的丰富度而言,OceanGPT从“项目概述”、“建设目标”、“线路规划”、“技术路线”、“环境影响评估与保护”等八个点来阐述问题,比GPT4的逻辑性相对较好,丰富度也更高。其次从细粒度的知识点来说,OceanGPT的回答内容覆盖了相对更多的层次。比如说在问题中提到了“中国东海”,OceanGPT能够结合东海本身的背景来进行分析回答,比如联系到“东海大陆架”、“舟山群岛”以及“日本海盆”等知识概念。与此作为对比,GPT4的生成结果相对模糊,没有结合问题的场景做具体分析。总的来说,OceanGPT具备相对较好的海洋科学知识理解与生成能力。

image.gif

为验证OceanGPT英文生成能力,给定英文输入“请描述东海海域的海底地形地貌特征”。可以看出OceanGPT的描述覆盖了更多的地形地貌类型,如大陆坡、海沟、浅海平原、环礁和珊瑚岛、洋中脊等。而GPT4的描述则相对简单,仅提及了浅海区和深海区。从深度和专业性的角度来看,OceanGPT不仅描述了地形,还提供了具体的深度信息和相关地质特征,如日本海沟的深度和琉球海脊的地质成因,使得描述更加专业和科学。最后,OceanGPT清晰地划分了东海的不同地貌区域,并逐一进行详细描述,使得读者更容易理解东海海域的地形地貌特征。相比之下,GPT4的描述较为笼统且没有区域划分。通过以上对比分析可以看出,OceanGPT生成的描述在细节、全面性、专业性和区域划分上相对较好,能够提供更为准确和深入的海底地形地貌信息。

image.gif

oceangpt -small-original.gif

相关文章
|
6月前
|
自然语言处理 物联网
化学领域的新篇章:大型语言模型的创新应用
【4月更文挑战第20天】LlaSMol项目成功应用大型语言模型(LLMs)于化学研究,创建SMolInstruct数据集,包含14个化学任务和300万个样本。经过微调,LlaSMol模型在多任务上超越GPT-4,展示LLMs在化学领域的潜力。然而,数据准确性和模型泛化性仍是挑战,未来需进一步研究。[论文链接](https://arxiv.org/pdf/2402.09391.pdf)
79 1
|
2月前
|
机器学习/深度学习 人工智能 算法
首个像人类一样思考的网络!Nature子刊:AI模拟人类感知决策
【9月更文挑战第8天】近日,《自然》子刊发表的一篇关于RTNet神经网络的论文引起广泛关注。RTNet能模拟人类感知决策思维,其表现与人类相近,在反应时间和准确率上表现出色。这项研究证明了神经网络可模拟人类思维方式,为人工智能发展带来新启示。尽管存在争议,如是否真正理解人类思维机制以及潜在的伦理问题,但RTNet为人工智能技术突破及理解人类思维机制提供了新途径。论文详细内容见《自然》官网。
53 3
|
2月前
|
机器学习/深度学习 人工智能 算法
AI伦理边界:当机器决策超越人类认知
【9月更文挑战第5天】AI伦理边界的探索是一个复杂而艰巨的任务,需要政府、企业、学术界和社会各界的共同努力。随着AI技术的不断发展,我们有理由相信,通过不断的探索和实践,我们一定能够找到一条既符合伦理道德又能够充分发挥AI技术潜力的道路。在未来的日子里,让我们携手并进,共同迎接AI技术带来的机遇与挑战。
|
6月前
|
机器学习/深度学习 自然语言处理 安全
18LLM4SE革命性技术揭秘:大型语言模型LLM在软件工程SE领域的全景解析与未来展望 - 探索LLM的多维应用、优化策略与软件管理新视角【网安AIGC专题11.15】作者汇报 综述
18LLM4SE革命性技术揭秘:大型语言模型LLM在软件工程SE领域的全景解析与未来展望 - 探索LLM的多维应用、优化策略与软件管理新视角【网安AIGC专题11.15】作者汇报 综述
648 0
|
机器学习/深度学习 算法 TensorFlow
解读【ICLR2020】多伦多大学:基于策略网络的探索模型规划
解读【ICLR2020】多伦多大学:基于策略网络的探索模型规划
106 0
|
机器学习/深度学习 人工智能 并行计算
全球首创 :分子之心开源新AI算法,攻克蛋白质侧链预测与序列设计难题
全球首创 :分子之心开源新AI算法,攻克蛋白质侧链预测与序列设计难题
146 0
|
机器学习/深度学习 传感器 自然语言处理
一文尽览 | 轨迹预测二十年发展全面回顾!(基于物理/机器学习/深度学习/强化学习)(上)
为了在动态环境中安全驾驶,自动驾驶车辆应该能够预测附近交通参与者的未来状态,尤其是周围车辆,类似于人类驾驶员的预测驾驶能力。这就是为什么研究人员致力于轨迹预测领域并提出不同的方法。本文旨在对过去二十年中提出的自动驾驶轨迹预测方法进行全面和比较性的回顾!!!它从问题公式和算法分类开始。然后,详细介绍和分析了基于物理、经典机器学习、深度学习和强化学习的流行方法。最后,论文评估了每种方法的性能,并概述了潜在的研究方向。
一文尽览 | 轨迹预测二十年发展全面回顾!(基于物理/机器学习/深度学习/强化学习)(上)
|
机器学习/深度学习 传感器 编解码
一文尽览 | 轨迹预测二十年发展全面回顾!(基于物理/机器学习/深度学习/强化学习)(下)
为了在动态环境中安全驾驶,自动驾驶车辆应该能够预测附近交通参与者的未来状态,尤其是周围车辆,类似于人类驾驶员的预测驾驶能力。这就是为什么研究人员致力于轨迹预测领域并提出不同的方法。本文旨在对过去二十年中提出的自动驾驶轨迹预测方法进行全面和比较性的回顾!!!它从问题公式和算法分类开始。然后,详细介绍和分析了基于物理、经典机器学习、深度学习和强化学习的流行方法。最后,论文评估了每种方法的性能,并概述了潜在的研究方向。
一文尽览 | 轨迹预测二十年发展全面回顾!(基于物理/机器学习/深度学习/强化学习)(下)
|
机器学习/深度学习 人工智能 机器人
一项人工智能、化学和分子机器人的交叉研究,加速创新和药物发现,并简化复杂的化学过程自动化
一项人工智能、化学和分子机器人的交叉研究,加速创新和药物发现,并简化复杂的化学过程自动化
|
机器学习/深度学习 人工智能 算法
大型语言模型教会智能体进化,OpenAI这项研究揭示了二者的互补关系
大型语言模型教会智能体进化,OpenAI这项研究揭示了二者的互补关系
162 0
下一篇
无影云桌面