CHRONOS:阿里通义联合上海交大推出时间线摘要生成框架,适用于大规模新闻数据的时间线生成任务

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: CHRONOS 是由阿里通义实验室与上海交大联合推出的时间线摘要生成框架,支持开放域与封闭域,通过迭代自问自答机制生成连贯的时间线摘要,适用于新闻、金融、教育等多个领域。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 功能:CHRONOS 支持开放域与封闭域的时间线摘要生成,适用于新闻、金融、教育等多个领域。
  2. 技术:基于迭代自问自答机制,结合大型语言模型(LLMs)和问题重写技术,生成连贯的时间线摘要。
  3. 应用:广泛应用于新闻报道整理、金融事件追踪、政策分析等场景,帮助用户快速理解事件发展脉络。

正文(附运行示例)

CHRONOS 是什么

chronos-overview

CHRONOS 是由上海交通大学计算机科学与工程系、阿里巴巴集团通义实验室等机构联合推出的时间线摘要生成框架。该框架基于迭代自问自答的方式,利用大型语言模型(LLMs)构建开放域和封闭域的时间线。CHRONOS 通过生成与新闻主题相关的 5W1H 问题,检索相关信息,逐步扩展新闻数据库,最终生成连贯的事件摘要。

CHRONOS 在实验中表现出色,能够有效处理信息过载和数据噪声问题,适用于大规模新闻数据的时间线生成任务。其核心优势在于能够通过问题重写机制提高搜索精度,并采用分而治之的策略生成并合并时间线。

CHRONOS 的主要功能

  • 新闻时间线生成:从大量新闻文档中提取关键事件,按照时间顺序生成连贯的时间线摘要。
  • 开放域和封闭域支持:支持从互联网直接检索新闻生成时间线,也支持在预定义的新闻集中构建时间线。
  • 迭代自问自答:通过不断提出与新闻主题相关的问题,逐步扩展和丰富时间线内容,确保信息的全面性和准确性。
  • 问题重写与优化:将复杂问题分解为更具体的查询,提高搜索的精确性和效率,获取更相关的信息。
  • 数据集支持:引入 Open-TLS 数据集,提供丰富的新闻时间线样本,用于训练和评估模型性能。

CHRONOS 的技术原理

  • 基于检索的生成:通过检索外部知识源(如互联网或预定义的新闻集)增强语言模型的生成能力,解决信息过载和数据噪声问题。
  • 迭代自问自答机制:模拟人类信息检索过程,生成 5W1H 问题,逐步深入挖掘与新闻主题相关的事件信息,构建事件之间的因果关系图。
  • 问题重写技术:利用 LLMs 对复杂问题进行分解和重写,生成更具体、更易于检索的查询,提高检索结果的相关性和准确性。
  • 分而治之的策略:将时间线生成任务分解为多个子任务,分别从每一轮检索中生成单独的时间线,通过合并和冲突解决等步骤,生成最终的连贯时间线摘要。
  • 大型语言模型(LLMs):作为核心工具,用于理解文本、生成高质量的摘要和问题,并进行有效的信息检索和整合。

如何运行 CHRONOS

1. 安装依赖

首先,确保你已经安装了所有必要的依赖项。可以通过以下命令安装:

pip install -r requirements.txt

2. 生成示例问题

接下来,生成与主题相关的问题示例。运行以下命令:

python question_exampler.py

你也可以使用我们提供的 data/question_examples.json 文件,其中包含了针对 crisis, T17 和 Open-TLS 数据集的示例问题。

3. 运行 CHRONOS

运行 CHRONOS 框架,生成时间线摘要。具体命令如下:

python chronos.py

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
4天前
|
自然语言处理 安全 搜索推荐
阿里通义等提出Chronos:慢思考RAG技术助力新闻时间线总结
在数字化时代,新闻信息的指数级增长使得从海量文本中提取和整理历史事件的时间线变得至关重要。为了应对这一挑战,阿里巴巴通义实验室与上海交通大学的中断者提出了一种基于Agent的新闻时间线摘要新框架——CH RONOS,源自希腊神话中的时间之神柯罗诺斯,该框架通过迭代多轮的自我提问方式,结合检索增强生成技术,从互联网上检索相关事件信息,并生成时间顺序的新闻摘要,为新闻时间线摘要生成提供了一种全新的解决方案。
|
4天前
|
人工智能 自然语言处理 搜索推荐
浙大通义联手推出慢思考长文本生成框架OmniThink,让AI写作突破知识边界
随着大模型(LLMs)的发展,AI 写作取得了较大进展。然而,现有的方法大多依赖检索知识增强生成(RAG)和角色扮演等技术,其在信息的深度挖掘方面仍存在不足,较难突破已有知识边界,导致生成的内容缺乏深度和原创性。
|
1月前
|
人工智能 前端开发 程序员
通义灵码 AI 程序员全面上线,能和人类协作完成复杂开发任务
1 月 8 日消息,阿里云通义灵码 AI 程序员已全面上线,成为全球首个同时支持 VS Code、JetBrains IDEs 开发工具的 AI 程序员产品。此次上线的 AI 程序员相比传统 AI 辅助编程工具,能力更全面,可以让开发者以更高效、更沉浸的方式完成编码任务,通过全程对话协作的方式,就能完成从 0 到 1 的业务需求开发、问题修复、单元测试批量生成等复杂编码任务。
335 65
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
Qwen2.5-Max:阿里通义千问超大规模 MoE 模型,使用超过20万亿tokens的预训练数据
Qwen2.5-Max是阿里云推出的超大规模MoE模型,具备强大的语言处理能力、编程辅助和多模态处理功能,支持29种以上语言和高达128K的上下文长度。
597 12
Qwen2.5-Max:阿里通义千问超大规模 MoE 模型,使用超过20万亿tokens的预训练数据
|
19天前
|
存储 人工智能 自然语言处理
OmniThink:浙大联合阿里通义开源 AI 写作框架,基于深度思考扩展知识边界,实时展示思考过程
OmniThink 是浙江大学与阿里通义实验室联合开发的机器写作框架,通过模拟人类迭代扩展和反思过程,生成高质量长篇文章,显著提升知识密度和内容深度。
147 12
OmniThink:浙大联合阿里通义开源 AI 写作框架,基于深度思考扩展知识边界,实时展示思考过程
|
2月前
|
人工智能 开发框架 算法
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
Qwen-Agent 是阿里通义开源的一个基于 Qwen 模型的 Agent 应用开发框架,支持指令遵循、工具使用、规划和记忆能力,适用于构建复杂的智能代理应用。
551 10
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
|
2月前
|
机器学习/深度学习 人工智能 达摩院
ClearerVoice-Studio:阿里通义开源的语音处理框架,提供语音增强、分离和说话人提取等功能
ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架,集成了语音增强、分离和音视频说话人提取等功能。该框架基于复数域深度学习算法,能够有效消除背景噪声,保留语音清晰度,并提供先进的预训练模型和训练脚本,支持研究人员和开发者进行语音处理任务。
471 3
ClearerVoice-Studio:阿里通义开源的语音处理框架,提供语音增强、分离和说话人提取等功能
|
3月前
|
人工智能 API
OmniSearch:阿里巴巴通义推出的多模态检索增强生成框架
本文介绍了阿里巴巴通义实验室推出的多模态检索增强生成框架 OmniSearch,该框架具备自适应规划能力,能够动态拆解复杂问题,根据检索结果和问题情境调整检索策略,从而提升检索效率和准确性。
336 5
OmniSearch:阿里巴巴通义推出的多模态检索增强生成框架
|
1月前
|
编解码 Cloud Native 算法
通义万相:视觉生成大模型再进化
通义万相是阿里云推出的视觉生成大模型,涵盖图像和视频生成。其2.0版本在文生图和文生视频方面进行了重大升级,采用Diffusion Transformer架构,提升了模型的灵活性和可控性。通过高质量美学标准和多语言支持,大幅增强了画面表现力。此外,视频生成方面引入高压缩比VAE、1080P长视频生成及多样化艺术风格支持,实现了更丰富的创意表达。未来,通义万相将继续探索视觉领域的规模化和泛化,打造更加通用的视觉生成大模型。
|
27天前
|
人工智能 自然语言处理 API
用AI Agent做一个法律咨询助手,罗老看了都直呼内行 feat.通义千问大模型&阿里云百炼平台
本视频介绍如何使用通义千问大模型和阿里云百炼平台创建一个法律咨询助手AI Agent。通过简单配置,无需编写代码或训练模型,即可快速实现智能问答功能。演示包括创建应用、配置知识库、上传民法典文档、构建知识索引等步骤。最终,用户可以通过API调用集成此AI Agent到现有系统中,提供专业的法律咨询服务。整个过程简便高效,适合快速搭建专业领域的小助手。
179 22

热门文章

最新文章