重磅!国家标准《信息技术人工智能知识图谱技术框架》征求意见稿发布,35页pdf详细规定知识图谱技术框架

简介: 重磅!国家标准《信息技术人工智能知识图谱技术框架》征求意见稿发布,35页pdf详细规定知识图谱技术框架

【新智元导读】本文件给出了知识图谱的技术框架中知识图谱供应方、知识图谱集成方、知识图谱用户、知识图 谱生态合作伙伴的主要活动、任务组成和质量一般性能等。本文件适用于知识图谱及其应用系统的构建、应用、实施与维护。


来自“ 知识图谱标准化”


本文件给出了知识图谱的技术框架中知识图谱供应方、知识图谱集成方、知识图谱用户、知识图 谱生态合作伙伴的主要活动、任务组成和质量一般性能等。本文件适用于知识图谱及其应用系统的构建、应用、实施与维护。



本文件给出了知识图谱的技术框架中知识图谱供应方、知识图谱集成方、知识图谱用户、知识图 谱生态合作伙伴的主要活动、任务组成和质量一般性能等。本文件适用于知识图谱及其应用系统的构建、应用、实施与维护。


目的意义


当前,人工智能发展进入新阶段,其迅速发展正在深刻改变人类社会生活、 改变世界,成为国际竞争的新焦点和经济发展的新引擎。其中,如何从海量数据 中获取有用的信息是人工智能关注的一个重要问题。知识图谱技术提供了一种从 海量文本和图像等数据中抽取结构化知识的手段,是搜索引擎、问答系统等应用 的核心技术。在国务院发布的《新一代人工智能发展规划》中明确指出要发展“知 识计算引擎和知识服务技术”,重点突破知识加工、深度搜索和可视交互核心技术,实现对知识持续增量的自动获取,具备概念识别、实体发现、属性预测、知 识演化建模和关系挖掘能力,形成涵盖数十亿实体规模的多源、多学科和多数据 类型的跨媒体知识图谱。知识图谱技术提供了一种从海量文本和图像等数据中抽 取结构化知识的手段,是搜索引擎、问答系统等应用的核心技术,并在金融证券、 生物医疗、交通、教育、农业、电信、电商、出版等行业已有非常丰富的应用场 景。但是,目前还缺少一套规范化的知识图谱技术框架指导相关企业,特别是中 小型企业和创业公司有效开展技术研发,同时与其他行业的现有系统之间实现互 联互通和信息融合。存在的问题如下:


1)知识图谱相关核心术语定义缺失,各方使用术语混杂、内容不明确、体 系不统一;2)知识图谱构成描述不统一、不明确,内容划分混乱;

3)知识图谱构建技术路径及主要组成活动间关系不明确;

4)知识图谱应用系统架构不统一,核心模块定义缺失;

5)知识图谱应用系统集成与部署路径及主要组成活动间关系不明确。


本文件在编制过程中,通过参考大量已经发布的国内外标准,并广泛听取产 学研用相关单位的意见和建议,结合知识图谱技术水平和应用现状,对知识图谱 供应方、知识图谱集成方、知识图谱用户、知识图谱生态合作伙伴等利益相关方 划分进行明确,提出了各利益相关方的输入输出关系和主要活动构成等。


范围和主要技术内容


本标准规定了知识图谱的框架,包括知识图谱的输入要求,知识图谱的建立过程,即知识图谱的提取、存储、挖掘与推断、性能指标、知识图谱的应用、相关领域、知识图谱涉及的人工智能技术以及其他需要的数字基础设施。 本标准的目标使用者包括:任意类型与规模的企业,包括应用或实施知识图谱系统的公有和民营企业、政府主管部门、非营利组织等。 本标准的主要技术内容包括:知识图谱架构、输入要求、场景定义、性能指标、构建知识图谱所需的人工智能技术和数字基础设施等。


产业化情况、推广应用论证和预期达到的经济效果


知识图谱作为机器认知智能实现的基础之一,是人工智能的重要组成部分, 有助于实现自动化和智能化获取、挖掘和应用知识,获得了产业界和学术界的广 泛关注。知识图谱是以结构化的形式描述客观世界中的概念、实体及其关系的大 型知识网络,将信息表达成更接近人类认知的形式,提供了一种更好地组织、管 理和理解海量信息的能力。在政策部署、技术研发、标准研制、产业化推广、前 沿应用场景试点等多方面因素的共同驱动下,知识图谱逐渐实现在智慧金融、智 慧医疗、智慧能源、智能制造等众多领域的落地应用和深度融合,同时在各行业 的数字化转型过程中,跨领域、行业或产业的知识图谱也逐渐获得关注。


在上述背景下,本标准对目前知识图谱应用比较好的金融证券、生物医疗、 交通、教育、农业、电信、电商、出版等行业的应用过程特点、需求、主要问题 和未来趋势进行了归纳总结。制定本标准有助于不同类型的企业基于规范化的实 施路径进行知识图谱应用的开发。同时,该标准还有利于给知识图谱研发企业提 供数字化基础设施支持的人员,如云平台研发人员,信息安全工程师等理解知识 图谱,从而提供更有效的技术支持。不同行业的应用企业和人员也可通过这一框 架提取出更多类型的知识,产生更多可能的应用场景。此外,本标准的研制对推 动企业进行知识驱动的数字化转型升级具有重要意义,为进一步加快知识要素的 规划化获取、挖掘、应用与流通奠定了基础。


知识图谱概念模型


知识图谱的概念模型可划分为本体层和实例层,如图1所示。其中,本体层由实体类型和其属性、 实体类型间关系类型、规则等本体相关知识元素构成;实例层是对本体层的实例化,由实体类型对应 的实体及其属性以及实体间关系等实体相关知识元素构成。 图1示出的知识图谱概念模式的主体是实体。实体是真实对象的抽象,实体类型是某类实体的进一 步抽象。基于不同层次的抽象,图中的本体层和与实例层是相对的。构建某个知识领域的某个层次的 特定知识图谱时,“实体”这个抽象称呼将使用所关注的特定对象的具体名称取代。图中名为“属性” 的两个方框是分别针对本体层的所有实体类型和实例层的所有实体。本体层的“属性”是指对应实体 类型的属性,各个属性是概括性描述;实体层的“属性”是指对应实体的属性,是某实体类型实例的 属性的具体描述。同时,多个实体和关系的组合可以构成新的复杂实体,如:由时间、人物、地点等 要素构成的事件,由不同模块构成的产品等。




知识图谱技术框架


图2示出从构建到使用知识图谱涉及的各类技术活动的框架,简称技术框架。这些活动归纳为知识 图谱的构建、基于知识图谱的产品或服务的开发、知识图谱的使用、以及面向知识图谱开发和使用的 辅助支持四大类。


图 2 知识图谱技术框架


图2示出的四大类知识图谱相关活动简述如下:


a) 知识图谱的构建:此组活动主要包括知识表示、知识建模、知识获取等活动。其主要目标是构 建出所需的知识图谱,同时开发出相应的基础工具和/或服务。此组活动的主要依据是知识图 谱应用需求和质量要求;往往需要行业知识、业务数据、辅助知识等予以支持。

b) 基于知识图谱的产品或服务开发:此组活动主要包括需求分析、系统设计、知识图谱集成等活 动。这些活动的执行基于上述a)描述的活动构建的知识图谱和相应的知识图谱应用需求等完成 知识图谱应用系统的开发和集成,并提供配套的产品或服务。

c) 知识图谱的使用:此组活动主要包括知识应用、知识维护、知识提供等活动。这些活动的执行 基于上述b)描述的活动产生的知识图谱应用系统或服务。通过这些活动完成知识的使用和维护, 并对外提供必要的知识。

d) 知识图谱开发和使用的支持:此组活动主要包括基础设施提供、数据提供、安全保障、咨询评 估等。它们对上述a)、b)和c)描述的活动的执行提供必要支持,例如:提供辅助数据或知识、 支撑技术或服务等。


上述四大类活动分别主要由以下四类参与者执行:


1) 知识图谱供应方:主要执行知识图谱的构建和提供活动;

2) 知识图谱集成方:主要执行基于知识图谱的工具或服务开发和集成活动;

3) 知识图谱用户:主要执行知识图谱的使用活动;

4) 知识图谱生态系统合作伙伴:主要执行知识图谱开发和使用的支持活动。每类参与者有其主要执行的活动,同时可能执行涉及四大类活动中的多项活动,知识图谱利益相 关方构成及其关系见附录A。


参考资料:

https://mp.weixin.qq.com/s/B_NGGeGEYMUT1rhmgACscA

相关文章
|
算法 数据挖掘 Go
文献速读|5分生信+免疫组化单细胞联合bulk转录组肿瘤预后模型
研究摘要: 在《Cancer Immunology Immunotherapy》上发表的一篇文章,通过整合Bulk和单细胞RNA-seq数据,探讨了非小细胞肺癌(NSCLC)中癌相关纤维细胞(CAF)的作用。研究者识别出CAF的预后标志物,构建了一个基于CAF的模型,该模型在四个独立队列中区分了预后良好的和较差的患者。WGCNA分析鉴定出CAF标记基因,而CAF分数与免疫微环境和免疫治疗反应相关。高CAF分数关联较差的免疫治疗反应,FBLIM1被发现为CAF的主要来源,其高表达预测了免疫疗法的不良反应。该研究揭示了CAF在NSCLC免疫抑制和治疗策略中的重要地位。
530 1
|
人工智能 数据挖掘 API
AutoGen完整教程和加载本地LLM示例
Autogen是一个卓越的人工智能系统,它可以创建多个人工智能代理,这些代理能够协作完成任务,包括自动生成代码,并有效地执行任务。
1446 0
|
存储 人工智能 自然语言处理
社区供稿 | 开放开源!蚂蚁集团浙江大学联合发布开源大模型知识抽取框架OneKE
OneKE 是由蚂蚁集团和浙江大学联合研发的大模型知识抽取框架,具备中英文双语、多领域多任务的泛化知识抽取能力,并提供了完善的工具链支持。OneKE 以开源形式贡献给 OpenKG 开放知识图谱社区。
|
5月前
|
存储 人工智能 数据库
终于有人把数据中心讲明白了
数据中心是支撑数字世界运行的核心基础设施,承担数据存储、计算、传输等关键任务。它由IT资源层(包括计算、存储、网络)和物理设施层(电力、制冷、建筑)构成,通过稳定、高效的环境保障数据安全与业务连续性。本文详解数据中心的功能、组成及衡量标准,帮助数据化建设者全面理解其运作原理与价值。
|
4月前
|
人工智能 分布式计算 自然语言处理
多智能体系统设计:5种编排模式解决复杂AI任务
本文探讨了多AI智能体协作中的关键问题——编排。文章指出,随着系统从单体模型向多智能体架构演进,如何设计智能体之间的通信协议、工作流程和决策机制,成为实现高效协作的核心。文章详细分析了五种主流的智能体编排模式:顺序编排、MapReduce、共识模式、分层编排和制作者-检查者模式,并分别介绍了它们的应用场景、优势与挑战。最后指出,尽管大模型如GPT-5提升了单体能力,但在复杂任务中,合理的智能体编排仍不可或缺。选择适合的编排方式,有助于在系统复杂度与实际效果之间取得平衡。
810 10
多智能体系统设计:5种编排模式解决复杂AI任务
|
10月前
|
机器学习/深度学习 算法 数据挖掘
探索机器学习在农业中的应用:从作物预测到精准农业
探索机器学习在农业中的应用:从作物预测到精准农业
|
人工智能 API 决策智能
swarm Agent框架入门指南:构建与编排多智能体系统的利器 | AI应用开发
Swarm是OpenAI在2024年10月12日宣布开源的一个实验性质的多智能体编排框架。其核心目标是让智能体之间的协调和执行变得更轻量级、更容易控制和测试。Swarm框架的主要特性包括轻量化、易于使用和高度可定制性,非常适合处理大量独立的功能和指令。【10月更文挑战第15天】
2480 6
|
存储 缓存 Linux
Python pip常用功能说明
pip 是 Python 的一个包管理工具,可以让用户方便地下载和安装 Python 包。pip 可以从 PyPI (Python Package Index) 上下载这些包,并且自动处理依赖关系。PyPI 是一个存储着 Python 包的仓库,用户可以从这个仓库中搜索、下载和安装 Python 包。在使用 pip 安装 Python 包时,由于 PyPI 的服务器位于国外,下载速度可能比较慢,因此我们可以使用国内的镜像源来提高下载速度。常见的国内镜像源有阿里云、清华大学等。
706 6
|
人工智能 JSON Serverless
AI “黏土画风”轻松拿捏,手把手带你云端部署 ComfyUI
ComfyUI 是一款基于节点工作流稳定扩散算法的全新 WebUI,相对于传统的 WebUI,ComfyUI 的部署和学习曲线较陡峭,函数计算基于 Serverless 应用中心开发“ComfyUI 应用模版”,简化开发者的部署流程,帮助简单、快捷实现全新而精致的绘画体验,点击本文查看一键部署 ComfyUI 的方法。
20078 7
|
JSON 自然语言处理 安全
微调大型语言模型进行命名实体识别
大型语言模型的目标是理解和生成与人类语言类似的文本。它们经过大规模的训练,能够对输入的文本进行分析,并生成符合语法和语境的回复。这种模型可以用于各种任务,包括问答系统、对话机器人、文本生成、翻译等。
572 1