《异构信息网络挖掘: 原理和方法(1)》一1.2 为什么异构网络挖掘是一项新的挑战

简介:

本节书摘来自华章出版社《异构信息网络挖掘: 原理和方法(1)》一书中的第1章,第1.2节,作者[美]孙艺洲(Yizhou Sun)韩家炜(Jiawei Han),更多章节内容可以访问云栖社区“华章计算机”公众号查看

1.2 为什么异构网络挖掘是一项新的挑战

已设计出许多方法用于分析同构信息网络,特别是在社交网络[1]领域,已有排名、社区探测、链接预测、影响分析等方法。然而,这些方法中的大多数并不能直接应用于异构信息网络挖掘。这不仅是因为连接不同类型实体的异构链接可能携带不一样的语义,还因为一般情况下,异构信息网络比同构网络具有更加丰富的信息。通常,对异构信息网络进行投影可以得到同构信息网络,但是这样会明显地丢失信息。例如,对一个完整的异构文献网络在合作者信息上进行投影,可以得到一个合作者网络。然而,这样的投影会丢失作者在什么主题、哪些论文上进行了合作的重要信息。此外,基于异构信息网络中所蕴含的丰富的异构信息,许多强大、新颖的数据挖掘功能被设计出来,用于发现隐藏在实体间异构链接中的丰富信息。
为什么异构网络挖掘是一项新的挑战?显然,信息在异构节点和链接间的传播与其在同构节点和链接间的传播可能相当不一样。根据我们对异构信息网络的研究,特别是我们关于基于排名的聚类[66;69]、基于排名的分类[30;31]、基于元路径相似性搜索[65]、关系预测[62;63]、关系强度学习[61;67]和网络演化[68]这些研究,使得我们确信存在一组能够引导对异构信息网络进行系统分析的新原理。我们将它们总结如下。
1)异构链接间的信息传播。类似于大多数的网络分析研究,链接应被用于信息传播。然而,一个新的问题是
如何在异构类型的节点和链接间传播信息,特别地,在异构节点和链接间如何计算排名分数、相似性分数,聚类,以及充分利用类标签。无论我们如何制定新的、巧妙的度量、定义和方法,黄金原则是网络中的对象是相互依存的,且知识只能通过网络的整体信息来进行挖掘。
2)基于网络元结构探索的搜索和挖掘。不同于同构信息网络中把对象和链接要么看作是相同类型,要么看作是无类型的节点和链接,在我们的模型中,异构信息网络是半结构且有类型的,即与信息网络中的节点和链接相关联的类型集合的结构形成了网络模式。网络模式提供了信息网络的元结构。这种模式提供了对网络进行搜索和挖掘的指导,有助于分析、理解网络中对象和关系的语义。本书随后介绍的基于元路径的相似性搜索和挖掘能展现网络元结构探索的价值与能力。
3)用户引导的信息网络探索。在异构信息网络中,往往存在大量的、跨多个对象类型的语义关系,它们携带着并不明显的语义差异。给定用户的一个应用,可能关系或元路径的某个特定加权组合对其是最适合的。因此,对于基于用户引导或反馈的特定的搜索或挖掘任务来说,自动选择关系(或元路径)组合的恰当权重通常是很有必要的。基于用户引导或反馈的网络探索是一个有用的策略。

相关文章
|
2月前
|
网络协议 安全 5G
网络与通信原理
【10月更文挑战第14天】网络与通信原理涉及众多方面的知识,从信号处理到网络协议,从有线通信到无线通信,从差错控制到通信安全等。深入理解这些原理对于设计、构建和维护各种通信系统至关重要。随着技术的不断发展,网络与通信原理也在不断演进和完善,为我们的生活和工作带来了更多的便利和创新。
69 3
|
2天前
|
机器学习/深度学习 数据采集 人工智能
基于Huffman树的层次化Softmax:面向大规模神经网络的高效概率计算方法
层次化Softmax算法通过引入Huffman树结构,将传统Softmax的计算复杂度从线性降至对数级别,显著提升了大规模词汇表的训练效率。该算法不仅优化了计算效率,还在处理大规模离散分布问题上提供了新的思路。文章详细介绍了Huffman树的构建、节点编码、概率计算及基于Gensim的实现方法,并讨论了工程实现中的优化策略与应用实践。
45 15
基于Huffman树的层次化Softmax:面向大规模神经网络的高效概率计算方法
|
27天前
|
运维 物联网 网络虚拟化
网络功能虚拟化(NFV):定义、原理及应用前景
网络功能虚拟化(NFV):定义、原理及应用前景
42 3
|
1月前
|
网络协议 安全 算法
网络空间安全之一个WH的超前沿全栈技术深入学习之路(9):WireShark 简介和抓包原理及实战过程一条龙全线分析——就怕你学成黑客啦!
实战:WireShark 抓包及快速定位数据包技巧、使用 WireShark 对常用协议抓包并分析原理 、WireShark 抓包解决服务器被黑上不了网等具体操作详解步骤;精典图示举例说明、注意点及常见报错问题所对应的解决方法IKUN和I原们你这要是学不会我直接退出江湖;好吧!!!
网络空间安全之一个WH的超前沿全栈技术深入学习之路(9):WireShark 简介和抓包原理及实战过程一条龙全线分析——就怕你学成黑客啦!
|
2月前
|
机器学习/深度学习 人工智能 监控
深入理解深度学习中的卷积神经网络(CNN):从原理到实践
【10月更文挑战第14天】深入理解深度学习中的卷积神经网络(CNN):从原理到实践
175 1
|
2月前
|
机器学习/深度学习 存储 分布式计算
未来趋势:探索GraphRAG在大规模异构网络环境下的挑战与机遇
【10月更文挑战第11天】随着互联网和物联网技术的快速发展,数据不仅数量庞大,而且类型多样,形成了复杂的大规模异构网络。这些网络中包含了不同类型的节点(如文本、图像、视频等)以及它们之间的多种关系。如何有效地处理这种大规模异构网络,以便进行内容理解与生成,是当前研究的一个热点问题。Graph Retrieval-Augmented Generation (GraphRAG) 框架作为一种新兴的方法,在这一领域展现出了巨大的潜力。本文将深入探讨GraphRAG的基础理论、构建方法,并分析其在未来大规模异构网络环境下的挑战与机遇。
166 3
|
2月前
|
网络协议 Linux 应用服务中间件
Socket通信之网络协议基本原理
【10月更文挑战第10天】网络协议定义了机器间通信的标准格式,确保信息准确无损地传输。主要分为两种模型:OSI七层模型与TCP/IP模型。
|
2月前
|
机器学习/深度学习 计算机视觉
TPAMI 2024:计算机视觉中基于图神经网络和图Transformers的方法和最新进展
【10月更文挑战第3天】近年来,图神经网络(GNNs)和图Transformers在计算机视觉领域取得显著进展,广泛应用于图像识别、目标检测和场景理解等任务。TPAMI 2024上的一篇综述文章全面回顾了它们在2D自然图像、视频、3D数据、视觉与语言结合及医学图像中的应用,并深入分析了其基本原理、优势与挑战。GNNs通过消息传递捕捉非欧式结构,图Transformers则结合Transformer模型提升表达能力。尽管存在图结构构建复杂和计算成本高等挑战,但这些技术仍展现出巨大潜力。论文详细内容见:https://arxiv.org/abs/2209.13232。
117 3
|
1月前
|
网络协议 安全 算法
网络空间安全之一个WH的超前沿全栈技术深入学习之路(9-2):WireShark 简介和抓包原理及实战过程一条龙全线分析——就怕你学成黑客啦!
实战:WireShark 抓包及快速定位数据包技巧、使用 WireShark 对常用协议抓包并分析原理 、WireShark 抓包解决服务器被黑上不了网等具体操作详解步骤;精典图示举例说明、注意点及常见报错问题所对应的解决方法IKUN和I原们你这要是学不会我直接退出江湖;好吧!!!
|
2月前
|
机器学习/深度学习 算法 数据建模
计算机前沿技术-人工智能算法-生成对抗网络-算法原理及应用实践
计算机前沿技术-人工智能算法-生成对抗网络-算法原理及应用实践
33 0