发布于: 2023-10-13最后更新: 2023-11-10字数 00 分钟

type
status
date
slug
summary
tags
category
论文链接
代码链接
Huggingface Demo
😀
RGCN是基于图网络卷积的知识图谱嵌入模型的开山之作,发表于2017年European semantic web conference,它在传统GCN的基础上考虑了节点周围不同关系链接的其他节点构成邻域的关系不同,不应视为同一关系进行节点信息汇聚,从同构图走向了异构图。由于关系繁多,为每个关系赋予不同权重会导致参数两过大,本文提出了关系参数共享方案。 R-GCN模型应用于链路预测和实体分类两项任务上,对于链路预测任务,通过在关系图中的多个推理步骤中使用编码器模型来积累信息,可以显著改进链路预测的模型;对于实体分类任务,则是类似于GCN论文中,即对每个节点使用一个softmax分类器,通过R-GCN来提取每个节点表示用于节点类别的预测。
 

📝 同构图和异构图

图算法模型种类繁多,以图结构分类可以分为同构与异构图两大类。其中
同构图: 点类型 + 边类型=2(也就是不区分点与边类型)
异构图:点类型 + 边类型>2
在知识图谱中,可以把点(实体)类型视为1,但边(关系)类型在绝大多数情况一定是大于1的,所以知识图谱被视为异构图。
从同构图模型到异构图,差别就是关系、实体的类型差别。像GCN,GAT,GraphSAGE都是以同构图进行研究,沿着这个同构图模型的思想出发,将异构图分成多个含单一关系的同构图,那么会发现,其实只需要解决不同关系之间的交互,就可以套用同构图的思想解决异构图的问题。

图的相关概念

度矩阵: 度矩阵是对角阵,对角上的元素为各个顶点的度。顶点的度表示和该顶点相关联的边的数量。无向图中顶点的度。有向图中,顶点的度分为顶点的出度和入度,即从顶点出去的有向边的数量和进入顶点的有向边的数量。
notion image
邻接矩阵:
邻接矩阵表示顶点间关系,是n阶方阵(n为顶点数量)。邻接矩阵分为有向图邻接矩阵和无向图邻接矩阵。无向图邻接矩阵是对称矩阵,而有向图的邻接矩阵不一定对称。对于有向图,是有方向的,即
notion image
度矩阵和邻接矩阵的关系:
notion image
notion image

✍️ 用GCN处理同构图

分别为第层、第的节点,为度矩阵、为邻接矩阵。
GCN计算方式本质上跟CNN卷积过程一样,是一个加权求和的过程,将邻居点通过度矩阵及其邻接矩阵,计算出各边的权重,然后加权求和。度矩阵负责提供权重,邻接矩阵负责控制哪些点需要汇聚。
GCN首次提出了卷积的方式融合图结构特征,提供一个全新的视角。
主要缺点:
  1. 融合时边权值是固定的,不够灵活。
  1. 可扩展性差,因为它是全图卷积融合,全图做梯度更新,当图比较大时,这样的方式就太慢了,不合适。
  1. 层数加深时,结果会极容易平滑,每个点的特征结果都十分相似。
具体的公式推理过程如下:
notion image

✍️ 用R-GCN处理异构图

notion image

主要思路:

R-GCN在GNN的基础上,在每一种关系下(可理解为就是异构图中的同构子图),指向内与指向外的都作为它的邻居点,同时加自循环特征,进行特征融合,参与更新中心节点。双层循环遍历,遍历每一种关系下,叠加每一个点的邻居点的特征进行融合,最后加上一层的中心节点特征,经过一个激活函数输出作为中心节点的输出特征,其中W为维度转换矩阵,也就是模型参数。
notion image

矩阵规则化方法:

这种思路的典型问题是:不同的关系有不同的,关系数量多会导致参数剧增,文章提出了两种可行的解决思路(矩阵规则化方法):Bias-decomposition(共享转换矩阵参数)和Block-diagonal-decomposition(权重矩阵W由基础小矩阵拼接得到,保证W的稀疏性)。
  1. Bias-decomposition:
    表示分解block个数(常量),为分解的参数关系矩阵,与因子组成一对相关系数,都与关系类型相关,这里不同关系是共享参数
    1. Block-diagonal-decomposition:
    不同关系的为一系列低维矩阵求和。

    节点分类与链路预测

    对于节点分类任务,通过R-GCN的卷积,可以得到每个节点的向量表示,然后再最后一层使用softmax激活函数,得到每个节点的预测类别。最后通过有标签的节点来学习模型的参数,具体的是通过最小化交叉熵损失函数:
    对于链路预测问题,使用一个图自编码器模型,其中括一个实体编码器和一个评分函数。作者用负采样训练模型。对于每一个观察到的例子,都进行负采样。通过随机破坏每个正例子的主题或对象来负采样。对交叉熵损失进行了优化,以使得模型对正样例的预测得分高于负样例。

    参考:

     

    神经网络、符号推理和神经符号推理在知识图谱上的应用
    神经网络、符号推理和神经符号推理在知识图谱上的应用

    知识图谱推理是支持机器学习应用(如信息提取、信息检索和推荐)的基础组成部分。由于知识图谱可以被视为离散的符号知识表示,因此在知识图谱上进行推理可以自然地利用符号技术。然而,符号推理对于模糊和噪声数据是不容忍的。相反,深度学习的最新进展推动了在知识图谱上的神经推理,它对于模糊和噪声数据具有强大的鲁棒性,但与符号推理相比缺乏可解释性。考虑到这两种方法的优缺点,近年来人们开始尝试将这两种推理方法结合起来。在这项调查中,我们全面审视了符号推理、神经推理和混合推理在知识图谱上的发展。我们对两个具体的推理任务进行了调查,即知识图谱补全和知识图谱问答,并在一个统一的推理框架中对它们进行了解释。我们还简要讨论了知识图谱推理的未来发展方向。