图深度学习-2-图论基础

图神经网络的图论基础

kascas

1387人浏览 · 2021-12-09 17:46:11

kascas · 2021-12-09 17:46:11 发布

二、图论基础

2.1 图的简介

图（Graph）描述了实体之间的两两关系，是诸多领域中真实数据的基本表示方法。

2.2 图的表示

【图】一个图可表示为 $G=\{V,E\}$ ，其中 $,vN}V=\{v_1,v_2,\cdots,v_N\}$ 是大小为N的节点集合， $,eM}E=\{e_1,e_2,\cdots,e_M\}$ 是大小为M的边集合。

【相邻】两个节点相邻当且仅当它们之间存在一条边

连接两个节点的边与这两个节点相关联

【邻接矩阵】给定一个图 $G=\{V,E\}$ ，对应的邻接矩阵可表示为 $\in \{0,1\}^{N\times N}$ 。邻接矩阵A的第i行第j列元素 $A_{i,j}$ 表示节点 $v_i$ 与 $v_j$ 的连接关系。如果 $v_i$ 与 $v_j$ 相邻，则 $A_{i,j}=1$ ，否则为0。

无向图的邻接矩阵一定是对称的

2.3 图的性质

2.3.1 度

【度】在图 $G=\{V,E\}$ 中，节点 $vi∈Vv_i\in V$ 的度 $d(v_i)$ 为图G中与节点 $v_i$ 相关联的边的数目

节点的度可由邻接矩阵计算： $d(vi)=∑j=1NAi,jd(v_i)=\sum_{j=1}^{N}A_{i,j}$
图中所有节点的度之和是图中边的数量的二倍
无向图邻接矩阵的非零元素的个数是边的数量的二倍

【邻域】在图 $G=\{V,E\}$ 中，节点 $v_i$ 的邻域 $N(v_i)$ 是所有与其相邻的节点的集合。

一个节点的邻域的元素个数等于节点的度

2.3.2 连通度

【途径】图的途径是节点和边的交替序列，以一个节点开始，以一个节点结束，其中每条边与紧邻的节点相关联

节点u起到节点v的途径表示为 $u - v$ 途径
途径的长度为途径中包含边的数量
u-v途径不是唯一的

【迹】迹是边各不相同的途径

【路】路是节点各不相同的途径

对于图 $G=\{V,E\}$ 及其邻接矩阵A， $A^n$ 的第i行第j个元素等于长度为n的 $v_i-v_j$ 途径的个数。

【子图】子图由图的节点集子集和边集子集组成，且节点集子集必须包括边集自己的所有节点

【连通分量】给定图 $G=\{V,E\}$ ，如果一个子图中任意一对节点之间都至少存在一条路，且子图的节点集不与节点集补集有联系，则该子图为一个连通分量。

【连通图】如果图中只有一个连通分量，则图为连通图

【最短路】 $min⁡p∈Pst∣p∣p^{sp}_{st}=\argmin_{p\in P_{st}}|p|$

任意给定的节点对之间可能有多条最短路

【直径】 $diameter(G)=max⁡vs,vt∈Vmin⁡p∈Pst∣p∣diameter(G)=\max_{v_s,v_t\in V}\min_{p\in P_{st}}|p|$

2.3.3 中心性

在图中，节点的中心性同于衡量节点在图中的重要性。

【度中心性】 $cd(vi)=d(vi)=∑j=1NAi,jc_d(v_i)=d(v_i)=\sum_{j=1}^{N}A_{i,j}$

【特征向量中心性】 $ce(vi)=1λ∑j=1NAi,j⋅ce(vj)c_e(v_i)=\frac{1}{\lambda}\sum_{j=1}^{N}A_{i,j}\cdot c_e(v_j)$

矩阵表示为 $ce=1λA⋅cec_e=\frac{1}{\lambda}A\cdot c_e$
一个元素全为正的实方阵具有唯一的最大特征值，其对应的特征向量的元素全为正

【Katz中心性】 $ck(vi)=α∑j=1NAi,jck(vj)+βc_k(v_i)=\alpha\sum_{j=1}^{N}A_{i,j}c_k(v_j)+\beta$

矩阵表示为 $ck=αA⋅ck+βc_k=\alpha A \cdot c_k+\beta$
特征向量中心性的变体，不仅考虑了邻居的中心性，而且包含了一个常数考虑中心节点本身

【介数中心性】 $cb(vi)=∑vs≠vi≠vtσst(vi)σstc_b(v_i)=\sum_{v_s\neq v_i\neq v_t}\frac{\sigma_{st}(v_i)}{\sigma_{st}}$ 。其中 $σst\sigma_{st}$ 为所有从节点 $v_s$ 到节点 $v_t$ 最短路的数目， $σst\sigma_{st}$ 表示这些路中经过节点 $v_i$ 的数目

归一化： $cnb(vi)=2×∑vs≠vi≠vtσst(vi)σst(N−1)(N−2)c_{nb}(v_i)=\frac{2\times \sum_{v_s\neq v_i\neq v_t}\frac{\sigma_{st}(v_i)}{\sigma_{st}}}{(N-1)(N-2)}$

2.4 谱图论

谱图论通过分析图的拉普拉斯矩阵的特征值和特征向量研究图的性质。

2.4.1 拉普拉斯矩阵

【拉普拉斯矩阵】对于图 $G=\{V,E\}$ 及其邻接矩阵 $A$ ，拉普拉斯矩阵定义为 $L = D - A$ 。式中 $D$ 为对角矩阵， $,d(vN))D=diag(d(v_1).d(v_2),\cdots,d(v_N))$

归一化拉普拉斯矩阵： $L′=D−12(D−A)D−12=I−D−12AD−12L'=D^{-\frac{1}{2}}(D-A)D^{-\frac{1}{2}}=I-D^{-\frac{1}{2}}AD^{-\frac{1}{2}}$
拉普拉斯矩阵是半正定、对称矩阵

2.4.2 拉普拉斯矩阵的特征值与特征向量

【定理】图的拉普拉斯矩阵的特征值非负

【定理】图的拉普拉斯矩阵中特征值为0的数量等于图中连通分量的数量

2.5 图信号处理

图信号，即图数据结构中存在的与节点相关联的特征或属性，它捕获结构信息（或节点之间的连接）和数据（或节点上的属性）。

图信号由图 $G=\{V,E\}$ 和在节点域上定义的将节点映射为实数值的映射函数 $f:V→RN×df:V\rightarrow \mathrm{R}^{N\times d}$ 构成，其中 $d$ 为节点属性向量的维数。如果图中相邻节点的属性值相似，则称这个图是平滑的，即平滑的图信号是低频的。图信号 $f$ 的平滑度/频率可由拉普拉斯矩阵二次型 $f^TLf$ 测量。

【图的傅里叶变换】 $f^[l]=<f,ul>=∑i=1Nf[i]ul[i]\hat{f}[l]=<f,u_l>=\sum_{i=1}^{N}f[i]u_l[i]$ ，其中 $u_l$ 代表拉普拉斯矩阵的第 $l$ 个特征向量，对应的特征值 $λl\lambda_{l}$ 表示 $u_l$ 的频率（平滑度）。

矩阵表示： $f^=UTf\hat{f}=U^Tf$ ，其中矩阵 $U$ 的第 $l$ 列为 $u_l$
特征值度量对应特征向量的平滑度 -> 特征值小，则对应的特征向量平滑

【图的傅里叶逆变换】 $f[l]=∑i=1Nf^[i]ul[i]f[l]=\sum_{i=1}^{N}\hat{f}[i]u_l[i]$

矩阵表示： $f=Uf^f=U\hat{f}$

2.6 复杂图

【异质图】（Heterogeneous Graph）异质图 $G$ 由节点集合 $,vN}V=\{v_1,\cdots,v_N\}$ 和边集合 $,eM}E=\{e_1,\cdots,e_M\}$ 组成，其中每个节点和每条边都对应一种类型。 $T_n$ 表示节点类型的集合， $T_e$ 表示边类型的集合。异质图有两个映射函数： $ϕn:V→Tn\phi_n:V\rightarrow T_n$ 和 $ϕe:E→Te\phi_e:E\rightarrow T_e$ 。

【二分图】（Bipartite Graph）图 $G=\{V,E\}$ 是二分图当且仅当： $V=V1⋃V2V=V_1 \bigcup V_2$ ， $V1⋂V2=∅V_1\bigcap V_2=\empty$ ，对于所有边 $e=(ve1,ve2)∈Ee=(v_e^1,v_e^2)\in E$ ，都有 $ve1∈V1v_e^1\in V_1$ 和 $ve2∈V2v_e^2\in V_2$

【多维图】（Multi-dimensional Graph）多维图由一个节点集合 $,vN}V=\{v_1,\cdots,v_N\}$ 和 $D$ 个边集合 $,ED}\{E_1,\cdots,E_D\}$ 组成。每个边集合描述了节点之间的一种关系， $D$ 个边集合可表示为 $D$ 个邻接矩阵 $A^{(d)}$

【符号图】（Signed Graph）符号图表示为 $G=\{V,E^+,E^-\}$ ， $E+⊂V×VE^+\subset V \times V$ 和 $E−⊂V×VE^-\subset V \times V$ 分别为正边集合和负边集合，同时保证 $E+⋂E−=∅E^+ \bigcap E^-=\empty$ 。在符号图的邻接矩阵中，元素取值为 $±1,0\pm 1,0$ 。

【超图】（HyperGraph）超图可表示为 $G=\{V,E,W\}$ ，其中 $V$ 为节点集合， $E$ 为超边集合， $\in \mathrm{R}^{|E|\times |E|}$ ，其中 $W_{j,j}$ 表示超边 $e_j$ 的权重。超图也可利用关联矩阵 $H∈R∣V∣×∣E∣H\in R^{|V|\times |E|}$ 表示，其中 $H_{i,j}=1$ 表示 $v_i$ 与 $e_j$ 关联，节点的度为 $d(vi)=∑i=1∣V∣Hi,jd(v_i)=\sum_{i=1}^{|V|}H_{i,j}$ 。此外， $D_e$ 和 $D_v$ 分别表示边和节点的度矩阵，且二者均为对角矩阵。