Skip to content

jxh4945777/Social-Knowledge-Graph-Papers

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

66 Commits
 
 
 
 
 
 

Repository files navigation

Social-Knowledge-Graph-Papers

Research about Social Knowledge Graph

本项目是关于社交知识图谱的论文列表、笔记和数据集汇总。

key words: 社交网络 (Social Network), 知识图谱 (Knowledge Graph), 社会计算 (Social Computing)

动态图专题https://github.com/Cantoria/dynamic-graph-papers/

【目录】

【具体文献以及笔记】

Static Graph Representation

挑选了引用数较高、知名度较大的一些静态图表示学习的工作。

Static Graph Representation - 经典工作

Semi-Supervised Classification with Graph Convolutional Networks

  • 作者:Thomas N. Kipf, et al. (University of Amsterdam)
  • 发表时间:2016
  • 发表于:ICLR 2017
  • 标签:图神经网络
  • 概述:提出了图卷积神经网络的概念,并使用其聚合、激活节点的一阶邻居特征。
  • 链接:https://arxiv.org/pdf/1609.02907.pdf
  • 相关数据集:
    • Citeseer
    • Cora
    • Pubmed
    • NELL
  • 是否有开源代码:有

Inductive representation learning on large graphs

  • 作者: Hamilton W, et al.(斯坦福大学Leskovec团队)
  • 发表时间:2017
  • 发表于:Advances in neural information processing systems
  • 标签:Inductive Graph Embedding
  • 概述:针对以往transductive的方式(不能表示unseen nodes)的方法作了改进,提出了一种inductive的方式改进这个问题,该方法学习聚合函数,而不是某个节点的向量
  • 链接:https://papers.nips.cc/paper/6703-inductive-representation-learning-on-large-graphs.pdf
  • 相关数据集:
    • Citation
    • Reddit
    • PPI
  • 是否有开源代码:有

Anonymous Walk Embeddings

  • 作者:Sergey Ivanov
  • 发表时间:2018
  • 发表于:ICML 2018
  • 标签:Anonymous walk, Graph embedding
  • 概述:有别于特征工程或纯粹数据驱动的图表示学习方法,作者提出了一种匿名路径嵌入(AWE)的方法,结合了特征工程与数据驱动的方式,用于整图的表示学习工作。其分为Feature-Based model与data-driven model两部分。Feature-Based model将带权图转化为马尔可夫图,通过预定义好的匿名路径(固定数目、固定长度)及匿名路径在该马尔可夫图上的采样归一化概率,得到带权图的向量表示d。在data-driven model中,作者定义了anonymous walks邻居的概念,通过skip-gram的形式结合图向量表示d对anonymous walk的表示以及进行训练,最终可以得到每个匿名路径的表示与图向量表示。作者在图分类任务上进行了实验,与基于特征工程的方法(核方法等)与数据驱动的方法(神经网络方法等)进行了对比,在图分类准确率、训练效率等方面进行了比较。
  • 链接:https://arxiv.org/pdf/1805.11921.pdf
  • 相关数据集:
    • COLLAB
    • IMDB-B
    • IMDB-M
    • RE-B
    • RE-M5K
    • RE-M12K
    • Enzymes
    • DD
    • Mutag
  • 是否有开源代码:有(原始代码为https://github.com/nd7141/AWE

Heterogeneous Graph/Heterogeneous Information Network Representation

异质图/异构图(Heterogeneous Graph) = 异质信息网络(Heterogeneous Information Network)

Heterogeneous Graph/Heterogeneous Information Network Representation - 经典论文/最新综述

该部分包括了异质图的经典/最新综述论文

Meta-Path-Based Search and Mining in Heterogeneous Information Networks

  • 作者: Yizhou Sun, et al.
  • 发表时间:2012
  • 发表于:TSINGHUA SCIENCE AND TECHNOLOGY
  • 标签:Heterogeneous Information Network
  • 概述:本文是一片介绍异质信息网络的开创性工作,其在提出了异质信息网络并介绍相关概念的基础上,对于常见的异质信息网络进行了举例,如学术网络(作者/论文/领域/机构...)、推特网络(用户/推特/HashTag/机构)、Flickr网络(图片/用户/标签/群组/评价)、健康网络(医生、病患、疾病、设备、治疗方式),以上异质信息网络都能相较于同质图更准确地建模真实世界的图结构信息。除此之外,本文对于异质信息网络的应用进行了全面地阐述,其中详细介绍了相似度搜索、关系预测、基于用户特征的聚类,并对未来的应用方向,如基于异质信息网络的传播分析、推荐、智能问答等进行了展望。
  • 链接:https://ieeexplore.ieee.org/ielx7/5971803/6574669/06574671.pdf
  • 是否有开源代码:无

Heterogeneous Network Representation Learning: A Unified Framework with Survey and Benchmark

  • 作者: Carl Yang, et al.(UIUC韩家炜团队)
  • 发表时间:2020
  • 发表于:TKDE
  • 标签:Heterogeneous Network Reprensentation Learning
  • 概述:本文是异质图相关研究的综述文章,系统性地梳理了异质图的经典工作以及前沿工作,将已有工作规范到统一的框架内,且提出了异质图表示学习的Benchmark,并且对于经典的异质图方法进行了复现与评测。
  • 链接:https://arxiv.org/abs/2004.00216
  • 相关数据集:
    • DBLP
    • Yelp
    • Freebase
    • PubMed
  • 是否有开源代码:有 https://github.com/yangji9181/HNE

Heterogeneous Network Representation Learning

  • 作者: Yuxiao Dong, et al.(UCLA Yizhou Sun 团队)
  • 发表时间:2020
  • 发表于:IJCAI 2020
  • 标签:Heterogeneous Network Reprensentation Learning
  • 概述:本文是UCLA, THU, Microsoft合作的一篇异质图相关研究的综述文章,首先阐述了异质图信息挖掘的含义以及相关研究,并且从传统图嵌入表示和异质图神经网络两个角度阐述了异质图的表示学习,且与知识图谱相关的表示学习工作进行了对比。最后从预训练、多任务学习、动态性等角度对于异质图的研究进行了展望。
  • 链接:http://web.cs.ucla.edu/~yzsun/papers/2020_IJCAI_HIN_Survey.pdf
  • 相关数据集:
    • OAG
  • 是否有开源代码:有 https://github.com/HeterogeneousGraph

异质信息网络分析与应用综述

  • 作者: Chuan Shi, et al.
  • 发表时间:2020
  • 发表于:软件学报
  • 标签:Heterogeneous Information Network
  • 概述:本文是一篇关于异质信息网络的最新中文综述,对于异质信息网络给出了明确的定义,并且对于现有异质信息网络的从网络结构的角度进行了归类,对于异质信息网络表示学习相关的工作也进行了归类为基于图分解的方法、基于随机游走的方法、基于编码器-解码器的方法以及基于图神经网络的方法。同时本文对于异质信息网络的应用进行了叙述,最后对于异质信息网络的发展提出了展望。
  • 链接:http://www.shichuan.org/doc/94.pdf
  • 是否有开源代码:有 https://github.com/BUPT-GAMMA/OpenHINE

Heterogeneous Graph/Heterogeneous Information Network Representation - 相关前沿研究(2019 -至今)

Heterogeneous Graph Attention Network

  • 作者: Xiao Wang, et al. (BUPT 石川团队)
  • 发表时间:2019
  • 发表于:WWW 2019
  • 标签:Heterogeneous Network Reprensentation Learning, Hierarchical Attention
  • 概述:本文是异质图与图神经网络结合的一篇研究工作,不同于其他图神经网络直接聚合邻居信息,HAN通过Meta-Path采集到多跳的邻居并据此将异质图同质化再聚合邻居节点,以实现聚合元路径上节点的信息;HAN同时提出分层attention机制,用于衡量不同邻居的权重,以及不同语义(元路径)信息的权重。在以上思路的基础上学习异质图中节点的表示,并且通过节点分类和节点聚类两个下游任务预测模型的有效性,以及分析了模型的可解释性。
  • 链接:http://www.shichuan.org/doc/66.pdf
  • 相关数据集:
    • DBLP
    • IMDB
    • ACM
  • 是否有开源代码:有 https://github.com/Jhy1993/HAN

Heterogeneous Graph Transformer

  • 作者: Ziniu Hu, et al. (UCLA Yizhou Sun团队)
  • 发表时间:2020
  • 发表于:WWW 2020
  • 标签:Heterogeneous Network Reprensentation Learning, Transformer, Multi-Head Attention
  • 概述:考虑到已有异质图的研究存在以下几点局限:1. 需要人工设计Meta-path;2.无法建模动态信息;3.对于大规模的异质图,缺乏有效的采样方式。针对于以上三点,本文首选给出Meta Relation的概念,直接建模相连的异质节点,基于此设计了类Transformer的网络结构用于图表示学习。考虑到异质图的动态特性,本文提出了RTE编码方式,用于建模异质图的动态演化。考虑到大规模异质图上网络的训练,本文提出了HGSampling方式,用于均匀采样不同类型的节点信息,以实现高效的图表示学习。
  • 链接:https://arxiv.org/abs/2003.01332
  • 相关数据集:
    • OAG
  • 是否有开源代码:有 https://github.com/acbull/pyHGT

An Adaptive Embedding Framework for Heterogeneous Information Networks

  • 作者: Daoyuan Chen, et al. (阿里)
  • 发表时间:2020
  • 发表于:CIKM 2020
  • 标签:Heterogeneous Information Network, Knowledge Graph, Joint Learning
  • 概述:作为模式十分丰富的异质图之一,知识图谱的表示学习一直是研究的重点之一,本文关注于传统的Trans系列知识图谱表示学习方法没法很好地捕获到高阶(多跳)关系之间节点的相似性,因此设计了一种联合学习的方式,首先通过Trans系列方法学习几点的表示,并且通过类似于(h+r-t)的打分函数进行打分,该分数用于指导图上的随机游走概率(即Trans方法学的越不好,越有可能游走到这些节点),然后通过Skip-Gram再进行节点表示的优化。同时本文针对于Skip-Gram的游走路径长度,以及窗口大小,设计了一套自适应机制。本框架适用于大多数Trans系列方法,具有很强的灵活性,值得借鉴。
  • 链接:https://dl.acm.org/doi/10.1145/3340531.3411989
  • 相关数据集:
    • FILM
    • Cora
    • Citeseer
    • WN18
    • FB15K-237
  • 是否有开源代码:无

Modeling Relational Data with Graph Convolutional Networks

  • 作者: Michael Schlichtkrull, Thomas N. Kipf, et al. (阿姆斯特丹Kipf团队)
  • 发表时间:2018
  • 发表于:ESWC 2018
  • 标签:Knowledge Graph, Multi Relation, Graph Neural Network
  • 概述:本文关注于真实世界图中边的异质性,例如FB15K-237和WN18包含多种类型的边。现有图神经网络GCN无法建模边的异质性,因此本文提出了R-GCN模型,在信息传递时对于不同类型的边使用不同的权值矩阵,同时考虑到在边比较多的情况下矩阵的数目也较多,因此采取了共享权值的方式,将每种类型边的权值矩阵视作多个基的带权加和,以此缩小参数量。对于实验部分,本文在FB15K,和WN18两个数据集上,从实体分类以及连接预测(知识图谱补全)两个实验角度验证了模型的有效性。
  • 链接:https://arxiv.org/abs/1703.06103
  • 相关数据集:
    • WN18
    • FB15K-237
  • 是否有开源代码:有(https://github.com/tkipf/relational-gcn)

Relation Structure-Aware Heterogeneous Information Network Embedding

  • 作者: Yuanfu Lu, et al. (BUPT 石川团队)
  • 发表时间:2019
  • 发表于:AAAI 2019
  • 标签:Heterogeneous Graph, Relation Structure, Random Walk
  • 概述:本文关注到异质图中不同Meta-path的结构性区别,核心就是将预定义的Meta-path通过统计分析分成两种类型-从属关系/交互关系,对于从属关系,本文计算节点相似度的方法是直接通过欧氏距离;对于交互关系,本文计算节点之间的关系是通过类似于TransE的Translation方法。通过两种不同类型关系的联合学习,最终能够做到考虑不同关系类型(从属/交互)的节点表示。最终本文通过节点聚类、节点分类、连接预测验证了模型的有效性。
  • 链接:https://arxiv.org/abs/1905.08027
  • 相关数据集:
    • DBLP
    • Yelp
    • AMiner
  • 是否有开源代码:有(https://github.com/rootlu/RHINE)

Fast Attributed Multiplex Heterogeneous Network Embedding

  • 作者: Zhijun Liu, et al.
  • 发表时间:2020
  • 发表于:CIKM 2020
  • 标签:Heterogeneous Graph, Fast Learning
  • 概述:本文考虑到现有异质图表示学习方法从效率角度难以应用于大规模异质图数据上,因此提出了一个新的模型框架FAME,用于快速学习异质图上节点的表示。其主要贡献在于 提出了一个新的图表示学习方法,使用随机映射的方式代替feature trasformation的方式(即随机删掉部分维度)。实验部分,本文在多个数据集上验证了模型的有效性,无论是从效率上,还是准确率上,都高于现有的Baseline方法。
  • 链接:https://dl.acm.org/doi/10.1145/3340531.3411944
  • 相关数据集:
    • Alibaba
    • Amazon
    • Aminer
    • IMDB
  • 是否有开源代码:有(https://github.com/ZhijunLiu95/FAME)

Genetic Meta-Structure Search for Recommendation on Heterogeneous Information Network

  • 作者: Zhenyu Han, et al. (THU)
  • 发表时间:2020
  • 发表于:CIKM 2020
  • 标签:Heterogeneous Graph, Genetic Algorithm
  • 概述:本文考虑到异质图能够很好地建模推荐系统,但手动设计Meta-Path需要大量的人工,因此需要研究自动发现Meta-Path的方法。受优化问题中遗传算法的启发,本文设计了一个类似于遗传算法的Meta-Structure自动挖掘策略,用于推荐系统。实验部分,本文在Yelp, Douban Movie, Amazon三个数据集上进行了实验验证模型的有效性,同时通过给出Case Study,验证模型能够学习到新的有用的Meta-Structure。
  • 链接:https://dl.acm.org/doi/10.1145/3340531.3412015
  • 相关数据集:
    • Yelp
    • Douban
    • Movie
    • Amazon
  • 是否有开源代码:有(https://github.com/0oshowero0/GEMS)

Homogenization with Explicit Semantics Preservation for Heterogeneous Information Network

  • 作者: Tiancheng Huang, et al. (ZJU)
  • 发表时间:2020
  • 发表于:CIKM 2020
  • 标签:Heterogeneous Graph, Homogenization
  • 概述:本文考虑到现有异质图算法在将图同质化的过程中(例如HAN)忽略了路径上的节点的丰富信息,且损失了大量的原本图中的信息。因此本文从异质图的同质化角度入手,设计了新的表示学习方法,能够使转化同质子图的过程中同时考虑路径上节点的信息。具体来讲,本文首先设定对称的Meta-path作为考虑对象,对于路径中对称的节点衡量其相似性,以此作为Meta-path重要性的参照。实验部分,本文在DBLP, IMDB,Yelp数据集上以节点分类和节点聚类作为任务进行了实验,验证了模型的有效性。
  • 链接:https://dl.acm.org/doi/10.1145/3340531.3412015
  • 相关数据集:
    • Yelp
    • IMDB
    • DBLP
  • 是否有开源代码:有(https://dl.acm.org/doi/10.1145/3340531.3412135)

Heterogeneous Graph Structure Learning for Graph Neural Networks

  • 作者: Jianan Zhao, et al. (BUPT石川团队)
  • 发表时间:2021
  • 发表于:AAAI 2021
  • 标签:Heterogeneous Graph, Structure Learning, Graph Neural Network
  • 概述:本文关注于现实世界中异质图是存在噪音和缺失的现象,因此针对于此首次提出异质图结构学习的相关工作,希望通过建模异质图的节点特征和已有图的拓补结构特征,能够学习到新的异质图结构,实现对于现有异质图缺失的结构的补充。具体来讲,本文提出了异质图结构学习模型HGSL,首先根据节点的特征信息以及邻居信息(对于关系r, 度量节点相似度,并连接相似节点生成Feature Similarity Graph -> 对于连接的节点间的邻居也进行连接 生成两个Feature Propagation Graph -> 通过Attention机制将三个生成的图进行融合)得到Feature Graph,然后对于关系r, 根据不同Meta-path利用Metapath2Vec学到的向量表示用于度量节点相似度,并生成多个子图,融合得到Semantic Graph,最终对于Feature Graph与Semantic Graph进行融合得到新的异质图结构,实现了缺失结构信息的学习与补充。实验部分,本文在DBLP, ACM, Yelp数据集上以节点分类为任务验证了模型的有效性,并且进行了相关分析。
  • 链接:https://github.com/Andy-Border/HGSL/tree/main/paper
  • 相关数据集:
    • Yelp
    • ACM
    • DBLP
  • 是否有开源代码:有(https://github.com/Andy-Border/HGSL)

Learning Intents behind Interactions with Knowledge Graph for Recommendation

  • 作者: Xiang Wang, et al. (新加坡国立、浙大、eBay)
  • 发表时间:2021
  • 发表于:WWW 2021
  • 标签:Heterogeneous Graph, Knowledge Graph, Recommendation System, Graph Neural Network
  • 概述:本文是一篇对于用户内容推荐算法的研究,对于User-Item的内容推荐,以往工作未考虑到其间存在的用户的意图(Intent),因此本文定义了用户的意图,即user-intent-item,并且对此提出了Knowledge Graph Intent Graph,用KG中的relation集合来代表intent;并针对性地提出了GNN-based Method - KGIG,主要包括结合Intent的用户信息建模,以及考虑多跳异质关系路径的信息聚合,用于精准用户内容推荐。本文在三个数据集上验证了模型的有效性,且给出了全面地分析。
  • 链接:https://arxiv.org/abs/2102.07057
  • 相关数据集:
    • Amazon-Book
    • Last-FM
    • Alibaba-iFashion
  • 是否有开源代码:有(https://github.com/huangtinglin/Knowledge_Graph_based_Intent_Network)

MultiSage: Empowering GCN with Contextualized Multi-Embeddings on Web-Scale Multipartite Networks

  • 作者:Carl Yang, Jiawei Han, Jure Leskovec et al. (UIUC韩家炜团队, Standford Jure团队)
  • 发表时间:2020
  • 发表于:KDD 2020
  • 标签:Recommendation System, Graph Neural Network, Web-Scale
  • 概述:本文是一篇对于用户内容推荐算法的研究,对于内容推荐主要考虑到了背景信息的作用,提出了Contextual Masking机制,用于考虑不同的上下文情下的内容表示,同时利用attention机制比较不同context的重要性差异;除此之外,本文考虑到了工业级的大规模数据推荐,提出了一套解决方案,对于中心节点的邻居,通过parallel pagerank based random walk用于进行邻居采样,然后通过Hadoop2+AWS进行数据的计算。本文在两个大规模数据集(但也是进行了采样并非完整数据集)进行了实验验证模型的有效性。
  • 链接:https://jiyang3.web.engr.illinois.edu/files/multisage.pdf
  • 相关数据集:
    • OAG
    • Printest
  • 是否有开源代码:无

RHINE: Relation Structure-Aware Heterogeneous Information Network Embedding

  • 作者: Chuan Shi, et al. (BUPT& THU)
  • 发表时间:2020
  • 发表于:TKDE 2020
  • 标签:heterogeneous information network, relation structure
  • 概述:本文是一篇基于Meta-path随机游走的工作,主要创新点在于对于Meta-path分成了两类,即(从属/交互),对于从属关系,本文考虑通过欧氏距离度量相似性,对于交互关系,本文考虑通过TransE类似的Translation进行建模。
  • 链接:https://ieeexplore.ieee.org/abstract/document/9050490
  • 相关数据集:
    • DBLP
    • Yelp
    • AMiner
    • Amazon
  • 是否有开源代码:有( https://github.com/rootlu/RHINE )

TIMME: Twitter Ideology-detection via Multi-task Multi-relational Embedding

  • 作者: Zhiping Xiao, et al. (UCLA)
  • 发表时间:2020
  • 发表于:KDD 2020
  • 标签:multi relation, ideology detection
  • 概述:本文旨在通过社交网络的信息分析用户的政治倾向,考虑到社交网络中有不同类型的边的链接(like, tweet, retweet, mention, follow),其代表着不同的语义信息,以及用户之间相同或者不相同的政治倾向。且现实社交网络中存在“沉默的大多数”现象,即大部分人并不会明确表达自己的政治倾向,因此并非所有用户都有标注,且存在信息缺失。因此本文首先提出了Political-Centered Social Network,并且基于twitter数据构建了新的用于分析倾向性的数据集。尔后针对性地提出了模型TIMME,其中包括Multi-Relation Encoder(类似于R-GCN),以及multi-task decoder,用于包含大量网络用户的倾向性分析。本文通过充分的实验和分析验证了模型的有效性,且分析了社交网络中政治倾向性的传播现象。且本篇研究工作提供了一个完整的数据集,可以进行相关的研究与探索。
  • 链接:https://arxiv.org/abs/2006.01321v3
  • 相关数据集:
    • Twitter
  • 是否有开源代码:有( https://github.com/PatriciaXiao/TIMME )

Knowledge Embedding Based Graph Convolutional Network

  • 作者: Donghan Yu, et al. (CMU, Google)
  • 发表时间:2021
  • 发表于:WWW 2021
  • 标签:Knowledge Graph, Graph Neural Network, Heterogeneous Graph
  • 概述:本文旨在将图神经网络用于知识图谱这种节点和边类型十分丰富的异质图中,首先对比了近期的W-GCN, R-GCN, Comp-GCN等相关工作,并且总结了其优劣提出了新的模型KE-GCN,在该框架下W-GCN等模型都是KE-GCN的特例情况。具体来讲,KE-GCN在考虑边的建模时,利用了与该边相关的实体的信息进行聚合,更新边的表示。本文通过知识库对齐和实体识别两个任务验证了模型的有效性。
  • 链接:http://arxiv.org/abs/2006.07331v2
  • 相关数据集:
    • DBP(ZH-EN, JA-EN, FR-EN)
    • AM
    • WN
    • FB15K
  • 是否有开源代码:有( https://github.com/PlusRoss/KE-GCN )

Neural Graph Matching based Collaborative Filtering

  • 作者: Yixin Su, et al. (University of Melbourne)
  • 发表时间:2021
  • 发表于:SIGIR 2021
  • 标签:Graph Matching, Collaborative Filtering
  • 概述:本文是一篇研究推荐系统中协同过滤的文章,考虑到以往的相关工作没有有效同时建模用户与物品之间的复杂交互,因此本文将用户-用户、用户-物品、物品-物品三种不同的关系建模成三种不同的图,并且通过图神经网络的方式进行表示学习,继而实现图匹配并且进行用户物品的推荐。
  • 链接:https://arxiv.org/pdf/2105.04067
  • 相关数据集:
    • MovieLens
    • Book-Crossing
    • Taobao
  • 是否有开源代码:https://github.com/ruizhangai/GMCF_Neural_Graph_Matching_based_Collaborative_Filtering

User-as-Graph: User Modeling with Heterogeneous Graph Pooling for News Recommendation

  • 作者: Chuhan Wu, et al. (MSRA, THU)
  • 发表时间:2021
  • 发表于:IJCAI 2021
  • 标签:News Recommendation, Graph Pooling, Heterogeneous Graph
  • 概述:本文旨在将用户的行为转化成为包含主题、新闻、实体的异质图,并在此基础上设计了异质图池化模型,将构建好的异质图转化为用户的向量表示,用于实现用户新闻的个性化推荐。本文在MIND新闻推荐数据集上取得了优于SOTA的成绩,证明了模型的有效性。
  • 链接:https://www.ijcai.org/proceedings/2021/0224.pdf
  • 相关数据集:
    • MIND
  • 是否有开源代码:无

Dynamic Graph Representation

Dynamic Graph Representation -- 最新综述

Representation Learning for Dynamic Graphs: A Survey

Foundations and modelling of dynamic networks using Dynamic Graph Neural Networks: A survey

  • 作者:Joakim Skarding, et al. (University of Technology Sydney)
  • 发表时间:2020.5
  • 发表于:arXiv
  • 标签:动态图表示,综述,动态图神经网络
  • 概述:该文侧重于从图神经网络的角度与具体任务的角度去讲述目前动态网络的研究方向。在第二章中,作者将动态图的有关定义整理为体系,从3个维度(时态粒度、节点动态性、边持续的时间)上,分别定义了8种动态网络的定义。在第三章中,阐述了编码动态网络拓扑结构的深度学习模型;在第四章中,阐述了被编码的动态网络信息如何用于预测,即动态网络的解码器、损失函数、评价指标等。在最后一章,作者阐述了动态图表示、建模的一些挑战,并对未来的发展方向进行了展望。
  • 链接:https://arxiv.org/abs/2005.07496

Temporal Link Prediction: A Survey

  • 作者: Divakaran A, et al.
  • 发表时间:2019
  • 发表于:New Generation Computing (2019)
  • 关键词:时态链接预测,综述
  • 概述:从离散动态图(DTDG)的角度出发,本文针对时态链接预测任务给出了相关定义,并从实现方法的角度出发,构建了时态链接预测的分类体系,分别从矩阵分解/概率模型/谱聚类/时间序列模型/深度学习等不同方法实现的模型进行了比较与论述。文章还列举出了时态链接预测任务的相关数据集(论文互引网络、通讯网络、社交网络、人类交往网络数据等)。最后,文章对时态链接预测任务的难点进行了展望。
  • 链接:https://link.springer.com/article/10.1007%2Fs00354-019-00065-z

Motifs in Temporal Networks

  • 作者: Ashwin Paranjape, et al.
  • 发表时间:2017
  • 发表于:WSDM, 2017
  • 关键词:时态网络,motif
  • 概述:该文将传统图分析中的motif概念引入时态网络中,认为时态网络中的motif是网络中的最基本构成单位,定义了Temporal network motifs与时间间隔关联的δ-temporal motifs的概念;并利用时态网络上的motif分析时态网络上的演化交互规律。此外,作者设计了一种快速计算时态网络中不同类型motif数目的算法,能够快速分析某个时态网络的演化特性。
  • 链接:https://dl.acm.org/doi/abs/10.1145/3018661.3018731

Dynamic Graph Representation -- 相关前沿研究(2019 - 至今)

DYREP: LEARNING REPRESENTATIONS OVER DYNAMIC GRAPHS

  • 作者: Rakshit Trivedi, et al. (Georgia Institute of Technology & DeepMind)
  • 发表时间:2019
  • 发表于:ICLR 2019
  • 关键词:CTDG
  • 概述:在本文中,作者提出了一套动态图节点表示学习框架,该框架能很好地建模网络的动态演化特征,并能够对unseen nodes进行表示。有对于动态图结构中节点的交互行为,作者将其分为association与communication两种,前者代表长期稳定的联系,网络拓扑结构发生了变化,后者代表短暂、临时的联系。在节点的信息传播方面,作者将节点的信息传播定义为Localized Embedding Propagation/Self-Propagation/Exogenous Drive,分别代表节点邻居的信息聚合传播,节点自身信息传播以及外因驱动(由时间控制)。作者在dynamic link prediction & time prediction任务上对该方法的有效性进行了验证。
  • 链接:https://openreview.net/pdf?id=HyePrhR5KX
  • 相关数据集:
    • Social Evolution Dataset
    • Github Dataset
  • 是否有开源代码:无(有第三方开源代码)

Context-Aware Temporal Knowledge Graph Embedding

  • 作者: Yu Liu, et al. (昆士兰大学)
  • 发表时间:2019
  • 发表于:WISE 2019
  • 关键词:时态知识图谱,知识表示
  • 概述:作者认为现有的knowledge graph embedding方法忽略了时态一致性;时态一致性能够建模事实与事实所在上下文(上下文是指包含参与该事实的所有实体)的关系。为了验证时态知识图谱中事实的有效性,作者提出了上下文选择的双重策略:1、验证组成该事实的三元组是否可信;2、验证这个事实的时态区间是否与其上下文冲突。作者在实体预测/上下文选择任务上证明了方法的有效性。
  • 链接:https://link.springer.com/chapter/10.1007/978-3-030-34223-4_37
  • 相关数据集:
    • YAGO11k
    • Wikidata12k
  • 是否有开源代码:无

Real-Time Streaming Graph Embedding Through Local Actions

  • 作者: Xi Liu, et al. (德州农工大学)
  • 发表时间:2019
  • 发表于:WWW 2019
  • 关键词:streaming graph
  • 概述:本文认为已有的动态图嵌入式学习方法强烈依赖节点属性,时间复杂度高,新节点加入后需要重新训练等缺点。本文提出了streaming graph的概念,提出了一种动态图表示的在线近似算法。该算法能够为新加入图中的节点快速高效生成节点表示,并能够为新加入节点“影响”到的节点更新节点的表示。
  • 链接:https://dl.acm.org/doi/abs/10.1145/3308560.3316585
  • 相关数据集:
    • Blog
    • CiteSeer
    • Cora
    • Flickr
    • Wiki
  • 是否有开源代码:无

Predicting Dynamic Embedding Trajectory in Temporal Interaction Networks

  • 作者: Srijan Kumar, et al. (斯坦福大学,Jure团队)
  • 发表时间:2019
  • 发表于:KDD 2019
  • 关键词:CTDG,user-item dynamic embedding
  • 概述:这篇论文解决的问题是建模user-item之间的序列互动问题。而表示学习能够为建模user-item之间的动态演化提供很好的解决方案。目前工作的缺陷是只有在user作出变化时才会更新其表示,并不能生成user/item未来的轨迹embedding。因此,作者设计了JODIE(Joint Dynamic User-Item Embeddings),其包括更新部分与预测部分。更新部分由一个耦合循环神经网络(coupled recurrent neural network)学习user与item未来轨迹。其使用了两个循环神经网络更新user/item在每次interaction的表示,还能表示user/item未来的embedding变化轨迹(trajectory)。预测部分由一个映射算子组成,其能够学习user在未来任意某个时间点的embedding表示。为了让这个方法可扩展性更强,作者提出了一个t-Batch算法,能够创建时间一致性的batch(time-consistent batch),且能够提升9倍训练速度。为了验证方法的有效性,作者在4个实验数据集上做了实验,对比了6种方法,发现在预测未来互动(predicting future interaction)任务上提升了20%,在状态变化预测(state change prediction任务上提升了12%)
  • 链接:https://cs.stanford.edu/~srijan/pubs/jodie-kdd2019.pdf
  • 相关数据集:
    • Reddit
    • Wikipedia
    • Last FM
    • MOOC
  • 是否有开源代码:有(https://snap.stanford.edu/jodie/)

dyngraph2vec-Capturing Network Dynamics using Dynamic Graph Representation Learning

  • 作者: Palash Goyal, et al. (南加州州立大学)
  • 发表时间:2020
  • 发表于:Knowledge-Based Systems
  • 关键词:DTDG
  • 概述:本文首先针对动态图表示学习进行了定义,即:学习到一个函数的映射,这个映射能将每个时间点的图中节点映射为向量y,并且这个向量能够捕捉到节点变化的时态模式。基于此,作者提出了一种能够捕捉动态图演化的动力学特征,生成动态图表示的方法,本质上是输入为动态图的前T个时间步的snapshot,输出为T+1时刻的图嵌入式表达。在实验中,作者采用了AE/RNN/AERNN三种编码器进行了实验。此外,作者设计了一个图embedding生成库DynamicGEM。
  • 链接:https://www.sciencedirect.com/science/article/pii/S0950705119302916
  • 相关数据集:
    • SBM dataset
    • Hep-th Dataset
    • AS Dataset
  • 是否有开源代码:有(https://github.com/palash1992/DynamicGEM)

EvolveGCN: Evolving Graph Convolutional Networks for Dynamic Graphs

  • 作者: Aldo Pareja, et al.(MIT-IBM Watson AI Lab)
  • 发表时间:2019
  • 发表于:AAAI 2020
  • 标签:图卷积网络,DTDG
  • 概述:本文不同于传统的DTDG表示学习工作,没有用RNN编码各个snapshot之间的表示,而是使用RNN去编码GCN的参数,从而学习图的演化规律。
  • 链接:https://www.aaai.org/Papers/AAAI/2020GB/AAAI-ParejaA.5679.pdf
  • 相关数据集:
    • Stochastic Block Model
    • Bitcoin OTC
    • Bitcoin Alpha
    • UC Irvine messages
    • Autonomous systems
    • Reddit Hyperlink Network
    • Elliptic
  • 是否有开源代码:有(https://github.com/IBM/EvolveGCN)

Temporal Graph Networks for Deep Learning on Dynamic Graphs

  • 作者:Rossi, Emanuele, et al.(Twitter)
  • 发表时间:2020.6
  • 发表于:arXiv
  • 标签:动态图表示,CTDG
  • 概述:提出了CTDG动态图的一套通用表示框架,并提出了一种能够并行加速训练效率的算法。
  • 链接:https://arxiv.org/pdf/2006.10637.pdf
  • 相关数据集:
    • Wikipedia(这个数据集是不是开源的Wikidata?论文中无说明)
    • Reddit
    • Twitter
  • 是否有开源代码:无

Modeling Dynamic Heterogeneous Network for Link Prediction using Hierarchical Attention with Temporal RNN

  • 作者:Hansheng Xue, Luwei Yang, et al.(澳大利亚国立大学, 阿里巴巴)
  • 发表时间:2020.4
  • 发表于:arXiv
  • 标签:动态图表示,异构图,注意力机制,DTDG
  • 概述:本文同时考虑到图的异构性和动态性的特点,对于图的每个时间切片,利用node-level attention和edge-level attention以上两个层次的注意力机制实现异质信息的有效处理,并且通过循环神经网络结合self-attention研究节点embedding的演化特性,并且通过链接预测任务进行试验,验证模型的有效性。
  • 链接:https://arxiv.org/pdf/2004.01024.pdf
  • 相关数据集:
    • Twitter
    • Math-Overflow
    • Ecomm
    • Alibaba.com
  • 是否有开源代码:有(https://github.com/skx300/DyHATR)

DySAT: Deep Neural Representation Learning on Dynamic Graphs via Self-Attention Networks

  • 作者: Aravind Sankar, et al.(UIUC)
  • 发表时间:2020
  • 发表于:WSDE 2020
  • 标签:DTDG,注意力机制
  • 概述:作者提出了DYNAMIC SELF-ATTENTION NETWORK机制,通过结构化注意力模块与时态注意力模块对动态变化的节点进行表示。
  • 链接:http://yhwu.me/publications/dysat_wsdm20.pdf
  • 相关数据集:
    • Enron Email
    • UCI Email
    • MovieLens-10M
    • Yelp
  • 是否有开源代码:有(https://github.com/aravindsankar28/DySAT)

Evolving network representation learning based on random walks

  • 作者: Farzaneh Heidari, et al.(York University)
  • 发表时间:2020
  • 发表于:Journal Applied Network Science 2020 (5)
  • 标签:DTDG,随机游走
  • 概述:针对DTDG动态图的4种演化行为(增加/删除节点,增加/删除边),作者提出了一种在动态图上更新已采样随机游走路径的算法,并设计了网络结构演化程度的Peak Detection算法,从而以较小代价更新不断演化的节点表示。
  • 链接:https://appliednetsci.springeropen.com/articles/10.1007/s41109-020-00257-3
  • 相关数据集:
    • Protein-Protein Interactions
    • BlogCatalog (Reza and Huan)
    • Facebook Ego Network(Leskovec and Krevl 2014)
    • Arxiv HEP-TH (Leskovec and Krevl 2014)
    • Synthetic Networks (Watts-Strogatz (Newman 2003) random networks)
  • 是否有开源代码:有(https://github.com/farzana0/EvoNRL)

Relationship Prediction in Dynamic Heterogeneous Information Networks

  • 作者: Amin Milani Fard, et al.(New York Institute of Technology)
  • 发表时间:2019
  • 发表于:Advances in Information Retrieval 2019 (4)
  • 标签:DTDG,异质信息
  • 概述:本文在考虑图动态性的同时,考虑图的异质性,认为不同类型节点对之间的关系自然有所区别,因此提出了动态异质图表示学习,并且做了规范定义。并且提出MetaDynaMix 方法,通过meta-path标注每个节点和边的特征,在此基础上通过矩阵分解得到特征向量,并用于计算关系预测时的概率。
  • 链接:https://www.researchgate.net/publication/332257507_Relationship_Prediction_in_Dynamic_Heterogeneous_Information_Networks
  • 相关数据集:
    • Publication Network (DBLP+ ACM)
    • Movies Network (IMDB)
  • 是否有开源代码:无

Link Prediction on Dynamic Heterogeneous Information Networks

  • 作者: Chao Kong, et al.(Anhui Polytechnic University)
  • 发表时间:2019
  • 发表于:Lecture Notes in Computer Science 2019
  • 标签:DTDG,异质信息,广度学习,图神经网络
  • 概述:本文考虑到动态图相关研究中异质信息缺乏有效的利用,且对于大规模图的表示学习过程中,深度学习方法效率较低,因此提出了一种宽度学习(?)的框架,并且与图神经网络相结合,实现高效的动态异质图表示学习。
  • 链接:https://link.springer.com/chapter/10.1007%2F978-3-030-34980-6_36
  • 相关数据集:
    • Reddit
    • Stack Overflow
    • Ask Ubuntu
  • 是否有开源代码:无

TemporalGAT: Attention-Based Dynamic Graph Representation Learning

  • 作者: Ahmed Fathy and Kan Li(Beijing Institute of Technology)
  • 发表时间: 2020
  • 发表于:PAKDD 2020
  • 标签:DTDG,图神经网络
  • 概述:目前的方法使用了时态约束权重(temporal regularized weights)来使节点在相邻时态状态的变化是平滑的,但是这种约束权重是不变的,无法反映图中节点随时间演化的规律。本文借鉴了GAT的思路,提出了TCN。但作者提到本文的贡献只是提高了精度,感觉并不是很有说服力。
  • 链接:https://link.springer.com/chapter/10.1007/978-3-030-47426-3_32
  • 相关数据集:
    • Enron
    • UCI
    • Yelp
  • 是否有开源代码:无

Continuous-Time Relationship Prediction in Dynamic Heterogeneous Information Networks

  • 作者: SINA SAJADMANESH, et al.(Sharif University of Technology)
  • 发表时间:2018
  • 发表于:ACM Transactions on Knowledge Discovery from Data (5)
  • 标签:CTDG,异质信息
  • 概述:本文同时关注到图的动态性与异质性,针对于连续时间的关系预测问题进行了定义,并且提出了一种新的特征抽取框架,通过Meta-Path以及循环神经网络实现对于异质信息与时间信息的有效利用,并且提出NP-GLM框架,用于实现关系预测(预测关系创建的时间节点)。
  • 链接:https://www.researchgate.net/publication/320195531_Continuous-Time_Relationship_Prediction_in_Dynamic_Heterogeneous_Information_Networks
  • 相关数据集:
    • DBLP
    • Delicious
    • MovieLens
  • 是否有开源代码:无

Continuous-Time Dynamic Graph Learning via Neural Interaction Processes

  • 作者: Xiaofu Chang, et al.(Ant Group)
  • 发表时间:2020
  • 发表于:CIKM '20: Proceedings of the 29th ACM International Conference on Information & Knowledge Management
  • 标签:CTDG,异质信息,时态点序列过程
  • 概述:针对动态图中并存的拓扑信息与时态信息,本文提出了TDIG(Temporal Dependency Interaction Graph)的概念,并基于该概念提出了一种新的编码框架TDIG-MPNN,能够产生连续时间上的节点动态表示。该框架由TDIG-HGAN与TDIG-RGNN组成。前者能够聚合来自异质邻居节点的局部时态与结构信息;后者使用LSTM架构建模长序列的信息传递,整合了TDIG-HGAN的输出,捕捉全局的信息。此外,作者采用了一种基于注意力机制的选择算法,能够针对某一节点u,计算历史与其关联的节点对其不同重要程度分值。在训练过程中,作者将其定义为一个时态点序列过程(Temporal Point Process)问题进行优化。在实验中,作者针对时态链接预测问题,通过hit@10/Mean Rank指标对一些经典的静态图表示学习算法与STOA的动态图表示学习方法进行了对比,作者提出的模型在多个Transductive与一个Inductive数据集上取得了最好的效果。
  • 链接:https://dl.acm.org/doi/pdf/10.1145/3340531.3411946
  • 相关数据集:
    • CollegeMsg (Transductive)
    • Amazon (Transductive)
    • LastFM (Transductive)
    • Huabei Trades (Inductive)
  • 是否有开源代码:无

A Data-Driven Graph Generative Model for Temporal Interaction Networks

  • 作者: Dawei Zhou, et al.(UIUC)
  • 发表时间:2020
  • 发表于:KDD 2020
  • 标签:CTDG,图生成模型
  • 概述:这篇论文是一篇深度图生成领域的文章,作者将动态图生成领域与transformer模型结合,设计了一种端到端的图生成模型TagGen。TagGen包含一种新颖的采样机制,能够捕捉到时态网络中的结构信息与时态信息。而且TagGen能够参数化双向自注意力机制,选择local operation,从而生成时态随机游走序列。最后,一个判别器(discriminator)在其中选择更贴近于真实数据的随机游走序列,将这些序列返回至一个组装模块(assembling module),生成新的随机游走序列。 作者在7个数据集上进行了实验,在跨度不同的指标中,TagGen表现更好;在具体任务(异常检测,链接预测)中,TagGen大幅度提升了性能。
  • 链接:https://www.kdd.org/kdd2020/accepted-papers/view/a-data-driven-graph-generative-model-for-temporal-interaction-networks
  • 相关数据集:
    • DBLP
    • SO
    • MO
    • WIKI
    • EMAIL
    • MSG
    • BITCOIN
  • 是否有开源代码:有 (https://github.com/davidchouzdw/TagGen)

Embedding Dynamic Attributed Networks by Modeling the Evolution Processes

  • 作者: Zenan Xu, et al.
  • 发表时间:2020
  • 发表于:COLING 2020
  • 标签:DTDG,Dynamic Attributed Networks
  • 概述:作者提出了一种可以在动态属性网络进行表示学习的模型Dane,该模型可以在离散的属性动态图上进行表示学习工作。具体地,该模型包括Activeness-aware Neighborhood Embedding与Prediction of the Next-Timestamp Embedding两个模块。第一个模块提出了activeness-aware neighborhood embedding方法,利用了注意力机制,有权重地聚合邻居的不同特征;第二个模块也采用了注意力机制,避免了RNN等模型长距离遗忘的缺点,能够依据节点的历史SNAPSHOT状态学习到不同的权重。作者在动态链接预测与动态节点分类两个任务上进行了实验。
  • 链接:https://www.aclweb.org/anthology/2020.coling-main.600/
  • 相关数据集:
    • MOOC
    • Brain
    • DBLP
    • ACM
  • 是否有开源代码:无

Learning to Encode Evolutionary Knowledge for Automatic Commenting Long Novels

  • 作者: Canxiang Yan, et al.
  • 发表时间:2020
  • 发表于:arXiv
  • 标签:动态知识图谱,knowledge,DTDG
  • 概述:长篇小说文本的自动评注任务(auto commenting task)需要依据小说文本中提及的人物,以及人物之间的关系,为小说文本自动生成自然语言表述的评注。小说中的人物及人物关系是动态演变的,静态知识图谱无法建模这种演变关系。基于此,作者设计了GraphNovel数据集,提出了演化知识图谱(Evolutionary Knowledge Graph)的框架,为每一章节的人物节点建立关系。给定一段需要评注的小说文本,框架能够整合文本中提及人物节点过去与未来的embedding,并通过一个graph-to-sequence模型生成评注文本。
  • 链接:https://arxiv.org/abs/2004.09974
  • 相关数据集:
    • GraphNovel
  • 是否有开源代码:无

Generic Representation Learning for Dynamic Social Interaction

  • 作者: Yanbang Wang, et al.
  • 发表时间:2020
  • 发表于:KDD
  • 标签:时态网络,Dynamic Social Interaction
  • 概述:社交互动(Social interactions)能够反应人类的社会地位与心理状态。社交关系是动态演变的,因此,在一个人群中,人们之间互相的动作能够反应这种模式。传统的方法一般适用人工定义模板的方法作者使用时态网络定义该问题,提出了一种temporal network-diffusion convolution network的方法,并在三个不同的数据集中对三种不同的心理状态进行了预测。
  • 链接:http://www.mlgworkshop.org/2020/papers/MLG2020_paper_6.pdf
  • 相关数据集:
    • RESISTANCE-1/2/3
    • ELEA
  • 是否有开源代码:无

Motif-Preserving Temporal Network Embedding

  • 作者: Hong Huang, et al.(hust)
  • 发表时间:2020
  • 发表于:IJCAI 2020
  • 标签:CTDG,motif,hawkes
  • 概述:本论文采用了一种meso-dynamics的建模方法,通过一种时序网络上的motif——open triad,考虑三个节点之间的triad结构,利用Hawkes过程建模节点对之间的密度函数,来学习时态网络中的embedding。论文在节点分类、链接预测(这一部分实验写的不清楚,不太明白是怎么做的实验)、链接推荐上取得了较好的效果。
  • 链接:https://www.ijcai.org/Proceedings/2020/0172.pdf
  • 相关数据集:
    • School
    • Digg
    • Mobile
    • dblp
  • 是否有开源代码:无

Local Motif Clustering on Time-Evolving Graphs

  • 作者: Dongqi Fu, et al.(UIUC)
  • 发表时间:2020
  • 发表于:KDD 2020
  • 标签:DTDG,motif,cluster
  • 概述:图的motif是研究复杂网络的一种手段,能够揭示图形成的规律。motif clustering通过挖掘图中存在motif的不同形式,寻找图中节点的聚类簇。目前,局部聚类技术(一种聚焦于一组种子节点并为其划分cluster)已经广泛应用于静态图中,但在动态图领域尚未被应用。基于此,作者提出了一种适用于时态演化图(time- evolving graph)的局部motif聚类算法(L-MEGA)。在该算法中,作者设计了edge filtering/motif push operation与incremental sweep cut等技术,提高了算法的性能和效率。
  • 链接:https://dl.acm.org/doi/10.1145/3308560.3316581
  • 相关数据集:
    • Alpha
    • OTC
    • Call
    • Contact
  • 是否有开源代码:有(https://github.com/DongqiFu/L-MEGA

INDUCTIVE REPRESENTATION LEARNING ON TEMPORAL GRAPHS

  • 作者: Da Xu, et al.
  • 发表时间:2020
  • 发表于:ICLR 2020
  • 标签:CTDG,inductive learning
  • 概述:传统动态图表示学习的工作是transductive的,意即只能对训练集中出现过的节点进行表示,无法对unseen nodes进行表示。作者受到静态图中GraphSage、GAT等inductive learning方法的启发,提出了temporal graph attention layer(TGAT)这一结构。该结构使用了通过Bochner定理推导出时态核函数的时态编码模块,建模节点embedding识别为时间的函数,并能够随着图的演化,来有效聚合时态-拓扑邻居特征,从而学习到节点的时态-拓扑邻居聚合函数,使用inductive的方法快速生成节点表示。
  • 链接:https://arxiv.org/abs/2002.07962
  • 相关数据集:
    • Wikipedia
    • Reddit
    • Industrial dataset
  • 是否有开源代码:无

INDUCTIVE REPRESENTATION LEARNING IN TEMPORAL NETWORKS VIA CAUSAL ANONYMOUS WALKS

  • 作者: Yanbang Wang, et al.(stanford snap团队)
  • 发表时间:2021
  • 发表于:ICLR 2021
  • 标签:CTDG,inductive learning,causal anonymous walk
  • 概述:时态网络的演化是存在一定规律的,如社交网络中存在广泛的三元组闭环规律。作者认为,时态图上的inductive算法应该能够学习到这种规律,并应用至训练阶段未见过的数据中。为了表征这种规律,过滤掉节点特征对学习这种规律的影响,作者提出了基于Causal Anonymous Walks的节点表征方式,能够匿名化采样时态因果路径上的节点信息,从而对采样到的motif进行真正的关注学习。
  • 链接:https://arxiv.org/abs/2101.05974
  • 相关数据集:
    • Wikipedia
    • Reddit
    • MOOC
    • Social Evolution
    • Enron
    • UCI
  • 是否有开源代码:有(https://github.com/snap-stanford/CAW

Dynamic & Heterogeneous Graph Representation

Dynamic & Heterogeneous Graph Representation -- 相关前沿研究(2015 - 至今)

基于动态异构信息网络的时序关系预测

  • 作者: Zeya Zhao, et al. (ICT, CAS)
  • 发表时间:2015
  • 发表于:计算机研究与发展
  • 标签:动态信息,异质信息,回归模型
  • 概述:本文首先提出了时间差路径的概念,将关系的时间信息融入到网络上的关系路径中,后将时间信息和结构信息整合,提出了时间差关系路径法(TDLP),将网络中边上的时间信息融入到结构路径中,具体来讲通过随机游走采样符合指定路径与时间模式的样例用于训练逻辑回归模型,然后基于该训练好的模型做时序关系预测,本文在自构建的动态学术数据集上进行实验,验证了模型的有效性。
  • 链接:http://crad.ict.ac.cn/CN/10.7544/issn1000-1239.2015.20150183
  • 相关数据集:
    • DBLP
  • 是否有开源代码:无

DHNE: Network Representation Learning Method for Dynamic Heterogeneous Networks

  • 作者: Ying Yin, et al.
  • 发表时间:2019
  • 发表于:IEEE Access
  • 标签:DTDG,异质信息,动态信息, random walk
  • 概述:本文同时考虑到图的异质性与动态性,通过构建Historical-Current图将中心节点的历史邻居信息与当前邻居信息进行拼接,并在此基础上进行Random Walk采样,通过Skip-Gram更新节点在当前时间的向量表示。本文在包含时间信息的DBLP和Aminer数据集上通过节点分类的下游任务验证了模型的有效性。
  • 链接:https://ieeexplore.ieee.org/document/8843962
  • 相关数据集:
    • AMiner
    • DBLP
  • 是否有开源代码:有(https://github.com/Yvonneupup/DHNE)

Modeling Dynamic Heterogeneous Network for Link Prediction using Hierarchical Attention with Temporal RNN

  • 作者: Hansheng Xue, et al.
  • 发表时间:2020
  • 发表于:ArXiv
  • 标签:DTDG,异质信息,动态信息, 图神经网络
  • 概述:本文提出一个能够同时学习图中动态信息和异质信息的框架DyHATR,通过类似于HAN的异质图神经网络建模每个时间步上节点的表示,其中通过分层注意力机制同时关注到聚合信息时不同节点的重要性,以及不同Meta-path的重要性。在对于每个时间切片图中学到节点的表示基础上,通过RNN来建模节点表示的演化。本文通过Link Prediction实验验证了模型的有效性。
  • 链接:https://ieeexplore.ieee.org/document/8843962
  • 相关数据集:
    • Twitter
    • Math-Overflow
    • Ecomm
  • 是否有开源代码:有(https://github.com/skx300/DyHATR)

Dynamic Heterogeneous Information Network Embedding with Meta-path based Proximity

  • 作者: Xiao Wang, et al.
  • 发表时间:2020
  • 发表于:TKDE
  • 标签:DTDG,异质信息,动态信息, 矩阵分解
  • 概述:对于动态异质图,本文提出一种新的增量式更新方法,用于在考虑图演化的情况下节点向量表示的更新。首先本文对于静态异质图的表示学习,提出了新的StHNE模型,能够同时考虑到一阶邻居相似性以及二阶邻居相似性用于作为节点表示的参照;在此基础上,对于动态演化的异质图,本文提出DyHNE模型,将图的演化转化成特征值和特征向量的变化,并且据此提出了一套新的增量式更新的方法,用于更新节点的表示。本文通过节点分类以及关系预测验证了模型的有效性。
  • 链接:https://yuanfulu.github.io/publication/TKDE-DyHNE.pdf
  • 相关数据集:
    • Yelp
    • DBLP
    • AMiner
  • 是否有开源代码:有(https://github.com/rootlu/DyHNE)

Relationship Prediction in Dynamic Heterogeneous Information Networks

  • 作者: Amin Milani Fard, et al.(New York Institute of Technology)
  • 发表时间:2019
  • 发表于:Advances in Information Retrieval 2019 (4)
  • 标签:DTDG,异质信息
  • 概述:本文在考虑图动态性的同时,考虑图的异质性,认为不同类型节点对之间的关系自然有所区别,因此提出了动态异质图表示学习,并且做了规范定义。并且提出MetaDynaMix 方法,通过meta-path标注每个节点和边的特征,在此基础上通过矩阵分解得到特征向量,并用于计算关系预测时的概率。
  • 链接:https://www.researchgate.net/publication/332257507_Relationship_Prediction_in_Dynamic_Heterogeneous_Information_Networks
  • 相关数据集:
    • Publication Network (DBLP+ ACM)
    • Movies Network (IMDB)
  • 是否有开源代码:无

Link Prediction on Dynamic Heterogeneous Information Networks

  • 作者: Chao Kong, et al.(Anhui Polytechnic University)
  • 发表时间:2019
  • 发表于:Lecture Notes in Computer Science 2019
  • 标签:DTDG,异质信息,广度学习,图神经网络
  • 概述:本文考虑到动态图相关研究中异质信息缺乏有效的利用,且对于大规模图的表示学习过程中,深度学习方法效率较低,因此提出了一种宽度学习(?)的框架,并且与图神经网络相结合,实现高效的动态异质图表示学习。
  • 链接:https://link.springer.com/chapter/10.1007%2F978-3-030-34980-6_36
  • 相关数据集:
    • Reddit
    • Stack Overflow
    • Ask Ubuntu
  • 是否有开源代码:无

Heterogeneous Dynamic Graph Attention Network

  • 作者: Qiuyan Li, et al.(BUPT)
  • 发表时间:2020
  • 发表于:ICKG 2020
  • 标签:Heterogeneous Graph, Dynamic Graph, Graph Attention Network, CTDG
  • 概述:本文关注到现实世界图的动态性和异质性,并在HAN的分层注意力机制基础上(Structural-level Attention, Semantic--level Attention), 提出 Time-level Attention,其本质上通过Hawkes过程建模节点之间关系出现的概率,最终本文通过列两个真实数据集上的实验验证了模型的有效性,但是其模型本质创新性较少,且数实验有限(利用额外的时间信息,但并未与建模时间的方法相比较)。
  • 链接:https://link.springer.com/chapter/10.1007%2F978-3-030-34980-6_36
  • 相关数据集:
    • ACM
    • DBLP
  • 是否有开源代码:无

Knowledge-aware coupled graph neural network for social recommendation

  • 作者: Chao Huang, et al. (京东, 南科大)
  • 发表时间:2021
  • 发表于:AAAI 2021
  • 标签:Heterogeneous Graph, Social Recommendation, Dynamic Information
  • 概述:本文旨在探究用户社交关系、用户-商品关系以及商品-商品之间的关系对于社交推荐的影响,考虑到(1) 大部分现有工作忽略了商品与商品的关联性,比如同属于一个类别的商品会对用户的购买行为产生影响;(2) 现有的方法仅仅考虑了用户与商品之间单一维度的交互关系,忽略了在现实场景中用户与商品关系多样化的特性(e.g., 用户不同的评分,以及基于不同行为的交互;(3) 缺少有效地方法建模用户/商品之间局部和全局的关联性,本文设计了新的方法K-GCN。首先,该方法基于GNN的架构进行用户与商品间embedding的传递与更新。通过设计relation-aware的message passing的机制,K-GCN图神经网络的结构可以捕捉到用户与商品间多元化关系,从而加强用户与商品间关系建模。并且利用互信息的思想计算节点的local embedding和global embedding的信息,使embedding可以保留用户-商品的global信息,并且考虑到用户行为的动态性,加入了temporal encoding模块,用于动态建模用户的行为与兴趣。最终,本文实验证明多元关系对于社交推荐的增益,以及验证了该模型的有效性。
  • 链接:https://www.aaai.org/AAAI21Papers/AAAI-9069.HuangC.pdf
  • 相关数据集:
    • Epinions
    • Yelp
    • E-Com
  • 是否有开源代码:有( https://github.com/xhcdream/KCGN )

Social Knowledge Graph Definition

Social Knowledge Graph Definition -- 相关前沿研究(2015-至今)

Incorporating Social Context and Domain Knowledge for Entity Recognition

  • 作者: Jie Tang, et al.(THUNLP)
  • 发表时间:2015
  • 发表于:WWW 2015
  • 标签:Social Context, Entity Recognition
  • 概述:本文关注到在社交交互文本的实例识别工作中,没有使用社交节点信息以及通用知识库的信息,因此提出SOCINST方法,考虑利用社交节点信息以及通用知识库辅助社交文本中的实例识别。可以认为本文是较早考虑到在具体任务中,将社交网络中的信息与知识图谱的信息进行结合,用于实现信息互补。
  • 链接:https://dl.acm.org/doi/abs/10.1145/2736277.2741135
  • 相关数据集:
    • Weibo
    • I2B2
    • ICDM' 12 Contest
  • 是否有开源代码:无

Multi-Modal Bayesian Embeddings for Learning Social Knowledge Graphs

  • 作者: Zhilin Yang, et al.(THUNLP)
  • 发表时间:2016
  • 发表于:IJCAI 2016
  • 标签:Social Knowledge Graph, Network Embedding
  • 概述:本文可以认为是首次提出了Social Knowledge Graph的概念以及Social Knowledge Graph Learning,关注到社交网络中蕴含的大量节点信息以与通用知识库中蕴含着大量的背景信息可以互补结合,因此提出了GenVector方法,旨在链接社交网络与传统知识库,本文中对于链接的理解是将社交网络中的节点与知识库的多个概念相连接(比如社交节点中某学者与通用知识库中的几个研究方向概念连接)。
  • 链接:https://arxiv.org/abs/1508.00715
  • 相关数据集:
    • Aminer
    • LinkedIn Profile
  • 是否有开源代码:无

Constructing Knowledge Graph for Social Networks in A Deep and Holistic Way

  • 作者: Qi He, et al.(LinkedIn)
  • 发表时间:2020
  • 发表于:2020 WWW Tutorial
  • 标签:Social Knowledge Graph
  • 概述:本文是LinkedIn在WWW中做的一个报告,讲述了其在将知识图谱于社交网络结合方面所做的相关工作,以及其对社交知识图谱的看法,未来面临的挑战。
  • 链接:https://dl.acm.org/doi/abs/10.1145/3366424.3383112
  • 相关数据集:
  • 是否有开源代码:无

Personal Knowledge Graph_A Research Agenda

  • 作者: Krisztian Balog, et al. (Google)
  • 发表时间:2019
  • 发表于:ICTIR 2019
  • 标签:Personal Knowledge Graph
  • 概述:本文是谷歌所作的一篇短文,旨在从个人的视角审视知识图谱,并且提出个人知识图谱(Personal Knowedge Graph)的概念,其核心思想是以人为中心,从社交网络、通用知识图谱、领域知识图谱、用户行为信息等渠道进行数据的融合,聚合与其相关的异质信息用于构建的知识图谱,能够用于用户精准刻画,继而服务于推荐系统等应用。
  • 链接:https://dl.acm.org/doi/abs/10.1145/3341981.3344241
  • 相关数据集:
  • 是否有开源代码:无

Social Knowledge Graph Explorer

  • 作者:Omar Alonso, et al. (Microsoft)
  • 发表时间:2019
  • 发表于:SIGIR 2019
  • 标签:Social Knowledge Graph
  • 概述:本文是微软在SIGIR的demo环节所做的一篇文章,其主要阐述了社交知识图谱的含义及其重要性,并且从工业的角度阐释了社交知识图谱的构建流程,即社交知识图谱的schema层划分及其实现,并且展示了微软的社交知识图谱demo。
  • 链接:https://dl.acm.org/doi/abs/10.1145/3331184.3331410
  • 相关数据集:
  • 是否有开源代码:无

Representation Learning in Heterogeneous Professional Social Networks with Ambiguous Social Connections

  • 作者:Baoxu Shi, et al. (LinkedIn)
  • 发表时间:2019
  • 发表于:ICBD 2019
  • 标签:Heterogeneous Professional Social Network, Random Walk
  • 概述:本文是LinkedIn立足于自身业务需求而提出的一篇偏向于具体应用的文章。本文首先考虑到丰富的异质信息能够辅助社交网络信息挖掘,因此对于传统只包含person节点的社交网络进行了扩充,加入了与人相关的entity,提出了heterogeneous professional social network。在该异质社交网络上,本文提出了STAR2VEC,即围绕特定person节点扩展相应的entity (这里感觉与google的personal knowledge graph有了联系),并且在此基础上提出基于random walk的方法学习节点的表示,服务于诸如节点分类,节点聚类,链接预测的任务。最终为诸如Next Career Move, Alternative Career Suggestion, General Similarity Search等业务应用提供支持。
  • 链接:https://arxiv.org/pdf/1910.10763.pdf
  • 相关数据集:
    • Facebook
    • LinkedIn-60k
    • LinkedIn-44M
  • 是否有开源代码:无

Integration over Knowledge Graph and Social Network

Integration of Knowledge Graph and Social Network -- 综述

A Benchmarking Study of Embedding-based Entity Alignment for Knowledge Graphs

  • 作者: Zequn Sun, et al. (NJU, UCLA)
  • 发表时间:2020
  • 发表于:VLDB 2020
  • 标签:Entity Alignment, Knowledge Graph, Survey
  • 概述:实体对齐是跨知识图谱融合的重要手段。本文对于知识图谱的实体对齐相关技术进行了综述,并且根据其使用的技术特点进行分类,在此基础上作者构建了开源的实体对齐库OpenEA。
  • 链接:http://www.vldb.org/pvldb/vol13/p2326-sun.pdf
  • 相关数据集:
    • DBpedia
    • Wikidata
    • YAGO
  • 是否有开源代码:有 (https://github.com/nju-websoft/OpenEA)

An Experimental Study of State-of-the-Art Entity Alignment Approaches

  • 作者:Xiang Zhao, et al. (New South Wales)
  • 发表时间:2020
  • 发表于:TKDE 2020
  • 标签:Entity Alignment, Knowledge Graph, Survey
  • 概述:本文同样是一篇有关知识图谱的实体对齐的综述,其对于常见的知识图谱实体对齐方法进行了更为详细的分析,并且对于模型中常用的组件进行了功能性分析,且提出了具有unmatch实体的数据集: DBP-FR. 最后根据实验对于实体对齐时的模型选择给出了建议。
  • 链接:https://doi.org/10.1109/TKDE.2020.3018741
  • 相关数据集:
    • DBP-FR
    • DWY100k
    • DBP15k
    • SRPRS
  • 是否有开源代码:有 (https://github.com/DexterZeng/EAE)

User Identity Linkage across Online Social Networks: A Review

  • 作者:Kai Shu, et al. (Arizona State University)
  • 发表时间:2017
  • 发表于:SIGKDD 2017
  • 标签:User Identity Linkage, Social Network, Survey
  • 概述:本文是一片关于社交网络跨网络用户对齐的全面性综述。首先本文对于研究的意义进行了介绍,即 (1)有助于好友推荐;(2)增强信息跨网络流动;(3)分析网络的动态演化。对于研究的挑战进行了概括,即(1)用户简介数据不对称;(2)网络中用户产生的内容异构;(3)网络稀疏性,以及噪声。并且,本文对于跨网络用户对齐的问题进行了详细地定义。在此基础上,本文提出了通用地框架,即(1)特征(用户介绍、信息内容、网络特征)抽取;(2)模型预测。然后,本文对于研究相关的经典方法、数据集和评价指标进行了分析总结。最后,本问对于跨网络用户对齐从数据、评价以及动态性三方面的挑战进行了探讨,以及对于该研究方向进行了总结与展望。
  • 链接:http://www.cs.iit.edu/~kshu/files/kdd_exp_kai.pdf
  • 是否有开源代码:无

面向网络大数据的知识融合方法综述

  • 作者:Hailun Lin, et al. (中科院计算所)
  • 发表时间:2017
  • 发表于:计算机学报
  • 标签:Knowledge Integration, Survey
  • 概述:本文立足于面向网络大数据的开放知识网络,考虑到如何将网络大数据中获得的知识融入开放知识网络,对于近年来有关于知识融合的研究工作进行了系统性地梳理,并且提出了面向网络大数据的知识融合方法整体框架。
  • 链接:http://cjc.ict.ac.cn/online/onlinepaper/lhl-20171494626.pdf
  • 相关数据集:无
  • 是否有开源代码:无

面向关系型数据与知识图谱的数据集成技术综述

  • 作者:Yunjun Gao, et al. (浙江大学)
  • 发表时间:2022
  • 发表于:软件学报
  • 标签:Knowledge Integration, Survey
  • 概述:本文聚焦于关系型数据库与知识图谱在实际应用场景下场遇到的三个问题:1.数据解析;2.数据融合;3.数据评估。文章对于以上三个研究方向给出了形式化定义以及相关概念的梳理,并且全面梳理了相关研究工作,对于社交知识图谱在实际应用场景下的构建具有启示。
  • 链接:http://www.jos.org.cn/jos/article/abstract/6808?st=search
  • 相关数据集:无
  • 是否有开源代码:无

Integration of Knowledge Graph and Social Network -- 相关前沿研究(2015-至今)

Bootstrapping Entity Alignment with Knowledge Graph Embedding

  • 作者:Zequn Sun, et al. (NJU)
  • 发表时间:2018
  • 发表于:IJCAI 2018
  • 标签:Entity Alignment, Knowledge Graph
  • 概述:本文将实体对齐视作一个分类任务,在全局寻找最符合的对其节点,且设计了新的loss,使正负差异变大,除此之外,本文提出一个结合bootstrapping的方式用于半监督实体对齐。
  • 链接:https://www.ijcai.org/Proceedings/2018/0611.pdf
  • 相关数据集:
    • DBP_ZH-EN
    • DBP-WD
    • DBP-YG
  • 是否有开源代码:有 (https://github.com/nju-websoft/BootEA)

Multi-view Knowledge Graph Embedding for Entity Alignment

  • 作者:Qingheng Zhang, et al. (NJU)
  • 发表时间:2019
  • 发表于:IJCAI 2019
  • 标签:Entity Alignment, Knowledge Graph
  • 概述:本文考虑到不同类型的信息对于实体对齐任务的增益,提出了一种新的实体对齐框架,从属性、实体名、关系三个角度来学习实体的embedding,并且给出了多种结合策略。实验证明模型的实体对齐效果相较Baseline有了显著的提升。
  • 链接:https://www.ijcai.org/Proceedings/2019/754
  • 相关数据集:
    • DBP-WD
    • DBP-YG
  • 是否有开源代码:有 (https://github.com/nju-websoft/MultiKE)

Jointly Learning Entity and Relation Representations for Entity Alignment

  • 作者:Yuting Wu, et al. (PKU)
  • 发表时间:2019
  • 发表于:EMNLP 2019
  • 标签:Entity Alignment, Knowledge Graph
  • 概述:本文考虑到以往的实体对齐方法没有利用好实体之间的关系来辅助实体对齐,因此本文基于图神经网络,提出一种新的实体和关系的联合学习框架用于实体对齐。
  • 链接:https://www.aclweb.org/anthology/D19-1023.pdf
  • 相关数据集:
    • DWY100k
    • DBP15k
    • DBP-FB
    • SRPRS
  • 是否有开源代码:有 (https://github.com/StephanieWyt/HGCN-JE-JR)

A BERT-based Interaction Model For Knowledge Graph Alignment

  • 作者:Xiaobing Tang, et al. (Renmin University)
  • 发表时间:2020
  • 发表于:IJCAI 2020
  • 标签:Entity Alignment, Knowledge Graph
  • 概述:本文考虑到知识图谱的边缘信息(e.g., 名称、描述、属性)比结构信息更为游泳,因此本文提出了只利用边缘信息的知识图谱实体对齐方法BERT-INT,即基于BERT处理实体的边缘信息用于实体对齐。
  • 链接:https://www.ijcai.org/Proceedings/2020/0439.pdf
  • 相关数据集:
    • DBP15k
  • 是否有开源代码:有 (https://github.com/kosugi11037/bert-int)

Social Network De-Anonymization and Privacy Inference with Knowledge Graph Model

  • 作者:Jianwei Qian, et al. (USTC)
  • 发表时间:2019
  • 发表于:IEEE Trans on Dependable and Secure Computing
  • 标签:Social network data publishing, attack and privacy preservation, knowledge graph
  • 概述:本文关注于隐私泄露行为分析,首先总结了现有的去匿名化工作有以下三点缺陷: (1)以往的工作仅仅关注于去匿名化的实验,而没有思考攻击者如何真正地获取用户隐私从而完成去匿名化; (2)以往的工作认为攻击者仅仅具有单一类型的数据,或仅仅了解网络的拓扑结构; (3)没有考虑到攻击者可能利用丰富的属性信息。 并且总结了三点挑战: (1)难以构建一个具有丰富表达性的模型,从而考虑到所有的攻击者先验知识;(2)难以建模隐私推理的完整过程;(3)难以量化隐私泄露程度。因此本文提出了一个利用知识图谱分析去匿名化以及隐私推理的模型,用于两步分析隐私泄露行为。本文在Google plus和Pokec数据集上,通过实验验证了模型的有效性。
  • 链接:https://ieeexplore.ieee.org/abstract/document/7911249
  • 相关数据集:
    • Google Plus
    • Pokec
  • 是否有开源代码:无

SocialLink: Exploiting Graph Embeddings to Link DBpedia Entities to Twitter Profiles

  • 作者:Yaroslav Nechaev, et al. (University of Trento)
  • 发表时间:2018
  • 发表于:Progress in Artificial Intelligence
  • 标签:Social network, Twitter, DBpedia
  • 概述:本文主要描述了SocialLink项目,该项目旨在将Twitter中的用户与DBpedia中的实体相连,构建社交网络与知识图谱的桥梁。具体来讲,本文通过Twitter提供的API,对于知识库出现的人名进行检索,然后再依据社交网络的用户表示学习所得到的embedding对于候选对的用户进行排序,最终进行连接。
  • 链接:https://cris.fbk.eu/bitstream/11582/317882/1/sociallink2018prai.pdf
  • 相关数据集:
    • Twitter
    • DBpedia
  • 是否有开源代码:http://sociallink.futuro.media/

Type Prediction Combining Linked Open Data and Social Media

  • 作者:Yaroslav Nechaev, et al. (University of Trento)
  • 发表时间:2018
  • 发表于:CIKM 2018
  • 标签:Social network, Twitter, DBpedia, Type Prediction
  • 概述:本文是Social Link工作的后续,其旨在通过Social Link建立好的连接的基础上,考虑到社交网络中用户的行为信息能够一定程度上反应该用户的属性,设计了方法通过社交网络的信息对于DBpedia中的用户属性进行推理。具体来讲,本文使用到了社交网络中用户发表的文本信息、用户之间在社交网路中的交互信息,以及用户本身的简介信息,通过对于以上信息进行聚合以及嵌入式表示,将知识图谱中的属性推理转化为已知类别信息的多分类问题,继而实现对于知识图谱中缺失信息的补全。
  • 链接:https://dl.acm.org/doi/abs/10.1145/3269206.3271781
  • 相关数据集:
    • Twitter
    • DBpedia
  • 是否有开源代码:http://sociallink.futuro.media/

Tweeki: Linking Named Entities on Twitter to a Knowledge Graph

  • 作者:Bahareh Harandizadeh, et al. (University of California Irvine)
  • 发表时间:2018
  • 发表于:CIKM 2018
  • 标签:Social network, Twitter, DBpedia, Type Prediction
  • 概述:本文旨在对于Twitter发布的文本内容中的信息进行抽取,对于mention提到的内容,将其连接到知识图谱中的实体。本文的核心贡献是:(1)提出了一个五年度的实体链接工具-Tweeki; (2)提出了Tweeki的数据集用于后续的研究; (3)提出了TweekiGold数据集用于验证实体链接方法的效果。
  • 链接:https://www.aclweb.org/anthology/2020.wnut-1.29.pdf
  • 相关数据集:
    • Twitter
    • DBpedia
  • 是否有开源代码:https://ucinlp.github.io/tweeki/

Social Knowledge Graph Construction

Social Knowledge Graph Construction -- 相关前沿研究(2015-至今)

SocioScope: A framework for understanding Internet of Social Knowledge

  • 作者:Hoang Long Nguyen, et al. (Chung-Ang University)
  • 发表时间:2018
  • 发表于:Future Generation Computer Systems
  • 标签:SocioScope, Internet of Social Knowledge, Integrated framework
  • 概述:考虑到在线社交网络平台每天都产生大量的动态社交信息,为了对于这些信息加以有效率用,提出了SocialScope系统,旨在通过大量、动态的社交信息构建动态知识图谱,并且探讨了在该知识图谱上进行用户推断相关的应用。
  • 链接:https://dl.acm.org/doi/abs/10.1016/j.future.2018.01.064
  • 是否有开源代码:无

Extending SocioScope Framework for Generating Knowledge Graph from Social Data

  • 作者:Hoang Long Nguyen, et al. (Chung-Ang University)
  • 发表时间:2018
  • 发表于:IEEE Conference on Signal-Image Technologies and Internet-Based System
  • 标签:Social Event, Knowledge Graph, SocioScope framework, Internet of Knowledge
  • 概述:本文和socioscope的原文整体motivation相同,简单扩展了原文的内容,详细对于利用社交数据构建知识图谱的过程进行了阐述。
  • 链接:https://ieeexplore.ieee.org/abstract/document/8706236
  • 是否有开源代码:无

Social Event Decomposition for Constructing Knowledge Graph

  • 作者:Hoang Long Nguyen, et al. (Chung-Ang University)
  • 发表时间:2019
  • 发表于:Future Generation Computer Systems
  • 标签:Social event decomposition, Event-driven knowledge graph, SocioScope framework, Independent component analysis
  • 概述:本文同样是围绕socioscope展开,从利用大量动态社交数据进行事件抽取的角度进行了论述,首先对于社交数据中的事件做出了规范,并且在socioscope上进行了实验分析以及给出了结果的可视化。
  • 链接:https://www.sciencedirect.com/science/article/abs/pii/S0167739X19302493
  • 是否有开源代码:无

Content Feature of Social Knowledge Graph

Content Feature of Social Knowledge Graph -- 相关前沿研究(2017-至今)

Infusing Multi-Source Knowledge with Heterogeneous Graph Neural Network for Emotional Conversation Generation

  • 作者:Yunlong Liang. (Wechat)
  • 发表时间:2021
  • 发表于:AAAI 2021
  • 标签:Heterogeneous Graph, Conversation Generation
  • 概述:本文称首次将异质图神经网络用于对话生成任务之中,其通过将多轮对话中的情感信息,人物信息,内容信息,表情信息(这里包含一定的多模态的数据)建模成异质图,并且通过异质图神经网络进行Encoder生成对话的向量式表示,并且设计了基于Emotion的Decoder,用于生成后续的对话内容。本文在三个公开的数据集中进行实验验证了模型的有效性。
  • 链接:https://arxiv.org/pdf/2012.04882.pdf
  • 相关数据集:
    • MELD
    • DailyDialog
  • 是否有开源代码:有( https://github.com/XL2248/HGNN )

Knowledge-based Review Generation by Coherence Enhanced Text Planning

  • 作者:Junyi Li, Wayne Xin Zhao (人大高瓴)
  • 发表时间:2021
  • 发表于:SIGIR 2021
  • 标签:Heterogeneous Knowledge Graph, Text Generation
  • 概述:本文关注于利用知识图谱改善评论文本生成的质量。具体来讲,本文旨在使用KG的子图及其之间的关系去保证生成文本的全局以及局部一致性;在方法部分,本文首先提出了异质知识图谱,即包括User-Item-Entity-Word四种类型节点的异质图,并且本文提出了CETP用于评论生成,其包括document plan以及sentence plan,用于保证文本生成时的异质性。本文通过大量实验证明了模型的有效性。
  • 链接:https://arxiv.org/pdf/2105.03815.pdf
  • 相关数据集:(基于以下三个数据集构建)
    • AMAZON Electronic
    • BOOK
    • IMDB Movie
  • 是否有开源代码:有( https://github.com/turboLJY/Coherence-Review-Generation )

Improving Conversational Recommender Systems via Knowledge Graph based Semantic Fusion

  • 作者:Kun Zhou, Wayne Xin Zhao (PKU, 人大高瓴)
  • 发表时间:2020
  • 发表于:KDD 2020
  • 标签:Conversational Recommender Systems, Knowledge Graph
  • 概述:本文是一篇关于对话式推荐系统的研究,重点考虑多轮对话前后语义一致性,以及对话背后的背景知识以及自然语言和用户表述的语义鸿沟。本文将概念知识图谱(ConceptNet)和通用知识图谱(DBpedia)引入到对话推荐系统中(CRS),首先利用图神经网络(R-GCN,以及GCN)学习知识节点的表示,并且通过互信息来使得两个知识图谱的对应节点表示相似,最终在此基础上设计Encoder-Decoder,实现推荐。本文通过全面的实验验证了模型的有效性。
  • 链接:https://arxiv.org/pdf/2007.04032.pdf
  • 相关数据集:
    • REcommendations through DIALog (REDIAL)
  • 是否有开源代码:有( https://github.com/lancelot39/kgsf )

Joint Representation Learning of Legislator and Legislation for Roll Call Prediction Fusion

  • 作者:Yuqiao Yang (复旦大学)
  • 发表时间:2020
  • 发表于:IJCAI 2020
  • 标签:Roll Call Prediction, Graph Neural Network
  • 概述:本文聚焦于建模立法者和相关的法案投票。考虑到以往的模型仅仅利用立法者或者法案本身的特征信息以及简单利用法案的文本信息,而缺乏对于立法者之间的关系,以及深层次文本信息的利用。因此,本文利用GCN学习立法者的表示,利用LSTM根据法案内容学习法案的表示,并且利用Triplet Loss来对齐法案和立法者的向量空间。本文提出了相关研究的数据集,并且进行了充分的实验验证了模型的有效性。
  • 链接:https://www.ijcai.org/Proceedings/2020/0198.pdf
  • 相关数据集:
    • REcommendations through DIALog (REDIAL)
  • 是否有开源代码:有( https://github.com/lxqjdai/Joint-Representation-Learning-of-Legislator-and-Legislation-for-Roll-Call-Prediction )

Social Relation Reasoning

Social Relation Reasoning -- 综述

基于图像和视频信息的社交关系理解研究综述

  • 作者: 王正, et al. (BUPT)
  • 发表时间:2021
  • 发表于:计算机学报 2021
  • 标签:Social Relationship Understanding, Computer Vision, Survey
  • 概述:本文聚焦于通过图像和视频等社交网络中广泛存在的多模信息对于理解社交关系的帮助,对于该研究领域进行了全面地综述。首先对于基于图像、视频的社交关系理解相关定义进行了介绍,并且对于该研究进行了形式化地描述。然后设计了整体的研究过程框架,对于相关的研究工作进行了梳理,最后对于该研究邻域进行了展望。
  • 链接:http://cjc.ict.ac.cn/online/onlinepaper/wz-20216780932.pdf
  • 是否有开源代码:无

Social Knowledge Graph Reasoning -- 相关前沿研究(2017-至今)

CANE: Context-Aware Network Embedding for Relation Modeling

  • 作者: Cunchao Tu, et al.(THUNLP)
  • 发表时间:2017
  • 发表于:AAAI 2017
  • 标签:Social Relation Modeling, Context Information
  • 概述:本文考虑到对于社交节点的Embedding没有利用到社交节点的个人信息(如社交主页的自我介绍),不同的节点个人背景会影响到节点的Embedding,自然而然也会影响到节点连接的Embedding,因此提出CANE的方法,旨在通过CNN将社交网络中的个人信息转化成Attention向量,继而影响社交节点的Embedding,以此实现综合个人社交信息的Embedding。
  • 链接:https://www.ijcai.org/proceedings/2017/399
  • 相关数据集:
    • Cora
    • HepTh
    • Zhihu
  • 是否有开源代码:有 (https://github.com/J-zin/CANE-pytorch)

TransNet: Translation-Based Network Representation Learning for Social Relation Extraction

  • 作者: Cunchao Tu, et al.(THUNLP)
  • 发表时间:2017
  • 发表于:IJCAI 2017
  • 标签:Social Relation Extraction, Auto Encoder, Traslation Learning
  • 概述:关注到社交网络中社交关系的表示学习,考虑到社交关系往往隐含在社交交互(文本)中,社交关系复杂且存在复合,难以用单一的标签表示,因此本文首先提出了社交关系抽取(Social Relation Extraction)任务并且给出了形式化的定义,将社交关系看作是多标签的复合(Multi One-hot)。此外本文正对于社交关系抽取,提出了模型TransNet,其核心分为两部分,Auto Encoder部分用于将高维的Multi One-hot向量嵌入至低维空间并且尽可能还原原始信息,类TransE部分用于对于Encoder端得到的社交关系的向量表示进行约束,使其符合(Head + Relation = Tail)的Translation关系。与之对应,模型的Loss Function也分为两部分,分别为AE的重建误差,以及Translation Learning的Score Function。关于实验部分,本文在三种不同规模的Aminer数据集上,以SRE为任务进行了实验验证模型的有效性。
  • 链接:https://www.ijcai.org/proceedings/2017/399
  • 相关数据集:
    • AMiner
  • 是否有开源代码:有 (https://github.com/thunlp/TransNet)

Social Relation Inference via Label Propagation

  • 作者: Yingtao Tian, et al.(Google Research, UCLA)
  • 发表时间:2019
  • 发表于:ECIR 2019
  • 标签:Social Relation Extraction, Auto Encoder, Traslation Learning
  • 概述:本文是对于TransNet工作的改进,同样是认为社交关系复杂难以用单一的label表示,本文认为TransNet等表示学习方法时间成本过高,提出一种简单的基于标签传播的算法,在具有少量已标注社交关系的条件下,对于社交节点之间的关系进行补全,并且在保证了准确率的情况下提升了时间效率(5min v.s 24h+)。
  • 链接:https://link.springer.com/chapter/10.1007/978-3-030-15712-8_48
  • 相关数据集:
    • AMiner
  • 是否有开源代码:无

Deep Reasoning with Knowledge Graph for Social Relationship Understanding

  • 作者: ZhouxiaWang, et al. (中山大学)
  • 发表时间:2018
  • 发表于:WWW 2018
  • 标签:Social Relation Reasoning, Computer Vision, Knowledge Graph
  • 概述:本文是一篇计算机视觉领域的文章,核心思想是通过引入知识图谱的概念,用于识别图像中的社交关系。具体来讲,在训练集上,本文首先识别图像中出现的物体,并且根据图片的社交关系Ground Truth标签统计物体与社交关系的共现频率,在此基础上构建背景知识图谱(共两种类型的节点: 物品、社交关系)。在通过训练集构建的背景知识图谱基础上,引入门控图神经网络(GGNN),用于推理图片对应的社交关系。实验部分,本文在PISC数据集上以社交关系识别作为任务验证了模型的有效性。
  • 链接:http://www.ijcai.org/proceedings/2018/0142.pdf
  • 相关数据集:
    • PISC
    • COCO
  • 是否有开源代码:有 (https://github.com/HCPLab-SYSU/SR)

Relation Learning on Social Networks with Multi-Modal Graph Edge Variational Autoencoders

  • 作者:Carl Yang, et al. (UIUC韩家炜团队)
  • 发表时间:2019
  • 发表于:WSDM 2020
  • 标签:Relation Learning, Variational AutoEncoder, Social Network
  • 概述:本文关注于社交网络中边的表示学习,考虑到社交信息的多模性、信息的不完整性以及充满噪音,因此本文提出了基于Variational AutoEncoder结构的新社交关系表示学习框架 - RELEARN。其Encoder端通过图神经网络GCN用于将图的结构信息以及节点的属性信息压缩,并且通过MLP学习边的表示,通过VAE概率建模的方式能够提高模型的鲁棒性。对于Decoder端,本文设计了Multi-Decoder机制,即通过Edge的嵌入式表示解码出不同类型的信息(本文解码节点属性信息/图结构信息/节点交互信息)。此外,本文考虑到无监督学习的情况,将节点间社交关系看做概率分布,对于每种社交关系设置了全局的基向量,并且通过基向量的带权加和作为边的最终向量表示。关于实验,本文在DBLP数据集以及LinkedIn数据集上,以节点分类和链接预测作为任务验证了模型的有效性。
  • 链接:https://arxiv.org/abs/1911.05465
  • 相关数据集:
    • DBLP
    • LinkedIn
  • 是否有开源代码:有 (https://github.com/yangji9181/RELEARN)

Graph Attention Networks over Edge Content-Based Channels

  • 作者:Lu Lin, Hongning Wang. (Virginia University)
  • 发表时间:2020
  • 发表于:KDD 2020
  • 标签:Edge Representation Learning, Variational AutoEncoder, Social Network
  • 概述:本文同样聚焦于社交网络中边的表示学习,其核心思想在于认为节点之间的交互隐含着多种话题,且占比不同,这种话题能够通过节点之间的交互文本体现,因此本文聚焦于此对于边的信息与表示进行建模。具体来讲,本文提出了新的模型Topic-GCN,通过类似于Multi-Head Attention的方式建模话题之间的分布,用于代替原有的GAT的Attention机制,同时通过VAE去学习边的表示。实验部分,本文在Yelp和StackOverflow数据集上进行了链接预测以及内容预测实验验证模型的有效性。
  • 链接:https://www.kdd.org/kdd2020/accepted-papers/view/graph-attention-networks-over-edge-content-based-channels
  • 相关数据集:
    • Yelp
    • StackOverflow
  • 是否有开源代码:有 (https://github.com/Louise-LuLin/topic-gcn)

TransConv: Relationship Embedding in Social Networks

  • 作者:Yi-Yu Lai. (Purdue University)
  • 发表时间:2019
  • 发表于:AAAI 2019
  • 标签:Translation Learning, Social Network
  • 概述:本文希望通过社交网络中的对话建模用户以及其社交关系的Embedding,其首先提出了Conversation Similarity Factor,用于建模用户之间的互相交流是否相似(Sim(A-B, B-A)),再通过Conversation Frequency Factor用于建模用户之间经常对话的主题的权重,并结合Trans模型以及通过不同的关系映射到不同的Hyperplane用于建模用户节点和关系的Embedding,本文在两个现实世界社交网络数据集中,对于图谱补全(Link Prediction),三元组分类,以及多标签关系分类任务上验证了模型的有效性。但本文的数据集和代码都没有开源,数据集的处理方式较多,较难follow。
  • 链接:https://ojs.aaai.org/index.php/AAAI/article/download/4314/4192
  • 相关数据集:
    • Twitter
    • Facebook
  • 是否有开源代码:无

MERL: Multi-View Edge Representation Learning in Social Networks

  • 作者:Yi-Yu Lai. (Purdue University)
  • 发表时间:2020
  • 发表于:CIKM 2020
  • 标签:Edge Representation Learning, Multi-View, Social Network
  • 概述:本文认为社交网络中包含多种关系,且社交关系十分重要,但现有的工作仅仅通过拼接节点的embedding来代表社交关系的embedding,缺少对于社交关系的方向性的区分;且社交关系往往包含着多种类型的边,且通过多种上下文来体现。基于此,本文提出模型MERL关注到了节点对之间的关系及其对话的不对称关系;与此同时,本文结合用户之间的对话文本信息用于建模社交关系。同样在两个社交网络数据集上验证了模型的有效性并且给出了详细的分析。本文可以认为是TransConv的一篇延展性工作,其中使用到了TransConv中的两个factor。与TransConv相同,本文没有开源数据集和代码,较难follow。
  • 链接:https://dl.acm.org/doi/abs/10.1145/3340531.3412049
  • 相关数据集:
    • Twitter
    • Facebook
  • 是否有开源代码:无

Graph Convolutional Networks on User Mobility Heterogeneous Graphs for Social Relationship Inference

  • 作者:Yongji Wu. (USTC)
  • 发表时间:2019
  • 发表于:IJCAI 2019
  • 标签:Heterogeneous Graph, Graph Neural Networks, User Mobility
  • 概述:本文关注于利用人物的轨迹信息推理社交关系,其认为以往基于手工特征的推理方法难以有效挖掘人物与轨迹之间的深层关系,且没有关注到除了人物节点之外的地点节点,因此本文首先基于User和Location两类节点构建了异质图,在此基础上设计(类似于R-GCN)的异质图神经网络用于推理人物之间的关系,并在三个现实世界数据集上验证了模型的有效性。
  • 链接:https://www.ijcai.org/Proceedings/2019/0541.pdf
  • 相关数据集:
    • Gowalla
    • Brightkite
    • Foursquare
  • 是否有开源代码:有( https://github.com/libertyeagle/gcn mobility relationship )

Graph Structural-topic Neural Network

  • 作者:Qingqing Long. (北京大学)
  • 发表时间:2020
  • 发表于:KDD 2020
  • 标签:Structural-topic, Latent Dirichlet Allocation, Anonymous Random Walk, Graph Neural Network
  • 概述:本文关注于不同类型的图结构蕴含着不同的社交关系信息,例如星型结构-Follow关系,层级结构-上下级公司关系, 全连接结构-家庭关系,因此本文旨在挖掘图结构蕴含的社交关系主题信息,首先通过Anonymous random walks采样中心节点周围的子图结构,并且通过Graph Anchor机制选择具有代表性的序列,然后类比于NLP的序列,利用LDA分析子图结构蕴含的主题信息,最后服务于节点的表示学习,本文在四个主流社交数据集上验证了模型的有效性
  • 链接:https://arxiv.org/pdf/2006.14278.pdf
  • 相关数据集:
    • Cora
    • AMiner
    • Pubmed
    • PPI
  • 是否有开源代码:有( https://github.com/YimiAChack/GraphSTONE/ )

Self-Supervised Multi-Channel Hypergraph Convolutional Network for Social Recommendation

  • 作者:Junliang Yu. (University of Queensland)
  • 发表时间:2021
  • 发表于:WWW 2021
  • 标签:Hypergraph, Multi Channel, Self-Supervised, Graph Neural Network
  • 概述:本文关注于利用超图结合motif建模社交网络(User-Item)中高阶关系,首先定义了三类(Social motifs/ Joint motifs/ Purchase Motif)共九种motif关系,并且据此设计融入超图信息的多通道图神经网络MHCN,然后为使得不同的通道蕴含其独特的信息,本文设计自监督的方式使得训练过程中不同channel互信息最大化,本文在三个主流社交数据集上验证了模型的有效性
  • 链接:https://arxiv.org/abs/2101.06448v3
  • 相关数据集:
    • LastFM
    • Douban
    • Yelp
  • 是否有开源代码:有( https://github.com/Coder-Yu/RecQ )

在线社交网络中中群体影响力的建模与分析

  • 作者:孟青. (东南大学)
  • 发表时间:2021
  • 发表于:计算机学报 2021
  • 标签:Online Social Network, Group Influence, Graph Neural Networks
  • 概述:本文聚焦于对于存在不同类型用户关系的社交网络进行群体中影响力分析,其核心思想是将社交网络中的边分为长期、静态且稳定的社交关系,以及短期、动态的交互。对此分别使用不同的特征映射函数,并且最终通过图注意力神经网络(GAT)进行融合与嵌入式表示,从而计算群体的影响力。
  • 链接:http://cjc.ict.ac.cn/online/onlinepaper/mq-20216780341.pdf
  • 相关数据集:
    • 微博
    • Twitter
  • 是否有开源代码:无

Inferring Social Ties across Heterogeneous Networks

  • 作者:唐杰. (清华大学)
  • 发表时间:2012
  • 发表于:清华大学学报 2013
  • 标签:Social Tie, Heterogeneous Network, Bayesian Inference
  • 概述:本文聚焦于社交网络中社交关系的语义标注,通过援引三个经典社会学理论:社交平衡(Social Balance)、社会地位(Social Status)和社交结构洞(Social Hole),用于从社会学的角度建模社交关系,并且在此基础上设计模型,实现跨网络的社交关系推理。本文通过大量实验验证了模型的有效性。
  • 链接:http://dx.doi.org/10.1145/2124295.2124382
  • 相关数据集:
    • Epinions
    • Slashdot
    • Mobile
    • Coauthor
    • Enron
  • 是否有开源代码:无

融合时空行为与社交关系的用户轨迹识别模型

  • 作者:张伟. (华东师范大学, 之江实验室, THU)
  • 发表时间:2021
  • 发表于:计算机学报 2021
  • 标签:user trajectory identification; neural temporal point process; spatio-temporal sequence; social relation
  • 概述:这篇文章致力于有效利用轨迹时间戳序列和用户社交关系这两类被相关研究忽略的信息. 一方面时间戳信息能够缓解轨迹稀疏性,另一方面社交关系可以通过刻画用户(类别)之间相关性帮助用户表示学习. 为此,其提出了融合神经时间点过程与图神经网络的新模型NTPP-GNN,包含空间、时间、社交关系三个模块. 空间模块中,双向循环神经网络用来刻画地点间序列性;时间模块中,提出双向神经时间点过程从正反两个方向捕捉时间连续性,并以此促进轨迹的时间表征;社交关系模块中,图神经网络用于传播和学习用户表示. 最后, 这篇文章在三组数据集上进行实验验证了模型的有效性.
  • 链接:http://cjc.ict.ac.cn/online/onlinepaper/2zw-20211216155008.pdf
  • 相关数据集:
    • Foursquare
    • Gowalla
    • Brightkite
  • 是否有开源代码:无

Knowledge Graph (#TODO)

Knowledge Graph - 最新综述(#TODO)

A Survey on Knowledge Graphs: Representation, Acquisition and Applications

  • 作者:Shaoxiong Ji, Shirui Pan, Erik Cambria, Senior Member, IEEE, Pekka Marttinen, Philip S. Yu, Fellow IEEE
  • 发表时间:2021
  • 发表于:TNNLS
  • 标签:Knowledge Graph, Representation Learning
  • 概述:本文是一篇知识图谱领域的前沿综述,文中给出了知识图谱的具体定义,并且从知识获取、知识表示、动态知识图谱、知识图谱的应用等多个角度围绕知识图谱技术进行了讨论。同时文章还对于知识图谱未来的发展提出了展望。
  • 链接:https://arxiv.org/abs/2002.00388
  • 是否有开源代码:无

Knowledge Graphs

  • 作者:Aidan Hogan, et al. (Universidad de Chile)
  • 发表时间:2021
  • 发表于:Arxiv
  • 标签:Knowledge Graph
  • 概述:本文是一篇关于知识图谱的全面综述,详尽地阐述了包括综述、出版物在内的已有的知识图谱相关研究工作,并且梳理了知识图谱的生命周期的相关工作。
  • 链接:https://arxiv.org/pdf/2003.02320.pdf
  • 是否有开源代码:无

Knowledge graph embedding: A survey of approaches and applications

  • 作者:Quan Wang, et al. (中科院信工所)
  • 发表时间:2017
  • 发表于:TKDE
  • 标签:Knowledge Graph, Representation Learning
  • 概述:本文聚焦于知识图谱的表示学习,全面梳理了相关的工作,首先围绕仅仅利用知识图谱本身信息的Trans系列的方法以及语义匹配的方法,然后介绍了利用额外信息的知识图谱表示学习方法,最后对于相关的应用进行了梳理与展望。
  • 链接:https://persagen.com/files/misc/Wang2017Knowledge.pdf
  • 是否有开源代码:无

A review of relational machine learning for knowledge graphs

  • 作者:Nickel, et al. (Google)
  • 发表时间:2015
  • 发表于:Proceedings of the IEEE
  • 标签:Knowledge Graph, Relational Learning
  • 概述:本文聚焦于知识图谱的关系学习,全面梳理了相关的工作,以基于统计的关系学习方法、基于隐含特征的方法、基于图特征的方法和基于Markov random fields的方法几个角度对于知识图谱关系学习的相关工作进行了梳理,并且在最后梳理了该研究领域的应用,以及进行了总结与展望。
  • 链接:https://ieeexplore.ieee.org/abstract/document/7358050
  • 是否有开源代码:无

Knowledge Graph - 相关前沿研究(#TODO)

Others

Related Datasets

其他参考资料

大规模图分析相关数据集集合参考资料:

斯坦福SNAP开源数据集集合

斯坦福SNAP开源数据集集合

Twitter开源数据集集合(Github项目)

知乎数据集(Github项目)

异质图相关数据集(Github项目)

社交知识图谱开源项目

SocialLink

  • 简介:开源的社交知识图谱与社交网络链接项目(Twitter-DBpedia),旨在将知识图谱的信息连接至对应的社交网络用户。
  • 链接:http://sociallink.futuro.media/

Tweeki

  • 简介:开源的社交知识图谱与社交网络链接项目,旨在将Twitter中的mention连接至知识图谱中的实体。
  • 链接:https://ucinlp.github.io/tweeki/

图神经网络相关学习/参考资料:

图与机器学习课程