近日,数据科学与工程领域国际期刊Data Science and Engineering(简称 DSE)公布了最新的论文接收结果,山东大学——南洋理工大学人工智能国际联合研究院(C-FAIR)研究成果“Contrastive Learning with Growing Generated Representations for Inductive Knowledge Graph Embedding”被期刊接收发表。该论文由山东大学作为第一单位完成,C-FAIR李倩助理研究员为第一作者,崔立真教授为通讯作者。
该工作面向归纳式知识图谱表示学习这一具有动态演化特征的关键问题,聚焦在源知识图谱与目标知识图谱共享关系模式约束下,模型对未见实体的泛化能力。相较于传统的传导式设置,归纳式知识图谱表示学习要求模型从源图中抽取稳定的关系模式,并迁移至目标图中的新实体,因而面临更高的迁移难度。尽管现有方法在性能上取得了一定提升,但仍受到以下关键瓶颈的制约:其一,数据稀疏性限制了关系模式的充分挖掘;其二,隐式迁移机制难以实现源图与目标图之间的有效知识泛化;其三,缺乏系统性的扩展性分析,使得模型容量对归纳迁移能力的影响尚不清晰。

针对上述问题,本文提出了一种基于元知识图谱的变分对比学习框架VMCL。具体而言,一方面,VMCL通过引入图结构引导的变分自编码器,并结合对比学习机制,在元知识图谱空间中生成多样化表示,有效缓解了稀疏性与隐式迁移带来的限制;另一方面,VMCL从表示维度、元知识图谱数量以及生成表示数量三个关键因素出发,对VMCL进行了系统性的扩展性研究,深入分析模型容量对归纳能力的影响。大量实验结果表明,VMCL在多个基准数据集上均优于现有先进方法,并随着模型容量的提升持续获得性能增益,充分验证了所提出方法在表示能力与归纳泛化性能上的综合优势。
Data Science and Engineering 是数据库领域的国际顶级期刊,致力于发表数据科学方向的前沿研究成果,在全球学术界与工业界均享有高度声誉,并被中国科学院分区评定为一区期刊。
本次论文被Data Science and Engineering接收,充分体现了C-FAIR在知识图谱表示学习、图神经网络与图数据管理领域的持续创新能力,也标志着团队在归纳式知识图谱表示学习方向的研究工作获得了国际同行的高度认可。