近日,山东大学-南洋理工大学人工智能国际联合研究院(C-FAIR)余国先教授团队在可信人工智能领域取得系列进展,多项研究成果在IEEE Transactions on Knowledge and Data Engineering(TKDE)、IEEE Transactions on Dependable and Secure Computing(TDSC)、ACM Transactions on Information Systems (TOIS)、KDD 2025、IJCAI 2025、计算机学报和中国科学—信息科学发表(接收),山东大学均为第一作者和通讯作者单位。科研成果如下:
1. MultiCFL
多维度因果公平框架。本成果“Multi-dimensional Causality Fairness Learning”被数据挖掘国际著名期刊IEEE TKDE接收。文章第一作者为山东大学博士研究生苏聪,通讯作者为余国先。

该研究提出多维度歧视效应分析方法,同时建模个体维度和宏观维度的交叉歧视效应;构建因果链式变分推理模型,捕获未观测到的潜在混淆因子并消除数据中的多维度歧视性效应,突破传统个体维度分析的局限性,能够为政策制定者和企业推进落实公平性、负责任的人工智能提供技术支撑,避免多维交叉歧视引发的伦理风险。
2. Sophon
Sophon: 基于双重信任机制的拜占庭鲁棒联邦学习。本成果“Sophon: Byzantine-robust Federated Learning via Dual Trust Mechanism” 被人工智能安全领域著名期刊TDSC接收。文章第一作者为山东大学硕士研究生桂孝强,通讯作者为余国先。

该研究为服务器归一化客户端梯度,并结合一致性与多样性双重信任得分为梯度分配聚合权重,有效抵御了异质数据场景下的拜占庭攻击,确保联邦训练的模型性能不被破坏,为联邦学习提供了安全可靠的训练方案。
3. MultiVerse
联邦推荐中的交互隐私漏洞及其无损防御。本成果“Interaction Privacy Vulnerability in Federated Recommendation and Lossless Countermeasure”被人工智能领域著名期刊TOIS接收。文章第一作者为山东大学硕士研究生桂孝强,通讯作者为余国先。

该研究首先揭示了联邦推荐中的用户交互隐私泄露风险,进而提出了一种隐私保护方法MultiVerse,通过在本地训练时引入伪交互项,并结合精心设计的训练、优化、精炼和去噪四步策略,在确保无损模型性能的同时显著降低了交互隐私泄露风险。为联邦推荐中的用户交互隐私保护提供了安全可靠的解决方案。
4. FedPANO
基于参数解耦与节点增强的个性化联邦学习方法。本成果“Personalized federated few-shot node classification”由信息科学领域知名期刊Science China Information Sciences接收,文章第一作者为山东大学博士研究生赵云峰,通讯作者为余国先。

该工作研究了一个实际且具有挑战性的个性化联邦学习问题,客户端具有异构任务,但训练节点稀少。提出的基于参数解耦与节点增强的联邦学习方法(FedPANO)首先将本地模型分离为图神经网络(GNN)和分类器,用以处理客户端之间的任务差异。GNN通过联邦学习训练,以捕捉客户端之间网络节点的共享知识,而分类器则为每个客户端量身定制并单独训练。此外,FedPANO还引入了一个通用分类器,以鼓励GNN对共享信息的学习。接着,FedPANO进一步提出了节点生成器及其本地和协作训练策略,以应对客户端节点稀缺的问题。
5. CausalSME
面向多环境数据分布偏移的因果发现。本成果“Causal Discovery from Shifted Multiple Environments”被国际著名数据挖掘会议KDD 2025接收。文章第一作者为山东大学博士研究生杨德智,通讯作者为王峻。

该算法在环境信息未知的情况下,自动识别样本所属的环境和每个环境下的未观测因果效应,从具有未观测分布偏移的混合多环境数据中学习因果有向无环图。算法还从理论上证明了存在未观测分布偏移的混合多环境中因果结构的可识别性,并在合成和真实数据集的因果关系发现任务中表现出优秀的准确性和鲁棒性。该研究得到国家重点研发计划青年科学家项目、国家自然科学基金重点项目与面上项目的资助和支持。
6. ASGM
解释纠偏框架:一种基于标准解释的归因分数生成方法。本成果“Explanation Rectification Framework: An Attribution Score Generation Method Based on Standard Explanations”被国内顶级期刊计算机学报接收。文章第一作者为山东大学硕士研究生邢钟毓,通讯作者为余国先。

该研究针对模型可解释性中归因分数因随机因素等导致不一致的关键挑战,首先从理论上揭示了解释不一致与模型不确定性的内在联系。据此提出了一个归因分数生成纠偏框架ASGM,该框架从少量抽样模型中高效生成稳定且能代表罗生门效应集或规格不足集的归因分数解释,显著提升了归因解释的效率和稳定性。该研究得到国家重点研发计划项目、国家自然科学基金重点项目和面上项目的资助和支持。
7. CMClusts
对齐用户兴趣的对比多聚类:通过数据增强和对比学习捕捉用户感兴趣的聚类,实现用户兴趣导向的高质量、可解释、多样化的聚类模式挖掘。本成果“Aligning Contrastive Multiple Clusterings with User Interests”被人工智能领域国际著名会议IJCAI接收。文章的共同第一作者为山东大学硕士研究生张珊、博士研究生任良瑞,通讯作者为余国先。

该研究能根据用户提供的兴趣引导生成多样化、低冗余的聚类。基于用户兴趣生成多角度的数据增强,并利用聚类级对比学习捕捉用户感兴趣的聚类特征,以提高聚类质量和可解释性。另外,聚类级对比学习将不同的聚类类型作为负样本,增大其距离实现多样性聚类。该研究得到国家重点研发计划青年科学家项目、国家自然科学基金重点项目与面上项目的资助和支持。
8. I2MVC
基于知识蒸馏的无插补不完整多视图聚类。本成果“Imputation-free Incomplete Multi-view Clustering via Knowledge Distillation”被人工智能领域顶级国际会议IJCAI接收。论文第一作者为山东大学博士研究生吴本钰,通讯作者为山东大学杜威和余国先。

该研究针对不完整多视图数据聚类中传统插补方法存在的误差累积和效率问题,团队提出无插补不完整多视图聚类模型I2MVC,通过任务分解与知识蒸馏机制,利用完整视图聚类信息指导不完全多视图数据的有效聚类,实现在视图缺失场景下的稳定性和高效性。该研究得到国家重点研发计划项目、国家自然科学基金重点项目和面上项目的资助和支持。
IEEE TKDE、IEEE TDSC为IEEE旗下人工智能领域顶级期刊,是中国计算机学会推荐的A类学术期刊;ACM TOIS为ACM旗下大数据领域顶级期刊,是中国计算机学会推荐的A类学术期刊;计算机学报为中国计算机学会主办的国内顶级期刊,是中国计算机学会推荐的A类中文学术期刊;中国科学-信息科学(英文版)是由中国科学院、国家自然科学基金委员会主办的信息科学领域知名期刊,是中国计算机学会推荐的A类中文学术期刊;KDD是数据挖掘领域的顶级学术会议,由 ACM 的数据挖掘及知识发现专委会(SIGKDD)主办,是中国计算机学会推荐的A类学术会议;IJCAI是人工智能领域最具影响力的国际会议之一,也是中国计算机学会推荐的A类学术会议。
余国先教授是山东大学杰出中青年学者、齐鲁青年学者、小米青年学者,长期从事人工智能理论方法及其在生物医学信息分析中的应用研究,聚焦多模态、公平性、安全性和可解释性等可信人工智能核心方向,相关成果在IEEE TKDE/TDSC/TNNLS、ACM TOIS/TKDD、NAR、KDD、AAAI、IJCAI等主流期刊或会议发表,主持国家级青年人才计划项目、国家重点研发青年科学家项目、国家自然科学基金、山东省杰青基金等项目。