科技动态
 
我校人工智能研究团队在自监督学习研究方面取得重要进展
发布时间:2022-07-11 文章来源: [ 字号: ]

近日,我校智能信息处理研究所研究团队在人工智能领域自监督学习的理论与方法研究中取得重要进展,相关成果以《Self-constrained Spectral Clustering》为题发表在人工智能领域国际顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》(IEEE TPAMI,影响因子:24.314)。该论文通讯作者为梁吉业教授,第一作者为白亮教授,合作者为2020级博士生赵云霄。

近年来,自监督学习(SSL)已成为人工智能与机器学习的热点研究方向之一。由于它的模型能够自动从数据中学习标签,无需标注数据,众多人工智能学者和机构将其视为实现人工智能的关键。然而,已有自监督学习的有效性依赖于大规模深度网络的训练,需要高昂的计算成本和海量数据的参与训练,给自监督学习的实际应用带了严重的挑战。研究非深度网络的自监督学习模型已成为应对自学习的高额计算成本挑战的重要研究课题之一。


自约束谱聚类模型


我校智能信息处理研究所研究团队从谱聚类模型(经典的非深度无监督学习模型)出发建模,提出了自约束的谱聚类模型。模型目标是同时从无标注数据中自学习两种类型的监督信息(即“标签约束”和“成对约束”),共同指导聚类结果的搜索过程。新模型对自监督学习和聚类(两种极具代表性的无监督学习任务)进行了有机的融合,从缩小自标签与潜在类语义的差异性角度出发,有效地提升了无标注数据的分类精度。由于其优化求解不依赖于深度网络,使得学习成本被极大降低。同时,本研究从理论上解释了该模型的自学习有效性和扩展性,为大数据分析及其应用提供了理论支撑。


新模型的分类精度


研究通过大量的实验比较和分析验证了新模型的有效性。实验结果表明在部分数据上新模型已达到有监督学习模型的效果。

该研究工作得到了计算智能与中文信息处理教育部重点实验室、科技创新2030-新一代人工智能重大项目、国家优秀青年科学基金、自然科学基金联合重点基金、山西省1331工程重点学科建设计划的支持。

研究成果原文阅读链接:https://ieeexplore.ieee.org/document/9813560


首 页 |机构设置 |基地平台 |创新团队 |科研成果 |科研项目 |政策法规 |下载中心 |监督投诉