近年来主要围绕不同场景下的迁移学习开展研究,在该方向带领博士2人,硕士10人在跨领域分类、跨语言的词向量表示和跨语言的实体对齐等方面积极开展相关研究工作。
一、迁移学习:
迁移学习旨在利用源领域知识指导目标领域问题的求解,由于能有效克服传统机器学习中需获取大量标签和模型重新训练的问题,已经成为人工智能和数据挖掘领域的重要研究方向,并被认为是继深度学习之后,下一个可能在商业中取得成功应用的热点技术之一。
多年来一直致力于不同数据场景下的迁移学习研究,主要涉及跨领域分类、跨语言向量表示学习等。以第一作者或通讯作者发表论文30余篇、参与撰写数据流分类专著1部、授权软件著作权2项,专利5项。
二、基于图的机器学习研究:
实际应用中普遍存在网络数据,如社交网络、信息网络、生物网络、知识图谱等。社交购物网络中包含用户、商品、店铺等多种类型的对象,对象之间的关系也不再只有购买,而是含有收藏、喜爱等更精细的交互。基于这些更精细的信息,可以产生更准确的知识发现结果。显然,与现有已被广泛研究的独立分布数据以及同质网络(即网络中节点或边具有相同的类型)相比,异质网络对节点的内涵表示和节点间的关系表示都进行了更深入的建模,蕴含了更丰富的结构和语义信息,从而为知识发现提供了更精准、可解释的新途径。如何挖掘这些信息对于我国经济、医学、教育等领域的发展具有重要价值。
三、知识图谱的实体对齐
知识图谱是由节点和边组成的巨型语义网,其中的结点代表实体,边代表实体间的各种语义关系,是一种全新的、更为有效、全面的表示形式,以其大规模、可解释、可推理等特点得到了广泛的关注,在搜索引擎[3]、自动问答[4]以及可解释推荐[5]等多个领域得到了应用。然而,知识图谱构建需要大量的语料库、构建过程的自动化不足、数据来源不同等原因导致知识图谱中存在数据遗漏、错误、过时和冲突等情况,因此,通过知识图谱融合提供统一的数据视图,以扩大图谱规模、提升图谱质量,已成为一个重要的研究课题。
- Learning Cross-Lingual Mappings in Imperfectly Isomorphic Embedding Spaces.:IEEE ACM Trans. Audio Speech Lang. Process.
- Learning Inter-Entity-Interaction for Few-Shot Knowledge Graph Completion.:2022 Conference on Empirical Methods in Natural Language Processing
- Independent Relation Representation With Line Graph for Cross-Lingual Entity Ali:IEEE Transaction on Knowledge and Data Engineering.
- 基于双判别器对抗模型的半监督跨语言词向量表示方法:计算机研究与发展
- Multi-component Similarity Graphs for Cross-network Node Classification:IEEE TRANSACTIONS ON ARTIFICIAL INTELLIGENCE
暂无内容
暂无内容
暂无内容