实验室简介


English Ver.-软件学院语义计算实验室 (sdu.edu.cn) 

        山东大学语义计算实验室(Semantic Computing Laboratory)隶属于山东大学软件学院,专注于大数据语义计算基础理论和关键技术研究,以及在社会计算、协同计算和认知计算等领域中的应用。近年来承担和参与了国家自然科学基金、国家863项目、国家科技支撑计划、山东省重大科技发展项目、山东省自然科学基金等十余项国家和省部级项目,在社会化大数据中的隐私保护、基于自然语言处理的认知计算、基于金融大数据的贷后风险分析等方面有多个成功应用。

学术带头人情况

        孙宇清,博士,山东大学软件学院教授,中国计算机学会协同计算专业委员会副主任,系统软件专业委员会委员,山东省电子政务专家咨询委员会成员,香港大学和美国普渡大学访问学者,山东信息通信技术研究院高层次创新人才。研究方向为语义与协同计算,近几年主持和参与了国家自然科学基金重大研究计划、国家自然科学基金、国家重点研发计划、国家科技支撑计划、国家发改委项目、山东省重点研发计划、山东省自主创新及成果转化专项、山东省自然科学基金等十余项研究课题,以及多项企业合作课题。在IEEE Transactions on Dependable and Secure Computing (TDSC)、计算机学报等国内外权威学术期刊和ICDE、SIGIR等顶级国际学术会议上发表论文80余篇,是二十多个学术期刊审稿人,十余个国际学术会议程序委员会委员,全国计算机支持的协同工作与社会计算学术会议程序委员会主席。

       联系方式:sun_yuqing@sdu.edu.cn, 88391810, 软件学院办公楼108,QQ1507047339

研究方向

自然语言推理

        对于面向海量互联网文本的推断任务,通常面临标注数据不足的问题,特别是小样本场景,深度模型的学习会变得非常困难。利用相关先验知识引导深度模型理解并学习文本中的逻辑关系,改善小样本自然语言推理任务的相关模型和技术性能。其中,如何将文本中的先验知识转化为可计算形式并融入推断过程是一项困难问题。本课题研究知识驱动的文本推断问题,包括文本知识的可计算化表征、认知驱动的知识融入及计算、智能文本推断及评估等。

结构化知识抽取

        随着计算机科学领域的迅速发展以及单位面积存储能力的增强,海量数据触手可及。如何将大量文本中的关键知识提取出来变得尤为重要,其在文本理解、智能问题回答、知识图谱构建等诸多自然语言处理任务中具有广泛的应用价值。本课题研究基于海量文本的知识抽取、命名实体识别以及关系抽取等关键问题,研发相关的算法和工具。如领域依赖的专业概念抽取工具、小样本命名实体识别策略以及开放域关系抽取方案等。

可控文本生成

        随着智能技术在生产生活各方面的广泛应用,人们愈发需求自然、智慧的人机交互界面,自然语言文本生成的重要性逐渐凸显,语言所固有的语义歧义性和表达多样性使得生成任务困难且结果难以评估。本课题研究可控的文本生成方法,如语言风格可控的文本生成,对生成文本的语义内容和表达形式提供可靠的控制;以及面向幼儿教育的文本生成等面向特定需求、特定应用的文本生成任务。文本生成作为自然语言处理中的高级任务,对模型的语义理解、语言运用能力都提出了很高的要求,探索如何利用已有知识回答问题、如何利用知识更好的指导文本生成和评估等关键技术。

面向学术网络的专业文本理解

        学术网络汇聚了多学科研究成果,包括理论、技术和应用等不同层面的论文、专利相关信息,如作者信息、研究内容、研究领域、关联关系等。如何利用学术网络辅助用户科研,促进学术成果的影响和传播,具有重要的现实意义。本课题研究专业文本理解、知识抽取、关联分析等关键问题,进行知识库构建、主题划分和语义抽取、基于语义的文本去歧;跨领域的专业概念映射关系学习和推断、论文和作者影响力预测、学术检索、个性化推荐等。

基于知识图谱的关联分析和复杂推断

        知识图谱是一种能够表达复杂关系的知识库结构,在诸多智能系统中得到成功应用。例如借助通识知识图谱辅助检索和推荐任务,能够为用户提供更强相关性的结果等。本课题研究专业知识图谱构建、基于知识图谱的复杂关系推断,以及结合知识图谱和文本等外部数据进行联合推断等关键问题。