分类: 学术动态

语义计算实验室2022春季学期讨论班(5)

一、 主题:融入依存句法信息的预训练语言模型主讲人:刘天元摘要:依存句法分析在挖掘和表示语言中词汇间的语义关系时具有简洁、具体的特点和优势。现有的预训练语言模型主要基于文本序列的建模分析。本次讨论的两篇文章,探讨将依存句法树融入预训练语言模型的方法,并对句法信息融入后对下游任务的提升进行了探究。时间和地点:4月2日9:00-10:00(星期六上午9点-10点)     腾讯会议 ID:522-7068-6445二、主题:融入外部知识...

语义计算实验室2022春季学期讨论班(4)

一、 主题:提示学习和偏见消解主讲人:王舰摘要:第一篇文章关注于提示学习方法,针对目前人工设计提示语不一定最优且难以优化的问题,提出使用连续向量表示提示语,从而能够快速优化。第二篇文章描述了测量 GPT-2 生成中政治偏见的指标,并提出了一个强化学习 (RL) 框架来减轻生成文本中的政治偏见。整个过程无需访问训练数据或需要重新训练模型。时间和地点:3月26日9:00-10:00(星期六上午9点-10点),软件学院实验楼105会议...

祝贺实验室谢翌博士的论文被国际数据库顶级会议ICDE 2022录...

Subspace Embedding Based New Paper Recommendation

摘要——由于每年都有大量的学术论文发表,因此能够推荐高质量的论文是至关重要的。论文评价的典型方法是利用文献信息,但这并不适用于论文。针对这一缺陷,本文从一个新颖的视角来分析一篇论文与其他论文的内容差异与其创新之处。由于创新往往具有特定领域的特征和形式,我们引入了子空间的概念来描述论文内容中公认的方面,即背景、方法和结果。通过形式化一组专家规则来标注论文之间的差异,并在此基础上提出了一个孪生网络来学习论文在不同子空间中的嵌入情况。一系列的实证研究表明,在这些子空间中,论文影响力与其差异之间存在...

语义计算实验室2022春季学期讨论班(3)

一、 主题:关键词抽取主讲人:李稳摘要:这次介绍的两篇文章都是和关键词抽取相关的。第一篇分析了基于统计的和基于图的关键词抽取方法的特点,并发现了一些有趣的结论,并对后续科研人员方法的选择和使用提出了建议。第二篇针对的是学术概念抽取任务,提出了一个简单但有效的无监督方法,目标是自动提取学术文献中的学术概念。时间和地点:3月19日9:00-10:00(星期六上午9点-10点),软件学院办公楼201会议室       腾讯会议 I...

语义计算实验室2022春季学期讨论班(2)

一、 主题:少样本命名实体识别主讲人:吴佳琪摘要:随着预训练语言模型的提出,命名实体识别模型在充足的数据量情况下,具有很好的性能和鲁棒性。但是在现实的应用场景下,构建NER系统仍然是一项劳动密集型、耗时的任务,通常只有非常少量的标记数据可用于新领域,所以如何使得模型在少样本环境下具有良好的鲁棒性是一个具有挑战性的问题。时间和地点:3月12日9:00-10:00(星期六上午9点-10点),软件学院办公楼201会议室      ...