语义计算实验室2022春季学期讨论班(10)

一、 主题:图到文本的生成和词表学习主讲人:王舰摘要:预训练模型在小标注量的数据的文本生成任务上展现了优势。但是,对于结构化数据的文本生成,如知识图谱到文本的生成,无法有效的处理,本文探讨借助预训练模型进行图到文本的方法,2,词表的构建是NLP的基础问题,本文探讨词表的构建,首先从熵的角度建立词表的评估指标,随后将词表的学习转为最优传输问题,得到较好的词表。时间和地点:5月14日9:00-10:00(星期六上午9点...

语义计算实验室2022春季学期讨论班(9)

一、 主题:学术信息抽取主讲人:李稳摘要:第一篇工作基于NLP领域的论文集合进行了知识图谱的构建,定义了三种实体和四种关系,描述了NLP领域的核心概念之间的关系,非常具有研究价值。第二篇工作的任务目标是关键词抽取,在以往工作中,关键词抽取通常包含两个步骤,首先抽取候选关键词,然后对其进行排序选出最终的关键词集合,本文作者通过多任务训练的方式,从三个角度对候选关键词的重要性进行了衡量,实验结果表明了本文...

语义计算实验室2022春季学期讨论班(8)

一、 主题:few-shot NER主讲人:吴佳琪摘要:本次分享的两篇论文从不同的角度解决few-sho NER问题。一篇文章从实体概念描述生成角度出发,在少样本环境下,建立新类型和实体概念描述的映射关系,从而提高NER的性能。另一篇利用对比学习,从高斯嵌入的角度入手,学习更通用的实体特征表示,有助于few-shot场景下的NER时间和地点:4月23日9:00-10:00(星期六上午9点-10点)  腾讯会议 ID:522-7068-6445二、主题:引入情景化编码...

语义计算实验室2022春季学期讨论班(7)

一、 主题:文本分类主讲人:郑威摘要:本次分享的两篇文章关于文本分类。第一篇文章从特征投影的角度来改进文本的表示学习,通过将类别相关特征投影到公共特征的正交空间,来使得前者更具分类的辨别力。第二篇关注基于少量用户提供的种子词的弱监督文本分类,其利用上下文化表示技术来解决种子词的解释问题。时间和地点:4月16日9:00-10:00(星期六上午9点-10点)   腾讯会议 ID:522-7068-6445二、主题:具有不受限制的多跳推...

语义计算实验室2022春季学期讨论班(6)

一、 主题:短答自动评阅与句子语义匹配主讲人:夏天宇摘要:第一篇文章的任务是自动短答评阅,是评估学生对客观问题的简短答案的一项任务。本文提出一个语义特征转换关系网络有效的解决此任务。第二篇文章关注于句子语义匹配任务,提出了一种关系学习网络,引入了一个自监督关系分类任务来指导模型更好地考虑关系。同时,利用三重损失来区分更细粒度的类内关系和类间关系。时间和地点:4月9日9:00-10:00(星期六上午9点-10点) ...