分类: 学术动态

祝贺实验室刘天元博士的论文被人工智能领域旗舰会议AAAI 20...

Unsupervised Paraphrasing under Syntax Knowledge

       摘要——在文本改写生成任务中,句法的合理性是一个重要的考量。多数现有文本改写方法在使用隐含向量的方式控制句法和语义,无法保证结果的句法合理性。本文中我们探究词汇语用时的句法结构模式形成词汇组合知识,并将之整合到文本改写生成过程中,以显式的方式控制生成内容的句法。该组合知识通过建模词汇间的依存句法关系,形成词汇级句法合理性的估计函数。在文本改写过程中,通过一个层次化的句法结构损失函数,来量化所生成的句子是否满足给定的句法结构,以确保整句级别的句法合理性。以上方式使得生成过程能够正确考虑...

语义计算实验室2022春季学期讨论班(12)

一、 主题:自然语言处理任务中的逻辑规则学习主讲人:郑威摘要:学习逻辑规则可以从显式的符号结构中发现和表示人类可理解、可检验的的知识。LogiRE模型将逻辑规则生成及推理应用于文档级关系抽取任务,利用最大期望算法(EM)进行整体优化,其中逻辑规则被视为隐藏变量。该篇文章通过向关系提取框架中引入逻辑规则作为关系和实体之间的交互,具有更好的可解释性。时间和地点:5月29日9:00-10:00(星期日上午9点-10点)办公楼20...

语义计算实验室2022春季学期讨论班(11)

一、 主题:中文词内结构的深入研究主讲人:刘天元摘要:中文的词汇通常由多个汉字构成,与英文字母不同,汉字通常承担了更丰富的语义功能。本文研究汉字在组成中文词汇时,词内汉字的语义和结构功能,为更好的解决中文的词汇语义建模提供了新的思路、方法和工具。时间和地点:5月21日9:00-10:00(星期六上午9点-10点)办公楼201    腾讯会议 ID:522-7068-6445二、主题:图神经网络可解释性主讲人:夏天宇摘要:图神经网络由于...

语义计算实验室2022春季学期讨论班(10)

一、 主题:图到文本的生成和词表学习主讲人:王舰摘要:预训练模型在小标注量的数据的文本生成任务上展现了优势。但是,对于结构化数据的文本生成,如知识图谱到文本的生成,无法有效的处理,本文探讨借助预训练模型进行图到文本的方法,2,词表的构建是NLP的基础问题,本文探讨词表的构建,首先从熵的角度建立词表的评估指标,随后将词表的学习转为最优传输问题,得到较好的词表。时间和地点:5月14日9:00-10:00(星期六上午9点...

语义计算实验室2022春季学期讨论班(9)

一、 主题:学术信息抽取主讲人:李稳摘要:第一篇工作基于NLP领域的论文集合进行了知识图谱的构建,定义了三种实体和四种关系,描述了NLP领域的核心概念之间的关系,非常具有研究价值。第二篇工作的任务目标是关键词抽取,在以往工作中,关键词抽取通常包含两个步骤,首先抽取候选关键词,然后对其进行排序选出最终的关键词集合,本文作者通过多任务训练的方式,从三个角度对候选关键词的重要性进行了衡量,实验结果表明了本文...