一、 主题:中文词内结构的深入研究主讲人:刘天元摘要:中文的词汇通常由多个汉字构成,与英文字母不同,汉字通常承担了更丰富的语义功能。本文研究汉字在组成中文词汇时,词内汉字的语义和结构功能,为更好的解决中文的词汇语义建模提供了新的思路、方法和工具。时间和地点:5月21日9:00-10:00(星期六上午9点-10点)办公楼201 腾讯会议 ID:522-7068-6445二、主题:图神经网络可解释性主讲人:夏天宇摘要:图神经网络由于...
一、 主题:图到文本的生成和词表学习主讲人:王舰摘要:预训练模型在小标注量的数据的文本生成任务上展现了优势。但是,对于结构化数据的文本生成,如知识图谱到文本的生成,无法有效的处理,本文探讨借助预训练模型进行图到文本的方法,2,词表的构建是NLP的基础问题,本文探讨词表的构建,首先从熵的角度建立词表的评估指标,随后将词表的学习转为最优传输问题,得到较好的词表。时间和地点:5月14日9:00-10:00(星期六上午9点...
一、 主题:学术信息抽取主讲人:李稳摘要:第一篇工作基于NLP领域的论文集合进行了知识图谱的构建,定义了三种实体和四种关系,描述了NLP领域的核心概念之间的关系,非常具有研究价值。第二篇工作的任务目标是关键词抽取,在以往工作中,关键词抽取通常包含两个步骤,首先抽取候选关键词,然后对其进行排序选出最终的关键词集合,本文作者通过多任务训练的方式,从三个角度对候选关键词的重要性进行了衡量,实验结果表明了本文...
一、 主题:few-shot NER主讲人:吴佳琪摘要:本次分享的两篇论文从不同的角度解决few-sho NER问题。一篇文章从实体概念描述生成角度出发,在少样本环境下,建立新类型和实体概念描述的映射关系,从而提高NER的性能。另一篇利用对比学习,从高斯嵌入的角度入手,学习更通用的实体特征表示,有助于few-shot场景下的NER时间和地点:4月23日9:00-10:00(星期六上午9点-10点) 腾讯会议 ID:522-7068-6445二、主题:引入情景化编码...
一、 主题:文本分类主讲人:郑威摘要:本次分享的两篇文章关于文本分类。第一篇文章从特征投影的角度来改进文本的表示学习,通过将类别相关特征投影到公共特征的正交空间,来使得前者更具分类的辨别力。第二篇关注基于少量用户提供的种子词的弱监督文本分类,其利用上下文化表示技术来解决种子词的解释问题。时间和地点:4月16日9:00-10:00(星期六上午9点-10点) 腾讯会议 ID:522-7068-6445二、主题:具有不受限制的多跳推...