一、 主题:主题模型主讲人:李稳摘要:本次介绍的两篇工作都是和主题模型相关的。第一篇工作提出了一个向神经主题模型融入外部知识的新策略,通过采用预训练加微调的形式提升了模型性能;第二篇工作提出了一个上下文相关的词组表示和主题挖掘的无监督对比学习框架,可以生成高质量的词组嵌入表示,并针对主题挖掘进行特定主题的微调。时间和地点:9月24日9:00-10:00(星期六上午9点-10点)线上 腾讯会议 ID:690-7644-3039一、 ...
时光飞逝,又到了一年一度的毕业季,毕业生们三年的研究生生活即将圆满画上句号。在这个重要的时刻,为了庆祝实验室2022届硕士毕业生宁祥东、察胜男,以及本科毕业生李成、吴慧倩和陈阳顺利毕业,5月26日晚实验室全体成员欢聚一堂,共同度过了快乐的毕业晚餐。大家的相聚让这个毕业季充满欢喜,让欢乐继续伴随我们走过最后的时光!毕业晚餐上,欢声笑语连成一片,每个人的脸上都洋溢着喜悦的笑容。同学们围坐在一起,听毕业生们...
一、 主题:自然语言处理任务中的逻辑规则学习主讲人:郑威摘要:学习逻辑规则可以从显式的符号结构中发现和表示人类可理解、可检验的的知识。LogiRE模型将逻辑规则生成及推理应用于文档级关系抽取任务,利用最大期望算法(EM)进行整体优化,其中逻辑规则被视为隐藏变量。该篇文章通过向关系提取框架中引入逻辑规则作为关系和实体之间的交互,具有更好的可解释性。时间和地点:5月29日9:00-10:00(星期日上午9点-10点)办公楼20...
一、 主题:中文词内结构的深入研究主讲人:刘天元摘要:中文的词汇通常由多个汉字构成,与英文字母不同,汉字通常承担了更丰富的语义功能。本文研究汉字在组成中文词汇时,词内汉字的语义和结构功能,为更好的解决中文的词汇语义建模提供了新的思路、方法和工具。时间和地点:5月21日9:00-10:00(星期六上午9点-10点)办公楼201 腾讯会议 ID:522-7068-6445二、主题:图神经网络可解释性主讲人:夏天宇摘要:图神经网络由于...
一、 主题:图到文本的生成和词表学习主讲人:王舰摘要:预训练模型在小标注量的数据的文本生成任务上展现了优势。但是,对于结构化数据的文本生成,如知识图谱到文本的生成,无法有效的处理,本文探讨借助预训练模型进行图到文本的方法,2,词表的构建是NLP的基础问题,本文探讨词表的构建,首先从熵的角度建立词表的评估指标,随后将词表的学习转为最优传输问题,得到较好的词表。时间和地点:5月14日9:00-10:00(星期六上午9点...