一、 主题:文本生成主讲人:郑璐阳摘要:本次讨论班主要介绍的是文本生成相关的两个任务:可控文本生成和摘要生成。第一篇论文提出了一个属性对齐模型,用于在无需微调参数的不可控预训练语言模型上完成可控文本生成。第二篇论文则是提出了一个基于语义块的由粗到细的方面感知的两阶段框架,来解决无监督的抽取式摘要的问题。这两篇文章都会为特殊条件下的文本生成带来启发。时间和地点:10月15日9:00-10:00(星期六上午9点-10...
一、 主题:文本哈希主讲人:黄钿摘要:传统的文本相似性计算是在原始矢量空间中进行的,可能无法用于大规模语料库,因为这些方法涉及高维空间中数值的高成本。本次讨论的是文本哈希。哈希是相似检索的一个有效方法,基于设计低维二值编码,从而为相似的文本打上相似的哈希码,并且计算哈希码之间的相似性仅需进行异或操作,效率较高。时间和地点:10月8日9:00-10:00(星期六上午9点-10点)办公楼201腾讯会议 ID:690-7644-3039...
一、 主题:主题模型主讲人:李稳摘要:本次介绍的两篇工作都是和主题模型相关的。第一篇工作提出了一个向神经主题模型融入外部知识的新策略,通过采用预训练加微调的形式提升了模型性能;第二篇工作提出了一个上下文相关的词组表示和主题挖掘的无监督对比学习框架,可以生成高质量的词组嵌入表示,并针对主题挖掘进行特定主题的微调。时间和地点:9月24日9:00-10:00(星期六上午9点-10点)线上 腾讯会议 ID:690-7644-3039一、 ...
时光飞逝,又到了一年一度的毕业季,毕业生们三年的研究生生活即将圆满画上句号。在这个重要的时刻,为了庆祝实验室2022届硕士毕业生宁祥东、察胜男,以及本科毕业生李成、吴慧倩和陈阳顺利毕业,5月26日晚实验室全体成员欢聚一堂,共同度过了快乐的毕业晚餐。大家的相聚让这个毕业季充满欢喜,让欢乐继续伴随我们走过最后的时光!毕业晚餐上,欢声笑语连成一片,每个人的脸上都洋溢着喜悦的笑容。同学们围坐在一起,听毕业生们...
一、 主题:自然语言处理任务中的逻辑规则学习主讲人:郑威摘要:学习逻辑规则可以从显式的符号结构中发现和表示人类可理解、可检验的的知识。LogiRE模型将逻辑规则生成及推理应用于文档级关系抽取任务,利用最大期望算法(EM)进行整体优化,其中逻辑规则被视为隐藏变量。该篇文章通过向关系提取框架中引入逻辑规则作为关系和实体之间的交互,具有更好的可解释性。时间和地点:5月29日9:00-10:00(星期日上午9点-10点)办公楼20...