语义计算2022秋季讨论班——文本哈希和关系抽取问题

一、 主题:文本哈希主讲人:黄钿摘要:传统的文本相似性计算是在原始矢量空间中进行的,可能无法用于大规模语料库,因为这些方法涉及高维空间中数值的高成本。本次讨论的是文本哈希。哈希是相似检索的一个有效方法,基于设计低维二值编码,从而为相似的文本打上相似的哈希码,并且计算哈希码之间的相似性仅需进行异或操作,效率较高。时间和地点:10月8日9:00-10:00(星期六上午9点-10点)办公楼201腾讯会议 ID:690-7644-3039...

语义计算2022秋季讨论班——主题模型和关键词生成方法

一、 主题:主题模型主讲人:李稳摘要:本次介绍的两篇工作都是和主题模型相关的。第一篇工作提出了一个向神经主题模型融入外部知识的新策略,通过采用预训练加微调的形式提升了模型性能;第二篇工作提出了一个上下文相关的词组表示和主题挖掘的无监督对比学习框架,可以生成高质量的词组嵌入表示,并针对主题挖掘进行特定主题的微调。时间和地点:9月24日9:00-10:00(星期六上午9点-10点)线上 腾讯会议 ID:690-7644-3039一、 ...

欢送2022届毕业生

时光飞逝,又到了一年一度的毕业季,毕业生们三年的研究生生活即将圆满画上句号。在这个重要的时刻,为了庆祝实验室2022届硕士毕业生宁祥东、察胜男,以及本科毕业生李成、吴慧倩和陈阳顺利毕业,5月26日晚实验室全体成员欢聚一堂,共同度过了快乐的毕业晚餐。大家的相聚让这个毕业季充满欢喜,让欢乐继续伴随我们走过最后的时光!毕业晚餐上,欢声笑语连成一片,每个人的脸上都洋溢着喜悦的笑容。同学们围坐在一起,听毕业生们...

语义计算实验室2022春季学期讨论班(12)

一、 主题:自然语言处理任务中的逻辑规则学习主讲人:郑威摘要:学习逻辑规则可以从显式的符号结构中发现和表示人类可理解、可检验的的知识。LogiRE模型将逻辑规则生成及推理应用于文档级关系抽取任务,利用最大期望算法(EM)进行整体优化,其中逻辑规则被视为隐藏变量。该篇文章通过向关系提取框架中引入逻辑规则作为关系和实体之间的交互,具有更好的可解释性。时间和地点:5月29日9:00-10:00(星期日上午9点-10点)办公楼20...

语义计算实验室2022春季学期讨论班(11)

一、 主题:中文词内结构的深入研究主讲人:刘天元摘要:中文的词汇通常由多个汉字构成,与英文字母不同,汉字通常承担了更丰富的语义功能。本文研究汉字在组成中文词汇时,词内汉字的语义和结构功能,为更好的解决中文的词汇语义建模提供了新的思路、方法和工具。时间和地点:5月21日9:00-10:00(星期六上午9点-10点)办公楼201    腾讯会议 ID:522-7068-6445二、主题:图神经网络可解释性主讲人:夏天宇摘要:图神经网络由于...