语义计算2022秋季讨论班——文本哈希和关系抽取问题

一、 主题:文本哈希

主讲人:黄钿


摘要:传统的文本相似性计算是在原始矢量空间中进行的,可能无法用于大规模语料库,因为这些方法涉及高维空间中数值的高成本。本次讨论的是文本哈希。哈希是相似检索的一个有效方法,基于设计低维二值编码,从而为相似的文本打上相似的哈希码,并且计算哈希码之间的相似性仅需进行异或操作,效率较高。


时间和地点:10月8日9:00-10:00(星期六上午9点-10点)办公楼201

腾讯会议 ID:690-7644-3039


一、 主题:利用持续学习解决关系抽取问题

主讲人:李成


摘要:持续关系抽取的目标是从文本中抽取实体之间的关系,其中不同关系类型的样本是不断地被输入到模型当中。其主要挑战在于灾难性遗忘。针对该挑战,基于记忆网络的解决方案在自然语言处理领域有较大的突破。本次分享针对持续学习在少样本关系抽取中的具体应用,探讨如何提升模型的泛化能力


时间和地点:10月8日10:00-11:00(星期六上午10点-11点)办公楼201

腾讯会议 ID:690-7644-3039

图文作者:李稳    责任编辑:孙宇清