语义计算2022秋季讨论班——文本哈希和关系抽取问题

一、 主题：文本哈希

主讲人：黄钿

摘要:传统的文本相似性计算是在原始矢量空间中进行的，可能无法用于大规模语料库，因为这些方法涉及高维空间中数值的高成本。本次讨论的是文本哈希。哈希是相似检索的一个有效方法，基于设计低维二值编码，从而为相似的文本打上相似的哈希码，并且计算哈希码之间的相似性仅需进行异或操作，效率较高。

时间和地点：10月8日9:00-10:00（星期六上午9点-10点）办公楼201

腾讯会议 ID：690-7644-3039

一、 主题：利用持续学习解决关系抽取问题

主讲人：李成

摘要:持续关系抽取的目标是从文本中抽取实体之间的关系，其中不同关系类型的样本是不断地被输入到模型当中。其主要挑战在于灾难性遗忘。针对该挑战，基于记忆网络的解决方案在自然语言处理领域有较大的突破。本次分享针对持续学习在少样本关系抽取中的具体应用，探讨如何提升模型的泛化能力。

时间和地点：10月8日10:00-11:00（星期六上午10点-11点）办公楼201

腾讯会议 ID：690-7644-3039

图文作者：李稳责任编辑：孙宇清