语义计算实验室2021秋季学期讨论班（1）

一、 主题：NER中的零样本和弱监督学习

主讲人：吴佳琪

摘要:命名实体识别中的监督学习模型在一些极端情况下很难有好的表现，比如在领域迁移时遇到的数据稀少甚至没有数据的情况。这次介绍的两篇论文，一篇从实体Query角度出发，通过Query引入的实体语义层面的知识，实现zero-shot场景下的NER。另一篇则从弱标记样本的角度出发，通过少量的强标记数据和众多的弱标记数据来提升目标场景下NER的性能。

时间和地点：9月18日9:00-10:00（星期六上午9点-10点），软件学院办公楼201会议室

腾讯会议 ID：702 861 292

二、主题：预训练文本模型中存在的后门威胁

主讲人：黄钿

摘要：近年来，自然语言处理在现实社会的许多场景中得到了成功应用。由于文本任务通常需要大量的前置知识作为基础，预训练语言模型应运而生。由于数据收集和模型训练通常需要高成本，采用第三方数据集甚至发布的模型，即机器学习的服务化（MLaaS）变得愈发普遍。然而，MLaaS的便捷与普遍使用也带了隐藏的威胁。由于训练过程的不透明性，模型是否存在后门将成为模型应用的潜在威胁。本次主要讨论两种向文本模型注入后门的方法：基于句法结构规则的和基于同义词替换规则的。

时间和地点：9月18日10:00-11:00（星期六上午10点-11点），软件学院办公楼201会议室

腾讯会议 ID：702 861 292