语义计算实验室2021秋季学期讨论班(1)

一、 主题:NER中的零样本和弱监督学习


主讲人:吴佳琪


摘要:命名实体识别中的监督学习模型在一些极端情况下很难有好的表现,比如在领域迁移时遇到的数据稀少甚至没有数据的情况。这次介绍的两篇论文,一篇从实体Query角度出发,通过Query引入的实体语义层面的知识,实现zero-shot场景下的NER。另一篇则从弱标记样本的角度出发,通过少量的强标记数据和众多的弱标记数据来提升目标场景下NER的性能。


时间和地点:9月18日9:00-10:00(星期六上午9点-10点),软件学院办公楼201会议室

                 腾讯会议 ID:702 861 292


二、主题:预训练文本模型中存在的后门威胁


主讲人:黄钿



摘要:近年来,自然语言处理在现实社会的许多场景中得到了成功应用。由于文本任务通常需要大量的前置知识作为基础,预训练语言模型应运而生。由于数据收集和模型训练通常需要高成本,采用第三方数据集甚至发布的模型,即机器学习的服务化(MLaaS)变得愈发普遍。然而,MLaaS的便捷与普遍使用也带了隐藏的威胁。由于训练过程的不透明性,模型是否存在后门将成为模型应用的潜在威胁。本次主要讨论两种向文本模型注入后门的方法:基于句法结构规则的和基于同义词替换规则的。


时间和地点:9月18日10:00-11:00(星期六上午10点-11点),软件学院办公楼201会议室

                腾讯会议 ID:702 861 292