分类: 系列活动

语义计算2022秋季讨论班——攻击样本生成与检测问题和共情...

一、 主题:攻击样本生成与检测主讲人:刘天元摘要:自然语言处理中神经网络方法的可靠性和安全性一直有待验证,攻击样本生成是一个较为常见的手段。本次讲述两篇文章都从词汇级别出发,分别进行攻击样本的生成和检测。时间和地点:10月29日9:00-10:00(星期六上午9点-10点)办公楼201腾讯会议 ID:690-7644-3039一、 主题:共情对话和面向机器翻译的数据增强方法主讲人:王舰摘要:第一个工作面向共情对话,引入了ConceptNet构造...

语义计算2022秋季讨论班——可控文本生成

一、 主题:可控文本生成主讲人:韩雨辰摘要:本次介绍的两篇工作都是与可控文本生成相关的。第一篇工作通过将外部常识知识融入主题到文章生成任务,提高了生成文本的新鲜度和多样性;第二篇工作通过设计特定的格式控制符号和对注意力机制的改进,实现格式严格可控的文本生成。时间和地点:10月22日10:00-11:00(星期六上午10点-11点)办公楼201腾讯会议 ID:690-7644-3039图文作者:李稳    责任编辑:孙宇

语义计算2022秋季讨论班——文本生成问题和少样本学习的解...

一、 主题:文本生成主讲人:郑璐阳摘要:本次讨论班主要介绍的是文本生成相关的两个任务:可控文本生成和摘要生成。第一篇论文提出了一个属性对齐模型,用于在无需微调参数的不可控预训练语言模型上完成可控文本生成。第二篇论文则是提出了一个基于语义块的由粗到细的方面感知的两阶段框架,来解决无监督的抽取式摘要的问题。这两篇文章都会为特殊条件下的文本生成带来启发。时间和地点:10月15日9:00-10:00(星期六上午9点-10...

语义计算2022秋季讨论班——文本哈希和关系抽取问题

一、 主题:文本哈希主讲人:黄钿摘要:传统的文本相似性计算是在原始矢量空间中进行的,可能无法用于大规模语料库,因为这些方法涉及高维空间中数值的高成本。本次讨论的是文本哈希。哈希是相似检索的一个有效方法,基于设计低维二值编码,从而为相似的文本打上相似的哈希码,并且计算哈希码之间的相似性仅需进行异或操作,效率较高。时间和地点:10月8日9:00-10:00(星期六上午9点-10点)办公楼201腾讯会议 ID:690-7644-3039...

语义计算2022秋季讨论班——主题模型和关键词生成方法

一、 主题:主题模型主讲人:李稳摘要:本次介绍的两篇工作都是和主题模型相关的。第一篇工作提出了一个向神经主题模型融入外部知识的新策略,通过采用预训练加微调的形式提升了模型性能;第二篇工作提出了一个上下文相关的词组表示和主题挖掘的无监督对比学习框架,可以生成高质量的词组嵌入表示,并针对主题挖掘进行特定主题的微调。时间和地点:9月24日9:00-10:00(星期六上午9点-10点)线上 腾讯会议 ID:690-7644-3039一、 ...