语义计算实验室2020秋季学期讨论班（10）

一、 主题：语言表示中的常识与偏见

主讲人：刘天元

摘要：词向量/预训练语言模型等方法为NLP任务提供了基础的特征表示。本周讲解的两篇文章，一篇主要探讨这些基本表示能否捕获语言中的常识性信息并据此进行推断。另一篇探讨了这些表示又捕获了怎样的偏见，以及如何避免。

时间和地点：12月5日9:00-10:30（星期六上午9点-10点30分），软件学院办公楼201会议室

二、 主题：文本生成

主讲人：王舰

摘要：序列到序列模型在当前文本生成任务中得到广泛应用，并且取得了比较好的效果，但是，存在几个问题：需要大量的训练数据；生成的文本中存在和输入文本无关的词或句子(幻觉)；序列化输出，生成速度较慢。针对上述三个问题，文章提出一种新的文本生成方法，通过预测编辑操作来标记单词生成输出。该方法在较小训练数据的情况下，取得了较好的生成效果，并且生成文本的速度更快。

时间和地点：12月5日10:30-12:00（星期六上午10点30分-12点），软件学院办公楼201会议室

三、 主题：Question Answering

主讲人：吴佳琪

摘要：本次讨论班将介绍自然语言处理中的一个重要子任务---Question Answering。通过本次讨论班的学习，你将知道QA中常用的数据集及其形式，了解并分析QA中的经典模型和常用技巧。

时间和地点：12月5日13:30-16:00（星期六下午1点30分-4点），软件学院办公楼201会议室

四、 主题：实践方法论与部分深度学习应用介绍

主讲人：侯庆锐

摘要：要成功地使用深度学习技术，机器学习系统的开发者需要掌握实践方法论——即一系列正确使用深度学习算法的方法。本节课将对深度学习领域的实践方法论进行讲解。此外，本节课将对在自然语言处理等领域的典型机器学习应用进行讲解。

时间和地点：12月8日13:30-16:00（星期二下午1点30分-4点），软件学院办公楼201会议室

腾讯会议 ID：616 270 493