语义计算实验室2021春季学期讨论班(9)
一、 主题:文本生成
主讲人:王舰
摘要:预训练模型在不同类型的语言模型任务上进行训练,通常应用于文本理解型的任务而非生成型任务。将预训练模型应用于文本生成领域是目前的一个热点。本次讲的文章内容包括三个方面:预训练模型和文本生成任务的结合;一种有效利用预训练模型知识的方式;自回归生成文本时提升模型预测能力的方法。
时间和地点:6月5日9:00-10:00(星期六上午9点-10点),软件学院办公楼201会议室
腾讯会议 ID:173 111 223
二、 主题:一种基于对比学习框架的句嵌入方法
主讲人:杨涛
摘要:早期的句子嵌入方法基于分布式假设学习句子嵌入,近些年的预训练语言模型如BERT等也可以提供句子的嵌入表示,但是预训练语言模型的嵌入空间是各项异性的,也就是说所有嵌入向量的相似度都很高,不适合文本语义相似性任务。无监督SimCSE模型使用dropout mask策略进行数据增强获取正样本对,基于对比学习方法训练句子嵌入。有监督SimCSE模型基于人工标注的NLI数据进行对比学习训练句嵌入。以对比学习框架训练得到的嵌入空间趋于各向同性,在语义文本相似性任务上大幅超越之前的SOTA。
时间和地点:6月5日10:00-11:00(星期六上午10点-11点),软件学院办公楼201会议室
腾讯会议 ID:173 111 223