分类:
学术动态
一、 主题:可控的文本生成主讲人:王舰摘要:可控的文本生成是目前文本生成领域的一个研究热点。本周讲解两篇关联性的文章,一篇介绍离散编码形式的变分自编码。另外一篇文章介绍离散编码的变分自编码器在可控文本生成领域的应用,该文章同时兼顾了文本多样性的问题。时间和地点:3月13日9:30-11:00(星期六上午9点30分-11点),软件学院办公楼201会议
一、 主题:语言表示中的常识与偏见主讲人:刘天元摘要:词向量/预训练语言模型等方法为NLP任务提供了基础的特征表示。本周讲解的两篇文章,一篇主要探讨这些基本表示能否捕获语言中的常识性信息并据此进行推断。另一篇探讨了这些表示又捕获了怎样的偏见,以及如何避免。时间和地点:12月5日9:00-10:30(星期六上午9点-10点30分),软件学院办公楼201会议室二、 主题:文本生成主讲人:王舰摘要:序列到序列模型在当前文本生成...
一、 主题:一种新的预训练文本编码器——ELECTRA主讲人:杨涛摘要:本次讨论班讨论一种新的叫作ELECTRA的预训练文本编码器。论文提出了一个新的预训练任务——replace token detection,即以判别式模型判定单词是否被修改,解决了以MLM这一生成式任务做预训练所带来的一些问题,如两阶段输入不匹配、计算代价高等。实验证明,ELECTRA以更低的参数量和计算量,获得了在下游任务上比BERT等更好的表现。时间和地点:11月28日9:00...
一、 主题:以深度论文推荐相关方法为例的文献综述经验分享主讲人:谢翌摘要:经典的引文推荐模型可被分为三种主要方式:基于文本的过滤、协同过滤、基于图的推荐。这类方法往往受到数据稀疏、冷启动等困扰,无法为用户提供优质的推荐结果。近年来,相关科研人员将注意力集中到利用复杂的深度神经网络来进行引文推荐,捕获论文的语义表征和相关上下文信息,从而显著改善最终推荐结果。本次讨论班针对深度论文推荐问题,综述这...
2020年11月12日,“CCF走进高校活动”来到了山东女子学院。本次报告邀请了中国计算机学会协同计算专委会副主任、系统软件专委会委员、山东大学孙宇清教授,中国计算机学会协同计算专委、服务计算专委委员、大数据专委通讯委员、山东大学刘士军教授两位讲者。山东女子学院数据科学与计算机学院的教师及学生100余人参与了此次报告会。孙宇清教授的讲座——“识文可否知意”, 从语言的要素出发,回顾语言数字化、机械化到智能化的...