语义计算实验室2020秋季学期讨论班(4)

一、 主题:无参数句嵌入       主讲人:杨涛       摘要:近年来,表示词的语义信息的词嵌入技术已在许多NLP任务上取得可喜成果,促使了在更长文本如句子和段落上寻求稳定语义嵌入工作的研究。目前的句嵌入研究可分为有参数和无参数两类大的方向。论文《Parameter-free Sentence Embedding via Orthogonal Basis》提出了一种新的无参句嵌入方法。通过对句子中词汇的新颖性、重要性、独特性进行数值度量,再对词嵌入加权求和获...

语义计算实验室2020秋季学期讨论班(3)

一、 主题:学术推荐        主讲人:谢翌        摘要:基于Bert的自然语言处理模型在表示学习问题上具有突出表现。但仅针对上下文中句子级别的训练目标,限制了文档级别的模型表示能力,无法实现面向不同任务的科研论文嵌入。Specter、SciBert、Sentence-Bert等工作提出多种基于Bert的科研论文嵌入模型,将论文之间的引用融入文本编码,使具有引用关系的论文表示更接近,以应对论文分类、用户活跃度预测、论文推荐等任务。二...

语义计算实验室2020秋季学期讨论班(2)

一、 主题:问题生成        主讲人:察胜男        摘要:本文针对答案可知型NQG模型存在问题:模型生成的问题中会包含部分我们选定的答案信息,从而生成错误问题。所以从答案编码的角度做出改进,提出答案分离的方法,使用特殊标记来替换原始字段的答案。二、 主题:NLP中的表示学习        主讲人:刘天元        摘要:基于上下文的词汇表示(Contextual Word Representations)在多种自然语言处理任务上取得了成功的结果。...

语义计算实验室2020秋季学期讨论班(1)

一、 主题:文本生成前言进展 主讲人:王舰 摘要: 由于语言固有的多样性和语义歧义使得文本生成任务困难且结果难以评估。因此,从语言学的角度分析目前的评估体系,讨论神经文本生成方法前沿进展,分析其优势和适用场景,并讨论目前文本生成存在的挑战和研究方向。二、 时间和地点9月26日9:00-12:00(星期六上午9-12点)软件学院办公楼201会议

Efficient Data Clustering Using Coresets

一、会议主题Efficient Data Clustering Using Coresets二、主讲人Prof. Shaofeng Jiang三、主讲人介绍四、邀请人孙宇清教授五、报告时间9月15日14:00-15:00六、报告方式腾讯会议会议ID:166 850 849点击链接入会:https://meeting.tencent.com/s/Hpn9x4rs68LG七、主办单位山东大学软件学