分类:
学术动态
实验室2019届硕士研究生李相君同学的论文“A Sequence Embedding Method for Enzyme Optimal Condition Analysis”(作者:李相君#、窦智欣#、孙宇清*、王禄山、龚斌、万林。#共同第一作者,*通讯作者)被BMC Bioinformatics录用。BMC Bioinformatics是生物信息学和计算生物学领域的SCI二区期刊,IF=3.242,关注建模和统计方法在生物信息领域创新应用。本篇工作提出了基于氨基酸和序列结构信息的表示学习方法,通过对氨基酸序列...
一、 主题:文本生成前沿进展-事实准确性 主讲人:王舰 摘要:目前的文本生成尤其是长文本生成,比如摘要,往往存在着事实性错误,因此,研究如何提升文本的事实准确性和对事实准确性进行评估对文本生成具有重要意义。本次讨论班针对上述两个问题进行简要综述,并讨论在事实准确性上的研究热点。 时间和地点:10月30日13:30-15:00(星期五下午1点30分-3点),软件学院办公楼201会议室二、 主题:上下文相关词表...
一、 主题:无参数句嵌入 主讲人:杨涛 摘要:近年来,表示词的语义信息的词嵌入技术已在许多NLP任务上取得可喜成果,促使了在更长文本如句子和段落上寻求稳定语义嵌入工作的研究。目前的句嵌入研究可分为有参数和无参数两类大的方向。论文《Parameter-free Sentence Embedding via Orthogonal Basis》提出了一种新的无参句嵌入方法。通过对句子中词汇的新颖性、重要性、独特性进行数值度量,再对词嵌入加权求和获...
一、 主题:学术推荐 主讲人:谢翌 摘要:基于Bert的自然语言处理模型在表示学习问题上具有突出表现。但仅针对上下文中句子级别的训练目标,限制了文档级别的模型表示能力,无法实现面向不同任务的科研论文嵌入。Specter、SciBert、Sentence-Bert等工作提出多种基于Bert的科研论文嵌入模型,将论文之间的引用融入文本编码,使具有引用关系的论文表示更接近,以应对论文分类、用户活跃度预测、论文推荐等任务。二...
一、 主题:问题生成 主讲人:察胜男 摘要:本文针对答案可知型NQG模型存在问题:模型生成的问题中会包含部分我们选定的答案信息,从而生成错误问题。所以从答案编码的角度做出改进,提出答案分离的方法,使用特殊标记来替换原始字段的答案。二、 主题:NLP中的表示学习 主讲人:刘天元 摘要:基于上下文的词汇表示(Contextual Word Representations)在多种自然语言处理任务上取得了成功的结果。...