分类: 系列活动

语义计算2022秋季讨论班——文本哈希与层次化分类、采用量...

一、 主题:文本哈希与层次化分类主讲人:黄钿摘要:本次分享的第一篇工作主要与文本哈希相关,由于其带来了相似性计算的高效性,文本哈希成为了许多大规模文本检索系统的关键组件。在第一篇工作中,作者采用了对比学习方法并引入ARM估计来构建文本哈希方法,并通过丰富的析构实验来证明了其有效性。本次分享的第二篇工作与层次化分类任务有关,层次化分类任务是一种特殊的多标签任务,该工作的主要思想是将传统的层次分类任务视...

语义计算2022秋季讨论班——基于图的主动学习、论文影响力...

一、 主题:基于图的主动学习和论文影响力评估主讲人:李稳摘要:这次介绍的两篇工作都是和图相关的。第一篇是针对图模型GCN和LP提出的基于可靠影响力的主动学习算法,首次将主动学习和影响力最大化相关思想进行结合。第二篇提出了一个通过构建知识图谱评估学术论文质量的模型,实验结果证明了模型的有效性。时间和地点:11月12日9:00-10:00(星期六上午9点-10点)办公楼201腾讯会议 ID:690-7644-3039一、 主题:可控文本生成主...

语义计算2022秋季讨论班——文本逻辑推理和时序知识图谱推...

一、 主题:文本逻辑推理主讲人:郑威摘要:文本的逻辑推理需要识别文本中的关键逻辑结构并对其进行推理,近几年很多工作关注深度学习与神经符号规则推理的结合来处理文本逻辑推理任务。现有的逻辑推理方法主要集中于文本的上下文语义,或显示的建模逻辑推理过程,后者如LReasoner和MaxSAT方法等,MaxSAT直接建模一阶逻辑规则的神经推理框架,LReasoner则将隐式逻辑表达式用语言表达成自然语言,并结合预训练语言模型处理上述问...

语义计算2022秋季讨论班——攻击样本生成与检测问题和共情...

一、 主题:攻击样本生成与检测主讲人:刘天元摘要:自然语言处理中神经网络方法的可靠性和安全性一直有待验证,攻击样本生成是一个较为常见的手段。本次讲述两篇文章都从词汇级别出发,分别进行攻击样本的生成和检测。时间和地点:10月29日9:00-10:00(星期六上午9点-10点)办公楼201腾讯会议 ID:690-7644-3039一、 主题:共情对话和面向机器翻译的数据增强方法主讲人:王舰摘要:第一个工作面向共情对话,引入了ConceptNet构造...

语义计算2022秋季讨论班——可控文本生成

一、 主题:可控文本生成主讲人:韩雨辰摘要:本次介绍的两篇工作都是与可控文本生成相关的。第一篇工作通过将外部常识知识融入主题到文章生成任务,提高了生成文本的新鲜度和多样性;第二篇工作通过设计特定的格式控制符号和对注意力机制的改进,实现格式严格可控的文本生成。时间和地点:10月22日10:00-11:00(星期六上午10点-11点)办公楼201腾讯会议 ID:690-7644-3039图文作者:李稳    责任编辑:孙宇