语义计算2023春季讨论班——多模态模型抽象理解能力探索和...

一、 主题:多模态模型抽象理解能力探索和基于规则的观点关系分类方法主讲人:王舰摘要:第一个工作借助童年游戏‘七巧板’构造带标注的文本-抽象图像数据集,利用该数据集评估当前预训练的多模态模型的抽象理解能力。第二个工作针对给定的两个表达观点的文本,判定它们间的关系,如支持、中立、反对。作者通过发现人类在陈述观点时采用的叙述模式构造4类规则,通过PSL融合这4类规则判定观点关系。时间和地点:4月1日9:00-10:00...

语义计算2023春季讨论班——可控文本生成与评价任务,知识图...

一、 主题:可控文本生成与评价任务主讲人:韩雨辰摘要:本次介绍的两篇工作都是与可控文本生成相关的。第一篇工作为SEQ2SEQ可控文本生成任务设计了一种非自回归扩散模型DIFFUSEQ,通过实验验证了该模型生成文本的高度多样性;第二篇工作提出了一种无监督无参考的可控文本评价指标,该指标通过利用预训练模型和设计好的文本填充任务从不同方面对可控文本生成任务进行评估,实验发现这种评估方式与人工评估有着较高的相关性。时间...

语义计算2023春季讨论班——大规模预训练语言模型下的文本...

一、 主题:大规模预训练语言模型下的文本生成主讲人:郑璐阳摘要:本次介绍的两篇论文都是关于文本生成的。第一篇工作是针对低资源环境下,提出了一个用于长文本摘要生成的语义自分割方法,在不丢失长文本语义的情况下,生成准确的摘要;第二篇工作则是为了解决生成的长文本不连贯的问题,提出了一种新的生成框架,利用自回归的自注意力机制来动态地进行内容规划和单词生成。时间和地点:3月18日9:00-10:00(星期六上午九点-十...

语义计算2023春季讨论班——大规模学术论文检索下的深度语...

一、 主题:大规模学术论文检索下的深度语义哈希主讲人:黄钿摘要:随着大量学术论文的涌现,高效的检索显得尤为重要,本次讨论班上介绍一种采用多输入自编码器架构的哈希编码模型,引入加权重要性的标签评价方法,并结合引文网络和语义内容嵌入双重构来提升哈希码的质量,是哈希应用到学术论文检索的一次值得肯定的实践。时间和地点:3月11日9:00-10:00(星期六上午九点-十点)办公楼201腾讯会议 ID:690-7644-3039一、 主题:...

语义计算2023春季讨论班——引文网络和对比学习

一、 主题:引文网路主讲人:李稳摘要:本次分享的两篇工作均和引文网络相关,第一篇是研究学术引用中的地理偏见问题,角度新颖,分析了不同地区的学术影响力的传播情况,很有意义;另一篇是针对训练引文网络时如何选择正负样本的问题,作者利用简单的聚类方法获得了不错的实验结果,并分析了其中内涵的原因。时间和地点:3月4日9:00-10:00(星期六上午九点-十点)办公楼201腾讯会议 ID:690-7644-3039一、 主题:对比学习主讲...