语义计算2023春季讨论班——弱监督文本分类、重新思考示例...

一、 主题:弱监督文本分类主讲人:杨磊稳摘要:本次介绍的工作是与弱监督文本分类相关。弱监督文本分类旨在仅使用类描述和未标记数据来训练分类器。以往的方法不仅依赖于精心绘制的类描述来获得特定于类的关键字,而且还需要大量未标记的数据,并且需要很长时间来训练。本文提出了一种高效的弱监督分类方法FastClass,在分类精度方面优于传统模型,并且训练速度快了几个数量级。时间和地点:4月23日9:00-9:30(星期日上午九点...

洞悉智慧,分享心得:2023届毕业生经验分享会

6月10日上午,实验室2023级毕业生吴佳琪、夏天宇、杨涛依次为大家进行了研究生经验分享。各位毕业生从多个角度分享了自己三年研究生生活的科研和学习经验,在场的在读研究生和即将步入研究生生涯的本科生们都收获颇丰。孙宇清老师最后进行了总结和展望。                                                                     图文作者:李稳 责任编辑:孙宇

春游之青铜山大峡谷

        春天的气息,不是一两阵清风,三四声鸟鸣就能说得清的,它藏在青铜山大峡谷的山尖上,清泉中,花香里,等我们亲自来感受。四月十五日,语义计算实验室团队,邀请了秦老师和张老师,上午从山东大学软件学院一起出发,前往济南市青铜山大峡谷游玩。             青铜山大峡谷风景区位于历城区锦绣川老庄村北青铜山南麓,是济南市后花园的一部分。该景区以大佛石窟深厚的历史文化底蕴和秀美的山水峡谷资源为基础,结合“千...

语义计算2023春季讨论班——可控文本生成、推荐算法

一、 主题:可控文本生成主讲人:韩雨辰摘要:本次介绍的两篇工作都是与可控文本生成相关的。第一篇工作从分布的角度对属性融合进行了观察,并提出直接搜索多个属性分布的交集区域算法辅助生成;第二篇工作提出了Discourse-Aware软提示前缀调优方法,通过前缀分层和稀疏注意力机制提高可控文本生成质量。时间和地点:4月14日19:00-20:00(星期五晚上七点-八点)线上腾讯会议 ID:690-7644-3039一、 主题:推荐算法主讲人:李稳...

语义计算2023春季讨论班——实体链接、分词

一、 主题:实体链接主讲人:刘洋摘要:实体链接方法旨在将文本中的提及与知识图谱中的实体进行关联,从而实现实体消歧。对实体特征的考虑会对实体链接的性能产生影响,DeepType 2通过引入类型交互,在多个数据集上取得了sota的表现,并且高于人类精度;在专业领域,标记信息的缺乏对实体链接的性能产生了影响,KRISS利用现成的领域知识来弥补标记信息的缺乏。时间和地点:4月8日9:00-10:00(星期六上午九点-十点)办公楼201腾...