祝贺实验室同学黄钿、李稳、郑璐阳顺利通过毕业论文答辩

山东大学语义计算实验室2024届硕士毕业生答辩于2024年5月29日在山东大学软件园校区办公楼209会议室举行。黄钿、李稳、郑璐阳3名硕士生参与了本次答辩。他们的毕业论文题目依次为《融合层次化类别信息的文本语义哈希技术》、《基于可区分主题的新论文推荐关键技术研究》、《中文作文评语生成关键技术研究》,指导老师为孙宇清教授。三位同学分别和答辩委员会合影留念三位毕业生与实验室其他成员合影留念论文简介如下:《融合层次...

学术讲座-基于值函数的多智能体强化学习研究

主题:基于值函数的多智能体强化学习研究
摘要:多智能体强化学习是一种解决多个智能体在相互作用环境中学习决策的机器学习方法,其融合了强化学习、控制论、博弈论、深度学习等方法,在自动驾驶、交通信号控制、推荐系统等实际任务中取得了令人瞩目的成绩。其中,基于值函数的多智能体强化学习由于其在处理复杂环境以及提高学习稳定性等方面的优势而备受关注。然而,现有的基于值函数的多智能体强化学习方法在面向特定复杂场景时存在传统值分解方式受限、异构智能体建模困难、大规模通信学习的质量不佳、对抗攻击下通信学习的鲁棒性不足等问题。针对上述问题,围绕混合合作竞争任务场景、异构多智能体场景、大规模多智能体场景以及对抗攻击干扰场景这四类难度从小到大的典型场景,从值函数分解、异构智能体建模、大规模通信学习、鲁棒通信学习方面对基于值函数的多智能体强化学习进行深入研究。

语义计算2024春季讨论班——零样本提示学习

一、 主题: 零样本提示学习主讲人: 杨磊稳摘要: 当前零样本场景下的提示学习方法广泛依赖于具有足够人工注释数据的开发集,以在后验选择性能最佳的提示模板。这并不理想,因为在实际相关的现实世界中,没有标记数据可用。因此,我们提出了一种简单而有效的方法来筛选合理的零射击文本分类提示模板:Perplexity Selection (perfect)。我们假设语言差异可以用来衡量提示模板的有效性,从而开发出一种基于困惑的方案,允许提前预...

语义计算2024春季讨论班——语言模型的对齐攻击,上下文学习...

一、 主题: 语言模型的对齐攻击主讲人: 吴慧倩摘要: 本次分享的第一篇文章介绍新的语言模型架构:背包语言模型,该模型有着优秀的建模能力的同时提供了可解释性与可控的接口。背包语言模型为词汇表中的每个单词学习多个上下文无关意义向量并将序列中的单词表示为该序列中意义向量的上下文相关的非负线性组合,将词袋模型与注意力机制思想结合,能够被用于去偏以及可控文本生成任务。第二篇文章介绍对齐大语言模型在面对对抗...

春游之明水古城

春天到来,万物复苏,正是出游的好时节。4月27日,实验室全体成员前往济南市明水古城游玩,感受春天的气息,享受美好的春游时光。明水古城始建于唐朝,贞观年间设西泉镇;到了宋元时期,成为章丘四大名镇之一,这座古城已有1000余年的历史。明水古城文旅资源特别,一是泉,古城景区包含百脉泉泉系,梅花泉如河奔涌,墨泉奋涌若轮。二是章丘是“天下第一才女”李清照、中华老字号瑞蚨祥创始人孟洛川的故乡,富含文化底蕴。从孟鸿...