分类: 学术动态

学术讲座-基于值函数的多智能体强化学习研究

主题:基于值函数的多智能体强化学习研究</br> 摘要:多智能体强化学习是一种解决多个智能体在相互作用环境中学习决策的机器学习方法,其融合了强化学习、控制论、博弈论、深度学习等方法,在自动驾驶、交通信号控制、推荐系统等实际任务中取得了令人瞩目的成绩。其中,基于值函数的多智能体强化学习由于其在处理复杂环境以及提高学习稳定性等方面的优势而备受关注。然而,现有的基于值函数的多智能体强化学习方法在面向特定复杂场景时存在传统值分解方式受限、异构智能体建模困难、大规模通信学习的质量不佳、对抗攻击下通信学习的鲁...

实验室博士生郑威同学参加CSCWD 2024会议

2024年国际计算机支持协同设计会议(The 2024 International Conference on Computer Supported Cooperative Work in Design,CSCWD2024)于5月8日至10日在天津举办。CSCWD 2024是一个涵盖计算机科学、信息技术和工程等领域的国际性学术会议,旨在促进计算机支持的合作工作和设计方面的研究与发展。本次大会主题“智能物联网与工业大数据”,包括协作技术的研究与开发,以及它们在工业和社会中的应用协作技术,会议邀请了梅宏、...

语义计算实验室举行年度总结会暨博士毕业生经验分享会

12月23日上午,语义计算实验室举行了年度总结会暨博士毕业生经验分享会。在年度总结会议上,实验室负责人孙宇清教授对2023年度的工作进行了全面回顾,内容涉及项目进展、科研成果以及人才培养,并就2024年发展目标分别从个体目标和群体目标两个角度进行规划和展望。在博士毕业生经验交流环节中,刘天元同学分享了科研和学习经历,特别是在文献阅读、模型设计、实验编码等方面的独到见解和心得,以及在科研过程中与导师积极沟通...

实验室博士生刘天元同学参加EMNLP 2023会议

2023年自然语言处理实证方法会议(The 2023 Conference on Empirical Methods in Natural Language Processing,EMNLP2023)于12月6日至10日在新加坡举办。EMNLP是自然语言处理领域的旗舰会议,会议主题涉及语音、词汇、语义、句法分析等理论方法,以及信息抽取、文本挖掘、信息检索、文本生成、机器翻译等自然语言处理技术与应用等话题。本年度会议的主题为“大型预训练语言模型与自然语言处理的未来”,会议邀请Christopher D...

祝贺刘天元同学顺利通过博士学位论文答辩

  语义计算实验室刘天元同学的博士学位论文答辩于2023年12月3日在山东大学软件园校区办公楼310会议室举行。答辩委员会主席为电子科技大学秦志光教授,答辩委员会委员包括复旦大学顾宁教授、山东师范大学刘弘教授、山东大学刘治教授、山东大学徐庸辉教授,答辩委员会秘书为山东大学刘宁助理教授。  刘天元在博士研究生阶段,深入研究了无监督可控文本改写领域的若干重要问题,提出了基于依存句法和词汇语用模式的词汇组合知...