面向文本知识推理模型持续学习的样本选择方法和装置
摘要:
一种面向文本知识推理模型持续学习的样本选择方法和装置,属于自然语言推理的技术领域,包括历史任务样本选取和当前任务样本选取;其中所述历史任务样本选取包括:确定选取加入记忆集中的样本个数;选取样本:通过代表性、差异性、平衡性指标衡量样本来选取记忆集,并在选取样本时,利用下述两种方案之一遍历样本;其中,当前任务样本选取包括:样本代表性分析、样本困难性分析和样本采样。本发明能够兼顾代表性、平衡性和差异性等样本性质,相比于既往技术基于聚类中心选取代表性样本的方法,能更好地适配复杂文本推理场景,有效地使用少量样本去近似原样本的分布,使模型记忆历史任务上学习到的知识。