基于要素简图的可控多样性专业文本生成方法及系统

摘要:

本发明公开一种基于要素简图的可控多样性专业文本生成方法及系统,属于自然语言处理的技术领域。本发明通过构建一个条件编码器建立观点和语义特征的关联,实现观点对文本语义的控制,并且通过随机采样不同的表达特征实现文本表达的多样性。要素简图的引入使得本发明能够直接且明确地建模观点和文本语义的关联关系,而且由于一个要素简图能够代表同一观点的多个专业文本的语义,利用较少量的数据训练模型即可实现观点对文本语义的强控制;本发明融合语义特征和表达特征的文本生成过程,实现了在语义约束下的多样性文本生成,防止生成文本只追求多样性而忽略了语义;本发明在生成专业文本的同时生成所依赖的要素简图,实现了生成过程的可解释性。