一种基于概念文本的词向量快速生成方法和装置
摘要:
一种基于概念文本的词向量快速生成方法,包括:对一段分好词后的概念文本,单词的组成字符以及每个单词的词性信息依次进行向量生成阶段处理和语义聚合阶段处理;其中,所述输入信息在所述向量生成阶段生成输出信息,即分别生成针对单个概念文本的单词向量;其中,针对同样的单词的多个概念文本的词向量进行语义聚合,最终输出综合语义向量。本发明所使用的词向量学习方法,可以脱离大规模学习语料,只使用少量的概念文本即可学习到能够较好表示语义的分布式词向量,针对专业领域新词,能够应对关于新词描述语料缺失的问题。