向量空间模型,数据不一致性,词干提取,停用词过滤,词向量模型,TF-IDF权重,相似度匹配算法