发明 一种文本相似度的确定方法及相关设备
人工智能 自然语言处理 文本预处理 文本分析 情感分析 【人工智能 自然语言处理 文本预处理 文本分析 情感分析】 2人
G06F16/332 G06F16/33 G06F40/284
摘要:本发明实施例公开了一种文本相似度的确定方法及相关设备,所述方法应用于数据处理技术领域,包括:调用主题词识别模型确定出第一文本对应的至少一个第一主题词和第二文本对应的至少一个第二主题词,并获取至少一个第一主题词中各个第一主题词的第一词向量和至少一个第二主题词中各个第二主题词的第二词向量;计算各个第一词向量与各个第二词向量之间的余弦相似度、第一主题词的数量M、以及第二主题词的数量N,进而基于预设文本相似度算法对各个余弦相似度、第一主题词的数量M、以及第二主题词的数量N进行计算,确定出第一文本和第二文本之间的相似度。采用这样的方式,可以提高确定文本相似度的准确度。