专利出售信息
发明 一种用于搜索引擎的文本信息规律分析方法与系统
互联网 网络媒体 原创文字 数据 互联网 网络媒体 原创文字 数据 【互联网 网络媒体 原创文字 数据】 【互联网技术 蓝牙鼠标 电子产品 信号接收】 【互联网 搜索引擎 网络文学 网络媒体 原创文字 文本】 2人
G06F16/9535 G06F40/289 G06F40/30 G06N3/08
摘要:本申请提供的一种用于搜索引擎的文本信息规律分析方法,包括:获取自然语言原始文档的文本;对所述自然语言原始文档的文本进行特征提取,生成文本特征向量;利用预先训练的向量匹配模型根据所述文本特征向量将所述文本与样本库中的样本进行匹配,获取目标样本;利用预先训练的语义分布规律模式确定模型根据所述目标样本的样本原始文档与对应的目标样本索引集之间的文本特征一致性,确定文本的语义分布规律模式;根据所述文本的语义分布规律模式,将所述自然语言原始文档的文本转换成索引集。本申请还提供了文本信息规律分析系统。本申请实现对自然语言的原始文档发掘其承载核心语义的词语分布规律,实现准确度高的搜索引擎索引项提取。
发布人员
  • 09-14
  • 09-13

免责声明:以上消息未经人工确认,本平台不担保其真实性和有效性,交易前请仔细核实。