专利出售信息
发明 一种基于网页标签分析的数据自动采集方法
网页数据采集 数据分析 互联网 (网页数据采集 互联网) (信息化工厂 信息化管理 自动化控制) 1人
G06F40/30 G06F18/25 G06F18/231 G06F18/241
摘要:本发明涉及网页数据采集技术领域,尤其涉及一种基于网页标签分析的数据自动采集方法。所述方法包括以下步骤:对获取的目标采集网页数据进行簇间结构特征提取,得到初始DOM树结构特征数据;根据初始DOM树结构特征数据进行页面动态加载监听,生成页面动态加载数据;根据页面动态加载数据进行动态标签组合处理,得到动态标签组合数据;根据动态标签组合数据进行品牌口碑标签识别,生成品牌口碑标签数据;根据品牌口碑标签数据进行自适应采集优化,生成自适应页面采集策略;根据自适应页面采集策略进行多模态品牌数据采集,并进行商品口碑预测,得到商品口碑预测数据。本发明通过标签动态组合实现自适应页面数据采集。
发布人员
  • 09-19

免责声明:以上消息未经人工确认,本平台不担保其真实性和有效性,交易前请仔细核实。