发明 基于舆情大数据分析的短文本情感分类方法、介质及系统
自然语言处理 舆情评论 胶囊网络 互联网社交媒体平台 网络环境 舆情把控 大数据短文本情感分析 1人
G06F18/241 G06F40/279 G06F16/45 G06N3/0464 G06N3/045 G06N3/0442 G06N3/08
摘要:本发明请求保护一种基于舆情大数据分析的短文本情感分类方法、介质及系统,属于文本分类领域,该方法包括:将经向量获取模型获取的正文和评论文本向量集与经神经网络多标签分类模型获取的主题列表转换成单主题+正文+评论文本格式的输入样本;构建基于自主题注意力机制的胶囊网络模型,作为情感分类模型,根据主题权重设计该模型的损失函数,并将上述输入样本作为模型的输入;将待预测文本输入所述情感分类模型进行情感标签预测,完成评论短文本情感分类。其中文本情感分类模型为增加了自主题注意力机制的胶囊网络,能够根据不同主题分类,捕捉评论短文本向量中较为丰富的文本特征及对应情感标签,更高的提取短文本文字中情绪的特征,情感分类精确度较高。