基于短语级情感分析的不良信息检测方法
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP301

基金项目:

国家重点研发计划(2016YFB0800604,2016YFB0800605);国家自然科学基金项目[61572334,U1736212];四川省重点研发项目[2018GZ0183]


Sensitive Information Detection Based on Phrase-level Sentiment Analysis
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对基于关键词字符匹配和粗粒度情感分析方法的传统不良信息检测方法准确率低的问题,提出一种基于短语级情感分析的不良信息检测方法,该方法制定语法规则来提取敏感词所在短语,结合二次分类的情感词典,通过分析短语的情感倾向来判断表达者对敏感关键词的情感倾向,从而判定内容的敏感性。该方法克服了字符串匹配方法忽视敏感词上下文,从而导致大量误报的缺点,及粗粒度情感分析方法由于无法准确定位情感对象,只能以文本整体情感倾向代表表达者主观情感,导致不能精准分析与敏感词相关的情感倾向及敏感性的缺点。实验表明,与传统方法相比,该方法的准确率有较大的提升。

    Abstract:

    String matching method and coarsegrained sentiment analysis method are often used in sensitive information detection,the accuracy, however, is rather low. To mitigate this issue, this paper proposed a method based on phraselevel sentiment analysis. This method takes advantage of a rule set which is used to extract phrases concerning the sensitive word, by analyzing the sentiment orientation of relative phrases, it is possible to determine the sentiment orientation of the expresser towards the sensitive word, thus determine the sensitivity of the information. This method takes the context of the sensitive word into consideration and is able to extract sentiment orientation towards the sensitive word instead of the whole text, which is missing from string matching method and coarsegrained method respectively. Experimental results suggest that the accuracy is considerably increased compared to string matching and coarsegrained sentiment analysis method.

    参考文献
    相似文献
    引证文献
引用本文

引用本文格式: 明弋洋,刘晓洁. 基于短语级情感分析的不良信息检测方法[J]. 四川大学学报: 自然科学版, 2019, 56: 1042.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2019-04-19
  • 最后修改日期:2019-06-05
  • 录用日期:2019-06-06
  • 在线发布日期: 2019-12-04
  • 出版日期:
通知
自2024年3月6日起,《四川大学学报(自然科学版)》官网已迁移至新网站:https://science.scu.edu.cn/,此网站数据不再更新。
关闭