基于深度主动学习的信息安全领域命名实体识别研究
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP391.1

基金项目:

中国科学院网络测评技术重点实验室开放课题基金


Cyber security named entity recognition based on deep active learning
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对通用领域模型不能很好地解决信息安全领域的命名实体识别问题,提出了一种基于字符特性,双向长短时记忆网络(Bi-LSTM)与条件随机场(CRF)相结合的信息安全领域命名实体识别方法. 该方法不依赖于人工选取特征,而是通过神经网络模型对序列进行标注,再利用CRF对序列标签的相关性进行约束,提高序列标注的准确性. 此外,针对信息安全领域标注数据样本不足的问题,采用了主动学习方法,使用少量标注样本达到较好的序列标注效果.

    Abstract:

    To solve the problem of low accuracy in general cyber security named entity recognition (NER) model,a deep active learning method is proposed for NER in general cyber security field, which is based on character feature,BiLSTM and conditional random field (CRF). The neural network model is for sequence labeling and CRF is for label dependency constraint,which then improves the accuracy of sequence labeling. Furthermore,as for datasets with the insufficient labeled samples in cyber security field,the proposed active learning method is able to achieve better sequence labeling effect with a small number of labeled samples.

    参考文献
    相似文献
    引证文献
引用本文

引用本文格式: 彭嘉毅,方勇,黄诚,刘亮,姜政伟. 基于深度主动学习的信息安全领域命名实体识别研究[J]. 四川大学学报: 自然科学版, 2019, 56: 457.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2018-11-22
  • 最后修改日期:2018-12-13
  • 录用日期:2018-12-14
  • 在线发布日期: 2019-05-29
  • 出版日期:
通知
自2024年3月6日起,《四川大学学报(自然科学版)》官网已迁移至新网站:https://science.scu.edu.cn/,此网站数据不再更新。
关闭