基于BLSTM-CRF模型的安全漏洞领域命名实体识别
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP391.1

基金项目:

2017年国家重点研发计划网络空间安全重点专项“软件与系统漏洞分析与发现技术”(2017YFB0802900)


Named Entity Recognition for Vulnerabilities Based on BLSTM-CRF Model
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    非结构化文本资源提供了大量与漏洞相关的信息,传统的特定领域实体识别依赖特征模板和领域知识来识别相关实体,其识别性能很大程度上依赖于人工选取的特征函数质量。如何利用机器挖掘文本隐含的特征,而不需要人工详细地制定领域术语的特征表达是一项具有挑战性的任务。该文针对安全漏洞领域,提出一种双向长短期记忆网络(Bidirectional Long Short-Term Memory,BLSTM)与条件随机场(Conditional Random Field,CRF)相结合的安全漏洞领域实体识别模型,并使用基于的词典方法对结果进行校正,F值可达到 85%以上。实验表明,该方法在提高实体识别的准确率和召回率的同时,能够显著地降低人工选取特征的工作量。

    Abstract:

    Unstructured text resources provide a large amount of information related to vulnerability. Traditional domain-specific entity recognition relies on feature templates and domain knowledge to recognize related entities. The recognition performance depends largely on the quality of manually selected feature functions. It is a challenging task to mine the features implied by the text automatically, rather than manually formulate the characterization of the domain terminology. In this paper, a BLSTM and CRF security vulnerability domain entity recognition model (BLSTM-CRF model) is proposed and a dictionary is used to correct the results generated by the model. The F value can reach 85%. Experiments show that this method can significantly reduce the workload of manually selecting features while improving the precision and recall

    参考文献
    相似文献
    引证文献
引用本文

引用本文格式: 张若彬,刘嘉勇,何祥. 基于BLSTM-CRF模型的安全漏洞领域命名实体识别[J]. 四川大学学报: 自然科学版, 2019, 56: 469.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2018-12-04
  • 最后修改日期:2018-12-21
  • 录用日期:2019-01-02
  • 在线发布日期: 2019-05-29
  • 出版日期:
通知
自2024年3月6日起,《四川大学学报(自然科学版)》官网已迁移至新网站:https://science.scu.edu.cn/,此网站数据不再更新。
关闭