基于主题模型的中文词义归纳
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP391.1

基金项目:


Chinese word sense induction based on topic model
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    词义归纳(word sense induction,简称WSI)是在给定包含多义词语料的条件下,识别出多义词词义的过程,通常是采用聚类的方法。本文提出了基于主题模型的方法来解决中文词义归纳问题,基于主题模型的词义归纳方法使用文档的主题概率分布来推断多义词的词义分布。实验结果表明,本文方法在测试数据上获得了77.58% F-Score值。

    Abstract:

    Sense Induction is the process of identifying the word sense given its context, often treated as a clustering task. In this paper, we present a approach to Chinese Word Sense Induction which is based on topic modeling. Key to our methodology is the use of probabilistic assignment of topics distributions to documents to estimate sense distributions. Experimental results show that our method could achieve 77.58% scores of F-score on the development data set.

    参考文献
    相似文献
    引证文献
引用本文

引用本文格式: 高章敏,何祥,刘嘉勇,汤殿华. 基于主题模型的中文词义归纳[J]. 四川大学学报: 自然科学版, 2016, 53: 1269.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2015-12-25
  • 最后修改日期:2016-05-03
  • 录用日期:2016-05-11
  • 在线发布日期: 2016-11-29
  • 出版日期:
通知
自2024年3月6日起,《四川大学学报(自然科学版)》官网已迁移至新网站:https://science.scu.edu.cn/,此网站数据不再更新。
关闭