首 页    学报简介    作者投稿    专家审稿    编辑办公    读者须知    联系我们
 
基于集成分类器的用户属性预测研究
Research on Demographic Prediction Based on Ensemble Classifiers
摘要点击 47  全文点击 22  投稿时间:2017-05-23  修订日期:2017-06-02
查看全文  查看/发表评论  下载PDF阅读器
DOI编号   
中文关键词   用户属性预测  智能手机  离散化  海灵格距离  特征权重
英文关键词   User attribute prediction  Smartphones  Discretization  Hellinger Distance  Feature weight
基金项目   国家自然科学基金项目(61332066,81373239)
作者单位E-mail
王斯盾 后勤工程学院 danube.live@qq.com 
琚生根 四川大学计算机学院 jsg@scu.edu.cn 
周刚 四川大学计算机学院  
刘玉娇 四川大学计算机学院  
中文摘要
    用户属性在个性化服务中具有重要的作用,利用手机数据进行用户属性预测逐渐成为新方向。本文利用手机应用类别均使用时长和应用类别个数,提出了基本属性与辅助属性的概念。首先对所有未标注样本的辅助属性离散化,将辅助属性基于类别的海灵格距离作为基本属性的特征权重,将基本属性与权重的乘积作为特征训练集成分类器中的各个基分类器,并引入随机森林中的带外样本准确率作为基分类器的权重,得到最终的分类结果。实验结果表明,本文所给出的集成分类器框架能够提高用户属性预测的效果。
英文摘要
    User attributes play an important role in personalized service. The prediction of the user's property based on mobile phone data has gradually become a new direction. In this paper, we use two independent attributes: average daily usage time and number of application categories. The basic attribute and the concept of the auxiliary attribute are proposed. In this paper, firstly, the auxiliary attributes of all unlabeled samples are discretized by non-supervised method. And then calculate the Hellinger Distance of auxiliary property categories, which is the characteristic weight of the basic attribute. Input the basic attributes and the characteristic weight to the base classifier of the ensemble classifier training model, introducing random forest with out of sample accuracy as the base classifier weights, finally we get the final classification results. The experimental results show that the ensemble classifiers framework can improve the effect of user attribute prediction.

您是第 2613727 位访问者

版权所有 @ 2007《四川大学学报 (自然科学版)》编辑部
地址: 四川省成都市武侯区四川大学经管楼506室  邮编: 610064
电话: (028)85410393  传真: (028)85410393  E-mail: scdx@scu.edu.cn
本系统由北京勤云科技发展有限公司设计