文本聚类算法|一种面向聚类的文本建模方法

时间:2015-02-04 08:54:14 作者:唐晓丽;白宇;张桂平

本文作者:唐晓丽;白宇;张桂平;蔡东风;成功正常投稿发表论文到《山西大学学报(自然科学版)》2014年04期,引用请注明来源400期刊网!


如果您需要快速发表论文服务,请联系在线编辑!


【摘要】:借鉴主题模型的思想,利用word2vec训练数据的高效性以及词聚类结果的有效性,提出了一种基于word2vec的文本建模方法。该方法以word2vec算法得到的词聚类结果为基础,统计文本在词聚类类别上的概率分布,获得文本在类别空间上的特征向量,完成文本建模。将其与两种经典的文本建模方法VSM和LDA进行比较,实验结果显示在聚类效果上F值分别提高6.01%、1.01%,在算法效率上有明显的提高。
【论文正文预览】:0引言随着Web信息的爆炸式增长,计算机的信息处理已进入大数据时代。信息融合技术为Web信息处理提供了新的方法。信息融合[1]借鉴人脑的工作原理,利用计算机对具有相似或不同特征的多源数据和信息进行处理,为用户提供统一的信息视图和可综合利用的信息。文本形式是Web信息呈现
【文章分类号】:TP391.1
【稿件关键词】:主题模型wordvec文本建模文本聚类
【参考文献】:
【稿件标题】:文本聚类算法|一种面向聚类的文本建模方法
【作者单位】:沈阳航空航天大学知识工程研究中心;
【发表期刊期数】:《山西大学学报(自然科学版)》2014年04期
【期刊简介】:0......更多山西大学学报(自然科学版)杂志社(http://www.400qikan.com/qk/5011/)投稿信息
【版权所有人】:唐晓丽;白宇;张桂平;蔡东风;


更多自然类论文详细信息: 文本聚类算法|一种面向聚类的文本建模方法 论文代写
http://m.400qikan.com/lw-22937 论文代发

相关专题:假期刊 南海填海造岛最新图

相关论文

心理学报版面费

论文百科2017-03-25 18:12:13
相关学术期刊
《经济经纬》 《天文爱好者》 《管理@人》 《沈阳工程学院学报》 《中国文化遗产》 《中医教育》 《四川动物》 《贵金属》 《广西警官高等专科学校学报》 《小城镇建设》

< 返回首页