【hadoop伪分布式配置范文】Hadoop分布式架构下大数据集的并行挖

时间:2015-01-16 20:43:07 作者:吕婉琪;钟诚;唐印浒

本文作者:吕婉琪;钟诚;唐印浒;陈志朕;成功正常投稿发表论文到《计算机技术与发展》2014年01期,引用请注明来源400期刊网!


如果您需要快速发表论文服务,请联系在线编辑!


【摘要】:基于Hadoop分布式计算平台,给出一种适用于大数据集的并行挖掘算法。该算法对非结构化的原始大数据集以及中间结果文件进行垂直划分以确保能够获得完整的频繁项集,将各个垂直分块数据分配给不同的Hadoop计算节点进行处理,以减少各个计算节点的存储数据,进而减少各个计算节点执行交集操作的次数,提高并行挖掘效率。实验结果表明,给出的并行挖掘算法解决了大数据集挖掘过程中产生的大量数据通信、中间数据以及执行大量交集操作的问题,算法高效、可扩展。
【论文正文预览】:0引言诸如Apriori算法和FP-Tree算法这样的数据挖掘算法基于水平数据格式进行挖掘[1]。Zaki等人在文献[2]中提出采用垂直数据格式的串行数据挖掘算法Eclat和MaxEclat,这两个算法均采用基于前缀的等价类技术,不同的是Eclat算法采用自底向上的搜索策略,而MaxEclat算法采用了混合
【文章分类号】:TP311.13
【稿件关键词】:数据挖掘大数据集并行算法Hadoop
【参考文献】:
【稿件标题】:【hadoop伪分布式配置范文】Hadoop分布式架构下大数据集的并行挖掘
【作者单位】:广西大学计算机与电子信息学院;
【发表期刊期数】:《计算机技术与发展》2014年01期
【期刊简介】:《计算机技术与发展》杂志是由中华人民共和国新闻出版总署、正式批准公开发行的优秀期刊,计算机技术与发展杂志具有正规的双刊号,其中国内统一刊号:CN61-1450/TP,国际刊号:ISSN。计算机技术与发展杂志社由陕西省信息产业厅主管、陕西省计算机学会主办,本......更多计算机技术与发展杂志社(http://www.400qikan.com/qk/6081/)投稿信息
【版权所有人】:吕婉琪;钟诚;唐印浒;陈志朕;


更多科技类论文详细信息: 【hadoop伪分布式配置范文】Hadoop分布式架构下大数据集的并行挖 论文代写
http://m.400qikan.com/lw-18258 论文代发

相关专题:助理工程师 加拿大运营商

相关论文
相关学术期刊
《中国产经》 《北京航空航天大学学报》 《钓鱼》 《地震研究》 《中国花卉盆景》 《宁波节能》 《中国工业医学杂志》 《教师教育论坛》 《大豆科技》 《知识产权法研究》

< 返回首页