Sampling with Incremental MapReduce
Marc Schafer Johannes Schildgen Stefan Deloch
The goal of this paper is to increase the computation speed of MapReduce jobs by reducing the accuracy of the result. Often, the timely p
Google三大云计算技术对海量数据分析流程的技术改进优化研究
卢小宾 王涛
建构云计算技术环境下的海量数据分析是一种需要预载大量数据集的数据计算处理。针对传统海量数据分析处理数据细节方式所导致的分析质量与效率问题,运用Google三大云计算技术对其进行改进。[方法/过程] 通过对Google三大云计算技术——GFS、MapReduce和Bigtable进行文献调查、内容分析和技术分析,梳理出Goo
Parallel Tree Reduction on MapReduce
Kento Emoto Hiroto Imachi
In this paper, restructuring our previous BSP algorithm for tree reduction computations, we propose a new MapReduce al