Python编写MapReduce作业的解决办法

内容摘要
这篇文章主要为大家详细介绍了Python编写MapReduce作业的简单示例,具有一定的参考价值,可以用来参考一下。

对python这个高级语言对此感兴趣的朋友,看看idc笔记做的技术笔记!
m
文章正文

这篇文章主要为大家详细介绍了Python编写MapReduce作业的简单示例,具有一定的参考价值,可以用来参考一下。

对python这个高级语言对此感兴趣的朋友,看看idc笔记做的技术笔记!

mrjob 可以让用 Python 2.5+ 来编写 MapReduce 作业,并在多个不同平台上运行,你可以:

使用纯 Python 编写多步的 MapReduce 作业

在本机上进行测试

在 Hadoop 集群上运行

使用 Amazon Elastic MapReduce (EMR) 在云上运行

pip 的安装方法非常简单,无需配置,直接运行:pip install mrjob

代码实例:


# @param 使用Python编写MapReduce作业
# @author php教程|512pic.com 

from mrjob.job import MRJob
class MRWordCounter(MRJob):
    def mapper(self, key, line):
        for word in line.split():
            yield word, 1
    def reducer(self, word, occurrences):
        yield word, sum(occurrences)
if __name__ == '__main__':
    MRWordCounter.run()

# End www_512pic_com

注:关于Python编写MapReduce作业的简单示例的内容就先介绍到这里,更多相关文章的可以留意

代码注释

作者:喵哥笔记

IDC笔记

学的不仅是技术,更是梦想!