spark环境搭建

1下载spark

解压缩到url/spark

配置环境变量


在spark/bin/spark-shell 进入scala交互界面 Ctrl+C退出

spark/bin/pyspark 进入python交互界面 exit();退出

wordcount demo:

var lines=sc.textFile("test/hello")

lines.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).foreach(println)

<==>

lines.flatMap(name=>name.split(" ")).map((_.1)).redbuceByKey(((a,b)=>a+b)).forach(println)

<==>

lines.flatMap(name=>name.split(" ")).map(name=>(name,1)).reduceByKey(((a,b)=>a+b)).foreach(println)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容