转载

发表于 2015年10月20日
浏览 (708)
评论 (0)

8.Spark集群测试

Spark集群测试

把Spark安装包下的”README.txt”上传到hdfs

8.Spark集群测试

通过hdfs的web控制台可以发现成功上传了文件：

8.Spark集群测试

启动Spark shell：

接下来通过以下命令读取刚刚上传到HDFS上的“README.md”文件：

val count = file.flatMap(line => line.split(" ")).map(word => (word,1)).reduceByKey(_+_)

8.Spark集群测试

对读取的文件进行以下操作：

val count = file.flatMap(line => line.split(" ")).map(word => (word,1)).reduceByKey(_+_)

8.Spark集群测试

接下来使用collect命令提交并执行Job：

count.collect

8.Spark集群测试

8.Spark集群测试

从控制台可以看到我们的程序成功在集群上运行.

使用Spark交互模式：

1. 运行./spark-shell.sh

2. scala> val data = Array(1, 2, 3, 4, 5) //产生data

data: Array[Int] = Array(1, 2, 3, 4, 5)

3. scala> val distData = sc.parallelize(data) //将data处理成RDD

distData: spark.RDD[Int] = spark.ParallelCollection@7a0ec850 （显示出的类型为RDD）

4. scala> distData.reduce(_+_) //在RDD上进行运算，对data里面元素进行加和

12/05/10 09:36:20 INFO spark.SparkContext: Starting job...

5. 最后运行得到

12/05/10 09:36:20 INFO spark.SparkContext: Job finished in 0.076729174 s

res2: Int = 15

8.Spark集群测试

正文到此结束

所属分类：编程技术

本文标签： map HDFS Word 集群 http tar src dist shell key 测试 UI web 安装
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(14,784) 评论(0)
Caffe 深度学习框架上手教程

浏览(11,120) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(11,934) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(11,835) 评论(0)
Decorators in ES7

浏览(16,453) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(29,423) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(12,874) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(11,799) 评论(0)
【开班了】JAVA培训班正式招生

浏览(7,925) 评论(12)
Seaweedfs之Volume读请求重定向

浏览(26,094) 评论(3)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG