IntelliJ IDEA开发Spark案例之WordCount(非Maven、离线版)

简介: IntelliJ IDEA开发Spark案例之WordCount(非Maven、离线版)

0x00 教程内容


  1. 新建Scala项目
  2. 编写Scala代码
  3. 打包到服务器执行


实验前提:

a. 安装好了windows本地的scala

b. 安装好了IDEA的scala插件

c. 安装好了JDK


0x01 新建Scala项目


1. 新建Scala项目

a. 新建一个Scala项目,先选择Java,然后在右边选择Scala,配置好解压之后的scala包,其他的默认


image.png


b. 如果有提示,可以随便选一个


image.png


2. 项目配置

a. 右击src,建一个包,比如:com.shaonaiyi

image.png


b. 然后编辑项目结构,加入我们的Scala SDK(找到我们win本地的Scala主目录即可):


image.png


image.png


c. 导入我们的Spark依赖jar包(选择Spark主目录下的jars目录,然后一直OK):


image.png


0x02 编写Scala代码


1. 新建Scala类

a. 右击包名:com.shaonaiyi,创建Scala Class,然后选择Kind为Object


image.png


2. 编写WordCount代码

a. 修改Wordcount类为:


package com.shaonaiyi
import org.apache.spark.SparkContext
object Wordcount {
  def main(args: Array[String]): Unit = {
    var sc = new SparkContext("local[2]","Wordcount")
    var file = sc.textFile("spark-wc.iml")
    var wordRDD = file.flatMap(_.split(" ")).map((_,1)).reduceByKey(_ + _).sortBy(_._2)
    wordRDD.foreach(println(_))
  }
}


3. 本地执行

a. 执行代码可以看到统计结果

image.png


0x03 打包到服务器执行


1. 设置打包工程

a. 选择一种类型的包

image.png


c. 排除我们服务器上有的包,即服务器已经有的jar包就不用也把他们打包上去了。


image.png


然后一直ok,执行完,稍等一会可以看到src同级目录下多了个out文件夹。

2. 打包操作

a. 打包


image.png


b. 执行完可以看到out目录有jar包了


image.png


3. 上传服务器并执行

a. 使用XFtp等工具上传jar包和项目下的即可(此处直接上传到~)

spark-wc.jar

spark-wc.iml

到~路径下


b. 启动spark

$SPARK_HOME/sbin/start-all.sh

c. 执行(在jar包当前路径下):

spark-submit spark-wc.jar


注意要配置好spark的环境变量,才可以在任意路径下执行spark-submit操作,此处不再累赘。


0x04 统计结果展示


统计结果:

image.png


0xFF 总结


  1. 本教程不用联网也可以执行Spark案例,此外,一样也可以执行机器学习等案例。
  2. 本教程非常关键,因为网络不好或者是简单的项目,这种传统的方式也是非常简单方便的。
  3. Maven工程版本,请查看教程:IntelliJ IDEA开发Spark案例之WordCount
相关文章
|
6月前
|
IDE Oracle Java
day4:JDK、IntelliJ IDEA的安装和环境变量配置
【7月更文挑战第4天】🏆本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!
253 0
|
6月前
|
网络协议 安全 Linux
在IntelliJ IDEA中使用固定公网地址远程SSH连接服务器环境进行开发
在IntelliJ IDEA中使用固定公网地址远程SSH连接服务器环境进行开发
141 2
|
7月前
|
Linux 开发工具 Windows
在WSL2中安装IntelliJ IDEA开发工具
在WSL2中安装IntelliJ IDEA开发工具
706 2
|
7月前
|
IDE Java Scala
IntelliJ IDEA 2023.3 最新变化2
IntelliJ IDEA 2023.3 最新变化
110 1
|
7月前
|
存储 JSON 自然语言处理
SSMP整合案例交互之在idea中利用vue和axios发送异步请求进行前后端调用
SSMP整合案例交互之在idea中利用vue和axios发送异步请求进行前后端调用
52 2
|
6月前
|
缓存 Java Maven
IntelliJ IDEA中无法加载jar包导致出现“cannot resolve symbol...”问题的解决
IntelliJ IDEA中无法加载jar包导致出现“cannot resolve symbol...”问题的解决
266 0
|
6月前
|
存储 Oracle Java
Java面试题:描述如何使用Eclipse或IntelliJ IDEA进行Java开发?
Java面试题:描述如何使用Eclipse或IntelliJ IDEA进行Java开发?
67 0
|
7月前
|
监控 IDE Java
探索 IntelliJ IDEA 中 Spring Boot 运行配置选项及其作用
探索 IntelliJ IDEA 中 Spring Boot 运行配置选项及其作用
713 0
|
7月前
|
IDE Java 开发工具
IntelliJ IDEA 2023.3 最新变化3
IntelliJ IDEA 2023.3 最新变化
114 0
|
7月前
|
人工智能 IDE Java
IntelliJ IDEA 2023.3 最新变化1
IntelliJ IDEA 2023.3 最新变化
114 0

热门文章

最新文章