备案控制台

开发者社区问答正文

应该如何运行Spark程序最好？

应该如何运行Spark程序最好？

展开

收起

游客ahv54x37wvm7u 2021-12-06 21:39:56 260 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客lu6fsp6mkfgcm

　本文前提是已经正确安装好scala,sbt以及spark了简述将程序挂载到集群上运行的步骤：　　1、构建sbt标准的项目工程结构：SBT项目工程结构图其中：~/build.sbt文件用来配置项目的基本信息（项目名、组织名、项目版本、使用的scala版本或者再次配置些项目所需的依赖包）；project/build.properties文件配置你要使用什么版本的sbt对项目操作；project/plugins.sbt文件是给项目添加所需的插件；project/Build.scala文件是对项目进行些复杂的高级配置；详细的sbt安装配置实用参见博文：　　2、到相应目录下编写程序，spark程序必须要创建一个SparkContext实例。SparkContext("master", "projectName", "SPARK_HOME", "yourProject.jar path") 　　3、sbt compile命令编译程序无错后，sbt package命令将程序打包。默认打包的jar文件存放路径为：项目根目录/target/scala-xx.xx.xx/your-project-name_xx.xx.xx-xx.jar 　　4、将打包好的jar问价添加到SPAK_CLASSPATH中（在linux中根据作用范围的不同有多种更改环境变量的方式，这里只说我的配置方式：spark根目录下的conf/spark-env.sh文件添加SPARK_CLASSPATH:xxxxxxxx）　　5、配置好环境变量后就可以在spark的根目录下使用./run脚本运行你的程序了例如：./run spark.examples.SparkPi spark://masterIP:port注意，如果程序涉及IO操作起默认路径为SPARK_HOME；至于如何修改这个路径，有待研究

2021-12-06 21:44:06

赞同展开评论

问答分类：

分布式计算 Spark

问答标签：

apache spark程序 apache spark运行 apache spark如何运行程序

问答地址：

开发者社区 > 大数据 > 问答

相关问答

E-MapReduce开启使用DLF统一元数据后本地开发spark程序想访问emr hive中...

97

0

0

在大数据计算MaxCompute中，云下的spark程序如何才能访问oss外表数据呢？

203

2

0

DataWorks 运行spark节点，程序logger日志无法展示

109

0

0

Dataworks运行scala-spark程序一直不动？

153

1

0

在表格存储中spark写入ots程序没有报错，但是为什么查询ots的时候，发现没有数据？

163

2

0

MaxCompute中spark程序里查询和处理的数据量有限制吗？

175

3

0

大数据计算MaxCompute在spark程序里面操作表数据，应该一次查询多少条 ?

107

1

0

大数据计算MaxCompute spark 程序里如何访问redis?

122

2

0

大数据计算MaxCompute通过spark程序访问lindorm，连接不成功是什么原因呢？

121

1

0

dataworks里的spark程序连接数据源，需要开通或者配置什么？

116

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

如何做好SQL质量监控

如何做好SQL质量监控

如何生成大于内存容量的倒排索引？

如何做好SQL质量监控

XXLJOB：超长定时任务慢节点优化实践

还有其他疑问?