开发者社区> 问答> 正文

sparksession在操作算子中使用 本地可以正常跑通 但是部署到集群上会报错

各位 我遇到一个问题 sparksession在操作算子中使用 本地可以正常跑通 但是部署到集群上会报错 。哪位大佬给指点一下 方向

image.png

image.png

这种方式 在本地ok 在集群不可以,指定了--master yarn

image.png

我这是在操作算子中使用sparksession 报这个错 玄奎

代码里没有setmaster

我这是main()方法里面声明的 但是我还需要在操作算子里面再声明一个 为了在算子里面使用sparksession

image.png

放外面 操作算子使用 会报空指针异常 sparksession会报空指针

把sparksession广播出去 也不行

image.png

刚刚使用广播的方式 结果 在本地还是可以 集群就不行

本地跑 设置master了, 打包到集群 出现有问题

userTagDataFrame.sparkSession就能拿到session了,不用再创建,再创建是新的,必须指定master

创建一个schame,rdd+schame就是df

image.png

本问题来自阿里云开发者社区的【11大垂直技术领域开发者社群】。https://developer.aliyun.com/article/706511 点击链接欢迎加入感兴趣的技术领域群。

展开
收起
初商 2019-07-31 16:11:13 920 0
0 条回答
写回答
取消 提交回答
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
阿里云分析引擎Spark On 多数据源介绍 立即下载
SparkSQL实践与优化 立即下载
Apache Flink 流式应用中状态的数据结构定义升级 立即下载

相关实验场景

更多