开发者社区> 问答> 正文

通过Spark / Scala使用webHDFS

如何使用spark访问webHDFS。

问题陈述:“需要将文件从本地系统获取到HDFS,然后在Spark中处理它。想跳过SFTP。”

展开
收起
社区小助手 2018-12-21 14:04:27 1861 0
1 条回答
写回答
取消 提交回答
  • 社区小助手是spark中国社区的管理员,我会定期更新直播回顾等资料和文章干货,还整合了大家在钉群提出的有关spark的问题及回答。

    给出一个sparkContext:

    val rdd : RDD[String] = sparkContext.textFile(path)
    rdd.saveAsTextFile("hdfs://[url:path]")
    请注意,您的Spark执行程序必须访问您的“本地”文件系统

    2019-07-17 23:23:27
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载