文档备案控制台

开发者社区问答正文

hadoop中从上传数据到分布式集群的操作意义和源代码分别是什么？

hadoop中从上传数据到分布式集群的操作意义和源代码分别是什么？

展开

收起

游客yzrzs5mf6j7yy 2021-12-06 08:13:56 562 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客qzzytmszf3zhq

模型训练和预测之后，必须把预测数据上传到分布式集群，以便后续处理。


  local create_table_sql="
    create table if not exists $target_table_name (
        ......
    )
    partitioned by (pt int)
    row format delimited fields terminated by '\t' 
    lines terminated by '\n' 
    stored as textfile;
  "
  log_info $create_table_sql
  $hive -e "$create_table_sql"

  local upload_sql="load data local inpath '$data_home/$bizdate/$predict_file' into table $target_table_name partition(pt=${bizdate});"
  log_info $upload_sql
  $hive -e "$upload_sql"

2021-12-06 08:14:13

赞同展开评论

问答分类：

分布式计算 Hadoop

问答标签：

分布式代码分布式集群 hadoop集群 hadoop数据 hadoop分布式

问答地址：

开发者社区 > 大数据 > 问答

相关问答

阿里云E-MapReduceJindo DistCp是否支持将数据从Hadoop同步至aws的s3？

242

2

0

在分布式锁管理器DLM中，当集群拓扑发生变更时，leader节点会如何通知其他节点进行锁信息的重建？

208

1

0

集群增删节点时，DLM是如何控制分布式锁的路由和分配的？

210

1

0

在DLM中，当集群出现节点故障时，如何确保分布式锁能够被正常路由和分配？

186

1

0

随着分布式数据仓库集群规模增大，面临的一个主要挑战是什么？

113

1

0

在DLM中，当集群发生节点故障或增删节点时，如何控制分布式锁能够被正常路由和分配？

171

1

0

Docker单机集群对于分布式系统的测试有何好处？

203

1

0

企业级分布式应用服务EDAS是否支持容器服务K8s集群和Serverless K8s集群的混合...

177

1

0

QuickBI是否支持分布式集群

182

1

0

GlusterFS 分布式文件系统跟Hadoop的hdfs性能和安全性方面的优劣各是什么?

213

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

我用qoder 和 codex+deepseek 及claude + qwen 3.7同时解题目

阿里云服务器多少钱一年？支持40个连接的配置

阿里云服务器多少钱一年企业用？公司用什么配置？

阿里云服务器多少钱一年？企业用的配置费用价格

阿里云服务器多少钱一年？学生用的配置价格

相关文章

Quick BI使用案例29：MaxCompute含JSON字段表同步失败解决方案

从问题库到AI回答样本：数据清洗与指标聚合流程

阿里云人工智能平台PAI对接完全指南：从入门到生产级部署

从原始AI回答到可分析指标：数据清洗与口径统一流程

2026免费BI产品选择指南，真实测评与推荐

相关解决方案

更多

基于数据闪回，快速恢复数据

零代码微调，打造领域专属大模型

海量异构数据预处理破局之道

高效存储和处理多媒体数据

泛时序数据一站式分析与洞察

还有其他疑问?