Hadoop的搜索结果_热门_第19页-阿里云开发者社区

涂作权

|

博文

Hive简介、什么是Hive、为什么使用Hive、Hive的特点、Hive架构图、Hive基本组成、Hive与Hadoop的关系、Hive与传统数据库对比、Hive数据存储（来自学习资料）

1.1 Hive简介 1.1.1 什么是Hive Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。 1.1.2 为什么使用Hive Ø 直接使用hadoop所面临的问题人员学习成本太高项目周期要求太短 MapReduce实现复杂查询逻辑开发难度太大 Ø 为什么要使用Hive 操作接口采用类SQ

# SQL # 存储 # 数据库 # HIVE # 索引 # 分布式计算 # Hadoop # 数据格式 # 数据库连接 # Java

业余布道师

|

博文

HBase 2.0.0 META 数据修复工具

HBase 2.0.0 META 数据修复工具分享给那些使用了hbase2.0.0 因其他原因无法升级又被坑的小伙伴们

# 云数据库HBase版 # 存储 # 分布式计算 # Hadoop # 分布式数据库 # Hbase # Java # Shell # Apache

周志湖

|

博文

Spark修炼之道（高级篇）——Spark源码阅读：第三节 Spark Job的提交

前一我们分析了SparkContext的创建，这一节，我们介绍在RDD执行的时候，如何提交job进行分析，同样是下面的源码： import org.apache.spark.{SparkConf, SparkContext} object SparkWordCount{ def main(args: Array[String]) { if (args.leng

# 分布式计算 # Hadoop # Spark

ali清英

|

博文

在Amazon EC2上运行Spark

# 专有网络VPC # 分布式计算 # Hadoop # 开发工具 # Spark # git

胖子哥

|

博文

通过Thrift访问HDFS分布式文件系统的性能瓶颈分析

# 存储 # 移动开发 # 分布式计算 # Hadoop # Apache

程序员小鱼

|

博文

MongoDB、Hbase、Redis等NoSQL优劣势、应用场景

# 云数据库HBase版 # 云数据库 MongoDB 版 # 云数据库 Tair（兼容 Redis） # 云原生大数据计算服务 MaxCompute # Java # 数据库 # NoSQL # MongoDB # 存储 # 分布式数据库 # Redis # Hbase # 分布式计算 # Hadoop

thinktothings

|

博文

Spark 2.4.0 standalone 模式安装

## 技能标签 - 学会安装Spark 2.4.0 standalone模式环境安装 - Spark 集群环境maste，worker,history server 启动停止命令 - Spark master,worker,history server 配置和管理界面查看 - Spark ...

# 分布式计算 # Hadoop # Java # Apache # Spark

轩脉刃

|

博文

如何开发打点统计系统

# 日志服务 # 应用服务中间件 # PHP # 数据库 # nginx # 前端开发 # 流计算 # 分布式计算 # Hadoop

沉默术士

|

博文

沃尔玛如何利用大数据颠覆零售业

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 算法 # 数据挖掘 # 大数据 # Hadoop

citibank

|

博文

hadoop之HDFS源码分析---HDFS通信协议

# 存储 # 缓存 # 分布式计算 # 网络协议 # Hadoop # 安全 # 块存储 # API

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Hadoop