开发者社区大数据文章正文

spark SQL配置连接Hive Metastore 3.1.2

2022-01-09 1100

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Hive Metastore作为元数据管理中心，支持多种计算引擎的读取操作，例如Flink、Presto、Spark等。本文讲述通过spark SQL配置连接Hive Metastore，并以3.1.2版本为例。

Hive Metastore作为元数据管理中心，支持多种计算引擎的读取操作，例如Flink、Presto、Spark等。本文讲述通过spark SQL配置连接Hive Metastore，并以3.1.2版本为例。

通过Spark连接Hive Metastore，需要准备如下文件：

hive-site.xml
apache-hive-3.1.2-bin
spark-3.0.3-bin-hadoop3.2

在完成下述操作之前，当然首先需要安装并启动hive standalone metastore，并将hive-site.xml文件拷贝到spark的conf目录下。

然后修改conf/spark-default.conf文件，新增如下配置

spark.sql.hive.metastore.version   3.1.2
spark.sql.hive.metastore.jars      /data/apache-hive-3.1.2-bin/lib/*

接着便可启动spark sql

bin/spark-sql

查看databases

show databases;

请添加图片描述

查看hive_storage中的所有表

use hive_storage;

show tables;

请添加图片描述

查看sample_table_1表中的数据

select * from sample_table_1;

请添加图片描述
查看表sample_table_1的详细信息

describe formatted sample_table_1;

请添加图片描述

文章标签：

流计算

分布式计算

SQL

Spark

HIVE

数据管理

关键词：

SQL连接

apache spark SQL

SQL hive

spark Hive

apache spark Hive

从大数据到人工智能

hju6meadphitw

4月前

SQL 开发框架 .NET

ASP.NET连接SQL数据库：详细步骤与最佳实践指南ali01n.xinmi1009fan.com

随着Web开发技术的不断进步，ASP.NET已成为一种非常流行的Web应用程序开发框架。在ASP.NET项目中，我们经常需要与数据库进行交互，特别是SQL数据库。本文将详细介绍如何在ASP.NET项目中连接SQL数据库，并提供最佳实践指南以确保开发过程的稳定性和效率。一、准备工作在开始之前，请确保您

hju6meadphitw

371 3 3

技术小达人

22天前

SQL 分布式计算 Java

Spark SQL向量化执行引擎框架Gluten-Velox在AArch64使能和优化

本文摘自 Arm China的工程师顾煜祺关于“在 Arm 平台上使用 Native 算子库加速 Spark”的分享，主要内容包括以下四个部分： 1.技术背景 2.算子库构成 3.算子操作优化 4.未来工作

技术小达人

49 0 0

1100237741946300

4月前

SQL 数据库索引

SQL语句实现投影连接：方法与技巧详解

在SQL数据库查询中，投影和连接是两个核心概念

1100237741946300

304 2 2

赵渝强老师

3月前

SQL JSON 分布式计算

【赵渝强老师】Spark SQL的数据模型：DataFrame

本文介绍了在Spark SQL中创建DataFrame的三种方法。首先，通过定义case class来创建表结构，然后将CSV文件读入RDD并关联Schema生成DataFrame。其次，使用StructType定义表结构，同样将CSV文件读入RDD并转换为Row对象后创建DataFrame。最后，直接加载带有格式的数据文件（如JSON），通过读取文件内容直接创建DataFrame。每种方法都包含详细的代码示例和解释。

赵渝强老师

72 0 0

1100237741946300

4月前

SQL 数据库索引

SQL语句实现投影连接：技巧与方法详解

在SQL数据库操作中，投影连接（Projection Join）是一种常见的数据查询技术，它结合了投影（Projection）和连接（Join）两种操作

1100237741946300

178 0 0

1100237741946300

4月前

SQL 存储监控

串口调试助手连接SQL数据库的技巧与方法

串口调试助手是电子工程师和软件开发人员常用的工具，它能够帮助用户进行串口通信的调试和数据分析

1100237741946300

105 0 0

1100237741946300

4月前

SQL 数据库索引

内连接（INNER JOIN）在SQL中的简单应用与技巧

在SQL查询中，内连接（INNER JOIN）是一种基本且常用的连接类型，用于从两个或多个表中检索匹配的记录

1100237741946300

495 0 0

Maynor

9月前

SQL 数据采集数据挖掘

大数据行业应用之Hive数据分析航班线路相关的各项指标

Maynor

227 1 1

武子康

4月前

SQL 分布式计算 Java

大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源：JSON、CSV、JDBC、Hive

武子康

100 0 0

1941623231718325

7月前

SQL 分布式计算大数据

大数据处理平台Hive详解

【7月更文挑战第15天】Hive作为基于Hadoop的数据仓库工具，在大数据处理和分析领域发挥着重要作用。通过提供类SQL的查询语言，Hive降低了数据处理的门槛，使得具有SQL背景的开发者可以轻松地处理大规模数据。然而，Hive也存在查询延迟高、表达能力有限等缺点，需要在实际应用中根据具体场景和需求进行选择和优化。

1941623231718325

415 6 6

spark SQL配置连接Hive Metastore 3.1.2

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

spark SQL配置连接Hive Metastore 3.1.2

热门文章

最新文章

相关课程

相关电子书

相关实验场景