Zeepelin_安装_上传| 学习笔记

简介: 快速学习Zeepelin_安装_上传

开发者学堂课程【2020版大数据实战项目之 DMP 广告系统(第七阶段)Zeepelin_安装_上传】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/682/detail/11845


Zeepelin_安装_上传

内容介绍:

一、安装

二、上传

 

一、安装

下面介绍 Zeppelin 怎么安装,然后才能进行相应的操作。

本课程讲解如何安装Zeppelin,安装分两个部分,第一部分是处理安装包,要把安装包放到服务器当中,然后在节点当中解压安装包,拷贝到对应的目录当中,这样安装包就处理完成了。处理完安装包之后,要进行相应的配置,配置完成以后要进行启动,这就是安装的步骤。

image.png

因为 Zeppelin 并不是一个框架,也不是集群工具之类的东西,只是一个图形化的工具,只是一个笔记工具,所以它的安装相对来说会简单一些。

下面来看第一步:下载。

直接点击URL,打开 Zeppelin 的官方网站

http://zeppelin.apache.org/),选中 Download,它提供了两个版本的下载。

第一个版本是Binary package with all interpreters

第二个是Binary package with Spark interpreters

image.png

 

Zeppelin 本身按照它的架构来说,他自己就是一个 sever,就是一个 Zeppelin sever,提供了一个网站。在他内部其他的功能是通过各种intepreters,也就是解释器来提供的。

比如说 Zeppelin 自己提供了一个网站的功能,想在这个网站编写笔记也是 sever 所提供的功能,但是想在笔记里面编写 spark 代码,是不可以的,要通过 interpreter,通过外部的去帮我们编写解释器来提供一个 spark 的功能。想连接 hbes,需要下载对应的解释器才能连接 。

第一个下载就是947 MB 的包含了所有的解释器,还有一个只包含了 Spark Python 解释器。

有两个版本,一个会稍微大一点,大概是一个 G 左右,大家可以选择下这个一个 G 的版本。还有一个300 MB的版本,这是基础版,只包括Spark Python。偶尔使用基础版也可以,因为基础版有一些插件,有一些解释器需要大家自己安装,这样就会对工具有一个更深的认识。

不用自己去下载,在spark DMP Files 目录当中已经为大家提供了下载的安装包,只需要使用这个安装包就可以了。

 

二、上传

下载好以后就可以打开shell 窗口,上传内容,选择 Upload to current folder,找到对应的 DMP 的目录,然后找到 Files,找到 Zeppelin 的安装包,点击打开就会上传,大概是300MB。上传的进度在如图所示的位置。

image.png

已经把 Zeppelin 安装包上传到服务器当中了,接下来应该把 mv Zeppelin移动到 export 下的 softwares

移动完成以后,应该进入到 softwares 这个目录当中,把他解压,解压完以后再把解压包放到 export service 下。进入到 export softwares,这个时候可以查看到 Zeppelin 的包已经安装好了。

image.png

接下来直接tar xzvf zeppelin,把它解压出来,解压出来以后等待他的解压。这个时候再去查看已经有 Zeppelin 文件夹了,有了这个文件夹以后 cp - r,拷贝 zeppelin 这个文件夹,拷贝到 export serves 中的 zeppelin

注意不要在后面追加斜杠,追加斜杠以后,它就会在这个目录当中拷贝这样一个zeppelin-0.8.1-bin-netins目录,这样会出现多个目录,是错误的。不是没有创建文件夹,而是名字写错了,所以修改一下名字。

正常情况下可以直接拷贝进去,不需要主动创建这个文件夹。进入到export/servers/Zeppelin,进入到这个目录当中,可以看到整个目录的结构。

image.png

第一个目录是 bin,第二个目录是 confbin 放置一些启动服务器、安装解释器等命令,conf 中放置的都是配置文件。

相关文章
|
SQL 分布式计算 数据可视化
Apache Zeppelin系列教程第一篇——安装和使用
Apache Zeppelin系列教程第一篇——安装和使用
970 0
|
移动开发 监控 小程序
钉钉工作台开放能力建设阶段性总结
工作台的平台化开放能力建设已经走了近3年的时间,包括定制工作台的开放、工作台模板的开放、工作台组件的开放等等。本文主要是对过程中一些关键能力的总结和思考,欢迎交流。工作台的类型工作台作为企业业务数字化的统一门户,是组织用于提升管理效率、实现业务在线的平台。工作台的组织就是钉钉上的组织,针对不同的组织规模,提供了多种类型工作台:角色工作台、行业工作台和自定义工作台。角色工作台是对不同的角色,例如财务
1413 0
钉钉工作台开放能力建设阶段性总结
|
6月前
|
机器学习/深度学习 存储 算法
SMOTE-XGBoost实战:金融风控中欺诈检测的样本不平衡解决方案
本文深入探讨金融支付风控领域中的欺诈检测问题,针对样本不平衡的核心痛点,提出一种基于动态密度SMOTE算法的改进方案,并结合优化后的XGBoost模型实现高性能检测。相比传统方法,本文方案在IEEE-CIS数据集上显著提升Recall(达0.85)和AUC-PR(达0.72),同时控制推理时延在合理范围。文章还详细解析特征工程体系、在线推理优化及动态阈值调整机制,并展望联邦学习与图神经网络等未来方向,为实际业务应用提供全面指导。
388 1
|
6月前
|
机器学习/深度学习 SQL 数据采集
大数据行业权威认证盘点:这些证书让你的简历更受大厂青睐
这些认证不仅能够为求职者提供有力的能力证明,更能帮助HR快速识别符合岗位要求的技术人才。对于希望进入大数据领域的从业者来说,选择适合自身职业规划的认证,将大大提升职业竞争力。
|
iOS开发 开发者
解决 Objective-C 中的 EXC_CRASH (SIGABRT) 错误
在Objective-C开发中,EXC_CRASH (SIGABRT) 是常见的运行时错误。面对此类问题,首先要解析Xcode提供的详细错误信息以定位问题所在。随后,仔细审查相关代码,特别是涉及空对象处理的部分,并考虑增加条件判断。利用断言如`NSAssert`可以帮助检测潜在错误,提前中断程序避免崩溃。此外,采用异常处理机制如`@try`/`@catch`可在异常发生时优雅地捕获并处理错误,避免程序终止。结合使用断点、Xcode调试器及打印调试信息等技术,开发者能够更有效地诊断并修复这类错误。
918 1
Zeppelin安装教程
Zeppelin安装教程
163 1
|
9月前
|
存储 NoSQL 关系型数据库
微服务——MongoDB简介和体系结构
MongoDB是一种开源、高性能的文档型数据库,采用无模式设计,数据结构灵活,以类似JSON的BSON格式存储。它将记录作为文档,由字段和值对组成,支持复杂数据类型及嵌套结构。相比MySQL,MongoDB去除了传统表结构,使用集合(Collection)存储文档,适合处理非结构化和半结构化数据,简化开发并提升扩展性。其架构更灵活,适用于高并发和大数据场景。
565 0
|
网络协议 Java 数据安全/隐私保护
tcp 可以建立多个连接吗?
【10月更文挑战第25天】TCP(传输控制协议)是一种面向连接的、可靠的传输层协议,它在网络通信中起着重要的作用。在 TCP 中,可以建立多个连接,这种特性被称为TCP 连接复用。
|
分布式计算 资源调度 Hadoop
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(二)
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(二)
|
分布式计算 Ubuntu Hadoop
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(一)
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(一)