261.关于阿里云PAI产品-模型在线服务(EAS)模块描述正确的是( A )。
A:支持大规模复杂模型的一键部署功能,实时弹性扩缩容,提供完整的运维监控体系
B:面向AI开发者的云端机器学习交互式开发IDE,包含Jupyterlab, VScode及Terminal
C:基于PAI平台能力孵化的垂直领域解决方案集合
D:提供包括数据集、模型、代码配置、实验对照组等核心AI资产的管理能力
解析:AI资产管理提供包括数据集、模型、代码配置、实验对照组等核心AI资产的管理能力。交互式建模(DSW)面向AI开发者的云端机器学习交互式开发IDE,包含Jupyterlab, VScode及Terminal。AI行业插件基于PAI平台能力孵化的垂直领域解决方案集合,方便直接应用。
262.Quick BI数据可视化分析平台的优势有?( ACE )
A:快速搭建数据门户
B:拖拽式数据建模和可视化分析
C:智能数据分析和交互
D:专为云上用户量身打造的新一代智能BI服务平台
E:强大的Quick数据引擎
解析:Quick BI的优势是:
1、强大的Quick数据引擎
2、快速搭建数据门户
3、智能数据分析和交互
4、安全管控数据权限
263.HBase是一个分布式的、面向列的开源数据库,关于HBase的特点,描述正确的是?(ABD)
A:高可靠
B:高性能
C:高精度
D:可伸缩
解析:HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩、 实时读写的分布式数据库
264.下列关于Hadoop生态组件Sqoop的概述,正确描述是什么?(BC)
A:用于分布式应用的高性能协调服务
B:是一款用于在Hadoop和关系数据库服务器之间传输数据的工具
C:是一种用于在HDFS和RDMS之间传输数据的工具
D:是一种支持Apache Hadoop集群的安装、部署、配置和管理的工具
E:是大数据集日志收集的框架
解析:Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递; Sqoop是一个用于在Hadoop和关系数据库服务器之间传输数据的工具。它用于从关系数据库(如MySQL,Oracle)导入数据到Hadoop HDFS,并从Hadoop文件系统导出到关系数据库。 Oozie功能框架:基于工作流引擎的开源框架,是由Cloudera公司贡献给Apache的,它能提供对Hadoop MapReduce和Pig Jobs的任务调度与协调。
265.Pig是Hadoop生态圈的组件之一,关于Pig,描述错误的是?( D )
A:Pig是一个基于Hadoop的大规模数据分析平台
B:Pig是一个用于并行计算的高级数据流语言和执行框架
C:Pig有一套和SQL类似的执行语句,处理的对象是HDFS上的文件
D:Pig的数据处理语言采取分布式消息订阅发布方式
解析:Pig的数据处理语言是数据流方式的,一步一步的进行处理; 数据处理语言采取分布式消息订阅发布方式描述的是Kafka消息队列的功能
266.Zookeeper组件主要负责HMaster、RegionServer、Region的地址信息,以下选项中关于Zookeeper组件说法正确的是?( D )
A:日志
B:管理者
C:客户端
D:协调服务
解析:ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。
267.需要开通阿里云DataWorks服务的正确步骤是( A )。
A:注册账号一购买MaxCompute资源一创建工作空间一创建子账号分配权限(可选)一添加项目组成员
B:注册账号一购买MaxCompute资源一创建子账号分配权限(可选)一创建工作空间一添加项目组成员
C:注册账号一添加项目组成员一购买MaxCompute资源一创建工作空间一创建子账号分配权限(可选)
D:注册账号一购买MaxCompute资源一添加项目组成员一创建工作空间一创建子账号分配权限(可选)
268.下列选项中,NoSQL分类中常见的键值数据库有哪些( D )。
A:MongoDB
B:MySQL
C:Cassandra
D:Redis
解析:流行的键值数据库包括Riak、Redis(由于可以存储集合、列表等,也称为数据结构服务器)、Memcached等。
269.Sqoop可以将数据从Hadoop导出到哪些数据库中?( D )
A:Oracle
B:Memcache
C:MongoDB
D:MySQL
解析:使用Sqoop可以将数据从关系型数据库管理系统(如MySQL)中导出到Hadoop系统(如HDFS、Hive、HBase)中。反之亦可。
270.Databricks数据洞察的特点有哪些? (ABC)
A:高效稳定
B:批流一体
C:协同分析
D:数据隔离
解析:高效稳定、流批一体、协同分析、数据共享。
链接:https://help.aliyun.com/document_detail/169125.html
高效稳定 产品内核使用Databricks商业版的Runtime和Delta Lake。与社区版Spark和Delta Lake相比,在功能和性能上都有明显的优势。 批流一体 在实际的业务场景中,往往既有批处理的需求,也有流式计算的需求。您不仅需要清楚地划分批流两种作业,还需要分别进行开发。Databricks Delta Lake可以使用一套API接口同时处理批作业和流作业,达到事半功倍的效果。 协同分析 数据洞察Notebook为大数据分析提供了可视化、交互式的平台。用户可以在Notebook中编辑、执行、查看Spark作业。不同角色的用户可以共享集群资源和Notebook内容,协同合作。
数据共享 Databricks数据洞察采用数据湖分析的架构设计,使用阿里云对象存储服务(OSS)为核心存储,直接读取分析OSS的数据,无需对数据做二次迁移,实现数据在多引擎之间的共享。