认识的误区:Hadoop=云计算

简介: 最近看到清华大学出版社发行的一本新书,《深入浅出云计算》出版时间是2012-10-01日,如图1所示。我以为这是一本科普型读物,是加深读者对云计算的认识的书籍,毕竟云计算覆盖的领域太广了。
最近看到清华大学出版社发行的一本新书,《深入浅出云计算》出版时间是2012-10-01日,如图1所示。我以为这是一本科普型读物,是加深读者对云计算的认识的书籍,毕竟云计算覆盖的领域太广了。



泛读后发现完全不是这么回事。全书基本上都是在讲Hadoop以及Hadoop生态圈里面的相关工具和技术。如图2所示:



我由此联想到前段时间和一些业内人士进行技术交流,一谈到云计算,就说Hadoop怎么样?MapReduce怎么样?而在我看来,这里存在一个认识的误区。

这里我要强调一点:Hadoop≠云计算


云计算目前没有公认的定义,而NIST(美国国家标准与技术研究院)对云计算下的定义相对能得到广泛认可,NIST是这么定义云计算的。
云计算是一种按使用量进行付费的模式,这种模式提供可用的、便捷的、按需的网络访问,使用可配置的计算资源共享池,共享池的资源包括网络、服务器、存储、应用软件、服务等,这些资源能够通过云计算平台快速提供给客户,只需投入很少的管理工作,或与服务供应商进行很少的交互。

云计算是分布式计算、并行计算、网格计算、多核计算、网络存储、虚拟化、负载均衡等传统计算机技术和互联网技术融合发展的产物。借助IaaS、PaaS、SaaS等业务模式,把强大的计算能力提供给终端用户。
云计算被称为是继大型计算机、个人计算机、互联网之后的第四次IT产业革命,它将成为带动IT、物联网、电子商务等诸多产业强劲增长、推动信息产业整体升级的基础。

而Hadoop是Apache基金会下的一款开源软件,它实现了包括分布式文件系统和MapReduce框架在内的云计算软件平台的基础架构,并且在其上整合了包括数据库、云计算管理、数据仓储等一系列平台,其已成为工业界和学术界进行云计算应用和研究的标准平台。
如果对Hadoop进行严格定义,那么Hadoop是一种针对大数据处理和分析的开源分布式计算平台,是一个基于Java的开源软件架构,运行分布的、数据密集型应用。

所以,Hadoop只是云计算的PaaS层的解决方案之一,并不等同于PaaS,更不用说等同于云计算本身了。图3把云计算的交付模式层次做了一个清晰的划分,如下所示:



所以,《深入浅出云计算》犯了一个概念性的错误,把Hadoop等同于云计算,或者说把Hadoop与云计算相提并论,这是不对的。如果把书名改成《深入浅出大数据处理》或者《深入浅出海量书籍处理》,那倒是比较贴切。

目录
相关文章
|
2月前
|
存储 分布式计算 监控
Hadoop在云计算环境下的部署策略
【8月更文第28天】Hadoop是一个开源软件框架,用于分布式存储和处理大规模数据集。随着云计算技术的发展,越来越多的企业开始利用云平台的优势来部署Hadoop集群,以实现更高的可扩展性、可用性和成本效益。本文将探讨如何在公有云、私有云及混合云环境下部署和管理Hadoop集群,并提供具体的部署策略和代码示例。
87 0
|
5月前
|
分布式计算 Hadoop 大数据
【云计算与大数据计算】Hadoop MapReduce实战之统计每个单词出现次数、单词平均长度、Grep(附源码 )
【云计算与大数据计算】Hadoop MapReduce实战之统计每个单词出现次数、单词平均长度、Grep(附源码 )
225 1
|
5月前
|
存储 分布式计算 Hadoop
【云计算与大数据技术】Hadoop MapReduce的讲解(图文解释,超详细必看)
【云计算与大数据技术】Hadoop MapReduce的讲解(图文解释,超详细必看)
281 0
|
5月前
|
分布式计算 并行计算 Hadoop
【云计算与大数据计算】分布式处理CPU多核、MPI并行计算、Hadoop、Spark的简介(超详细)
【云计算与大数据计算】分布式处理CPU多核、MPI并行计算、Hadoop、Spark的简介(超详细)
285 0
|
5月前
|
存储 分布式计算 大数据
【云计算与大数据技术】大数据系统总体架构概述(Hadoop+MapReduce )
【云计算与大数据技术】大数据系统总体架构概述(Hadoop+MapReduce )
349 0
|
分布式计算 并行计算 NoSQL
(超详细)0基础利用python调用Hadoop,云计算3
(超详细)0基础利用python调用Hadoop,云计算
169 0
|
存储 分布式计算 资源调度
(超详细)0基础利用python调用Hadoop,云计算2
(超详细)0基础利用python调用Hadoop,云计算
196 0
|
分布式计算 并行计算 Hadoop
(超详细)0基础利用python调用Hadoop,云计算1
(超详细)0基础利用python调用Hadoop,云计算
154 0
|
分布式计算 Ubuntu Hadoop
Hadoop生态系统中的云计算与容器化技术:Apache Mesos和Docker的应用
Hadoop生态系统中的云计算与容器化技术:Apache Mesos和Docker的应用
|
存储 分布式计算 Hadoop
云计算与大数据实验二 Hadoop的安装和集群的搭建
云计算与大数据实验二 Hadoop的安装和集群的搭建
479 0