Gartner指出,2013年,大数据是影响信息架构的最重要的技术趋势之一。“信息的数量、生成速度和种类都在不断增加,而且那些未被治理和未得到充分利用的信息中蕴藏着巨大的价值,同时也隐藏着潜在的风险。在这些因素的驱动下,信息管理技术与实践领域的重大创新层出不穷。”
SAPHANA能够帮助企业解决一个非常重要的大数据问题,那就是快速访问和实时分析极其庞大的数据集。这样,企业的管理人员和高管就能以思维般的速度了解自身的业务状况,充分挖掘信息的价值。另外,SAP还发布了SAPReal-TimeDataPlatform(SAPData-baseandDataManagement的前身)。该平台整合了SAPHANA和SAPIQ,以及其他SAP技术和非SAP技术,特别是Hadoop,其中Hadoop就是本文探讨的对象。SAPReal-TimeDataPlat-form可以用于分析处理和联机事务处理(OLTP)。尽管单独使用时,每项技术也能交付业务价值,但若结合使用,这些技术就能整合、分析和处理企业拥有的所有数据,进而提供更深入的业务洞察,并创造新的业务机会。
为了在众多数据技术中找到最佳的平衡点,解决业务问题,企业必须考虑诸多因素。除了软硬件成本外,企业还必须考虑开发工具、与满足其服务水平相关的运营成本,以及如何落实有关安全性、高可用性、安全备份和数据恢复的各项政策。
这就提出了两个问题,同时也是本文要回答的两个问题:
•在什么情况下,Hadoop是解决业务问题的最佳方案?
•如何将Hadoop与SAP的解决方案及技术结合使用?
这些技术之间存在着许多重大差异。一方面,Hadoop采用商用服务器处理PB级甚至EB级数据,这远远超过了SAPHANA和传统关系数据库管理系统(RDBMS)的处理能力,后者处理的数据规模通常为100TB级或更低。3另一方面,当前Hadoop版本的速度明显比传统的RDBMS和SAPHANA要慢,需要花费数分钟或数小时才能提供分析结果。但是,这些版本能更轻松地处理任意数据结构,而且每TB数据的硬件存储成本通常更低。
这就意味着,Hadoop与SAPHANA不同,它无法支持你以思维般的速度了解业务状况。但是,Hadoop能帮助你以更低的成本存储和访问更多更详细的数据,从而以不同的方式更深入地了解企业的基础数据。
最终,通过将SAPHANA与Hadoop相结合,你能够快速处理真正的大数据。