CIO应该了解的归档基本要素

简介: 在2009年,与近来IT历史不同的是,一些像“用少量的东西做更多的事情”和“成本控制”变得越来越普遍。用少量东西做更多事情的潜在目标之一和控制成本减少了主存储层的存储需求总量。现在,被大家普遍推荐的一个解决方案就是归档。

在2009年,与近来IT历史不同的是,一些像“用少量的东西做更多的事情”和“成本控制”变得越来越普遍。用少量东西做更多事情的潜在目标之一和控制成本减少了主存储层的存储需求总量。现在,被大家普遍推荐的一个解决方案就是归档。可挑战就是这些推荐往往没有解释。

  什么是归档?什么时候你应该应用它?什么是实施的最好方法?这些都是CIO现在面临的问题,这些就是这篇文章要研究的问题。

  什么是归档?

  数据归档就是在二级存储设备上存储非活动数据,如在线磁盘。这些数据是在将来可能需要的信息,因此不能删除他们。可能有合法的原因来保存这些数据,也可能是机构需要,如市场研究或正当的理由也许就像删除它会让人很不舒服。不管怎样,最后的决定是存储而不是将其删除。

  保存数据的问题或者是由于合法原因,或者是“以防万一”,也就是它必须保存在某个地方。如果没有一个有效的归档策略,这就意味着数据会和其他东西一样被保存在同样的地方——主存储。

  对于昂贵的资源来说,在主存储上存储非活动数据是一个巨大的浪费。在主存储之间每GB delta的价钱至少在5到10美元之间甚至最贵形式的归档存储,那是非常大的。另外,主存储旨在快速传输过度过程数据。它基本上不能支持数据恢复法规或在它被写入存储后的几年,不能证实这一系列数据的完整性。这些都是归档存储的重要要求。

  归档目标

  归档第一步是为存储库选择存储平台。这一元素必须是第一步,因为被选择的平台决定策略如何实施。

  传统的磁带被认为是理想的归档媒介。因为它很便宜也容易存储、传输。磁带的问题是它要求特殊的软件访问。它不像在网络上复制到另一个驱动上。对于数据检索和虚拟无数据验证能力也是有限的。

  随着磁盘的价钱逐渐下降,价格便宜的NAS和SATA驱动技术也开始浮出水面。他们比磁带更容易访问,但它同样也有其他挑战,主要是成本和扩展能力。

  磁盘和磁带的缺点导致了基于磁盘的归档系统的开发,像这些来源于Permabit技术。这些系统提供基于NAS存储的访问,成本更高效以及磁带的可扩展性同时包括检索和验证功能。

  归档策略

  一旦归档存储库选好后,这时可以着手开发一个策略程序。第一步是决定数据如何被迁移到平台,第二步是多久迁移一次,最后,如何保护归档。

  如何迁移数据通常是需要深思熟虑的。做这些最简单的事情是通过标准OS命令,迁移这些数据到归档系统。如果归档平台是基于磁盘的归档,这是非常正确的。因为这些系统是简单的另一些网络驱动名,把这些数据手动移到存储库是非常简单的。对于一些自动化操作,一个像Tek-Tool的工具可以用来产生一个列表,并且把这个列表插入移动数据的OS脚本。

  手动迁移程序的好处是它成本是高效的,通常是免费的,并且很快就可以实施。缺点是它不得不手动操作,维护,用户没有目标指导,如文件数据移到哪里了。当一个更规范的数据迁移程序开发出来的时候,它就不再是一个理想的策略。

  这个更规范的程序通常是某种自动数据迁移的形式。这些可以通过Atempo公司或Enigma Software公司的某种特定的归档软件完成。这些软件通常部署一个代理或远程接入你环境中的服务器来决定合适的归档文件。然后迁移这些文件用来归档。大多数应用创建一个透明链,以便用户准确找回这些归档数据。

  在几个月或几周里归档非活动数据,基于软件和磁盘结合的归档允许非常具有挑战性的迁移政策。在不损害用户体验的前提下,它给予主存储最佳的利用率。当用户访问一个归档文件的时候,它正好是用户离开时刻的那点,因为它是磁盘归档,通常不会被注意到性能的减少。大多数调查报告显示真正的活动数据,在90天内windows标注的数据,仅仅以每年3%到5%的速度增长,新的归档可以推迟未来几年的存储购买。

  存储策略的最后一部分是归档自身的保护。很多用户试图像其他备份设备一样备份磁盘归档。这样是不正确的,归档永远不需要被备份。

  对于一个本地磁盘故障的保护,磁盘归档系统有先进的数据保护方案,提供比标准RAID更牢固的保护。同样他们有完整内置数据自身的检查。对于站点故障的保护,磁盘归档解决方案应用可以通过WAN连接复制到另一个站点。这些要求购买一个二级系统,通过实施基于磁盘的归档节省的成本会比不设置这种附加的保护更多。

  没有一个二级系统,归档存储的数据会被全备份备份多次。例如,如果在90天后迁移非活动数据,并且你的备份规则是每周一个完全备份,这就意味着归档的数据将在大约12个全备份中受保护。对于规则的一个简单的改变是由原来的一个月备份一次到一个月以上备份一次意味着归档数据在磁带上也是可用的。

  归档的影响

  基于磁盘的归档策略最快速、最明显的好处是它可以今年或在以下的几年里减少主存储的需求,潜在的节省了IT预算中的存储购买预算。在很多情况下,用户可以释放他们主存储能力的80%,通过重新分配存储,用户实际可以减少存储量进而减少能源消耗。

  最后,一个有效的归档策略可以通过减少80%的备份负载,推迟升级到备份的投资。这些减少可以通过升级到备份到磁盘架构,备份带宽和备份服务器实现。

  在2009年,IT预算趋势和归档的高效性使归档成为一个理想的选择。你能完成这个项目的事实是:提高主存储性能,减少备份windows,增加数据安全性,在当今的经济情况下使它成为一个有价值的项目。

目录
相关文章
|
5天前
|
人工智能 JSON 监控
Claude Code 源码泄露:一份价值亿元的 AI 工程公开课
我以为顶级 AI 产品的护城河是模型。读完这 51.2 万行泄露的源码,我发现自己错了。
4049 12
|
16天前
|
人工智能 JSON 机器人
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
本文带你零成本玩转OpenClaw:学生认证白嫖6个月阿里云服务器,手把手配置飞书机器人、接入免费/高性价比AI模型(NVIDIA/通义),并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿,5分钟完成热点→文章全流程!
11631 136
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
|
4天前
|
人工智能 数据可视化 安全
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
本文详解如何用阿里云Lighthouse一键部署OpenClaw,结合飞书CLI等工具,让AI真正“动手”——自动群发、生成科研日报、整理知识库。核心理念:未来软件应为AI而生,CLI即AI的“手脚”,实现高效、安全、可控的智能自动化。
1419 7
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
|
6天前
|
人工智能 自然语言处理 数据挖掘
零基础30分钟搞定 Claude Code,这一步90%的人直接跳过了
本文直击Claude Code使用痛点,提供零基础30分钟上手指南:强调必须配置“工作上下文”(about-me.md+anti-ai-style.md)、采用Cowork/Code模式、建立标准文件结构、用提问式提示词驱动AI理解→规划→执行。附可复制模板与真实项目启动法,助你将Claude从聊天工具升级为高效执行系统。
|
5天前
|
人工智能 定位技术
Claude Code源码泄露:8大隐藏功能曝光
2026年3月,Anthropic因配置失误致Claude Code超51万行源码泄露,意外促成“被动开源”。代码中藏有8大未发布功能,揭示其向“超级智能体”演进的完整蓝图,引发AI编程领域震动。(239字)
2322 9

热门文章

最新文章