产品推荐

海瑞思Preciset机房空调
海瑞思Precise系列专为中小型机房设计的机房专用空调Precise...【详细】
MPS 10-100 kVA UPS
MPS系列UPS设备确保任何类型的负载,最大限度的保护和电能质...【详细】

联系我们

服务热线
010-62104284

地址:北京市海淀区知春路豪景大厦B座十层
鲁文: 13520099504
Q Q:514468705/1049705527
邮箱:jhcxkj@163.com

澳门新葡新京在线 > 新闻中心 > 机房专用空调组织如何管理PB级数据?

机房专用空调组织如何管理PB级数据?

双击自动滚屏 发布者:精密空调 发布时间:2018-09-04 10:38:53 阅读:次【字体:
机房专用空调组织如何管理PB级数据?

众所周知,处理PB级数据要比处理TB级数据要难的多。而假如处理不当,可能会为组织带来很大的丢掉,更糟糕的是假如主导数据丢掉,甚至可以让组织可能丢掉上百万美元。关于TB级数据,组织可以疏忽或选用暴力破解技术,而这在处理PB级数据时将会成为不可逾越的阻碍。处理这一等级数据的关键是了解所面临的阻碍是什么,并以专心的处理方法为他们做好预备。

许多数据中心面临的最大应战对错结构化数据的极大增加。尽管结构化数据在以前10至20年间有所增加,但在以前几年中,非结构化数据的来历以及人们运用所述数据的才能现已明显增加。非结构化数据处理面临的应战之一是,一般很难判定何时删去它。

例如,从以往的会计年度选择全部财务记载,将其归档并从主存储系统中删去对错常简略的。用非结构化数据来做这个并不是那么简略。会计所面临的其间一个应战对错结构化数据一般由无数人具有的,而不是一个共同的应用程序。

组织的业务环境中可能存在数千个用户和数百个应用程序,用于创建非结构化数据,并且当一条非结构化数据变得有用时,一般对此并不清楚,因此没有人想要删去任何内容。短少具体的问责制导致大部分数据处于非活动情况,而这与数据占用空间无关。只需组织依托数据创建者来辨认和搬家那些陈腐的和未运用的数据,那么非活动数据将始终是一个问题。

当人们检查备份系统的问题,主存储系统日益胀大的问题就会变得更加令人重视。因为大多数备份系统都处理全部非结构化数据,因此都会运用相同的战略来备份非常重要的数据和非活动数据。因为数据是混合的,所以根柢无法处理全部数据。许多人每周进行全面备份,然后进行每日增量备份,保存至少六个月,或许可能是一年或更长时间。

假如保存至少90天的每周无缺备份,就会看到12份无人重视的数据副本。假如存储该数据的现场和非现场副本,就会检查到该数据的24个副本,其间大部分对错活动的。关于一个2TB的组织数据来说,这将会存储48TB的数据,当然许多数据是可处理的。而这种存储的作业数据,48TB数据大约选用十几个磁带介质或硬盘驱动器进行存储。但关于1PB客户来说,每年24,000TB的数据或大约选用6000个存储介质进行存储。

存储在备份系统上的非活动数据的额外副本会发作许多不必要的结果。假如组织正在运用磁盘存储,则此数据的存储和仿制具有与之相关的本钱。假如组织的存储不运用重复数据删去,那么存储这些额外的数据副本的本钱可能是个天文数字。假如组织运用重复数据删去技术,这些本钱将会有点混杂。尽管组织的重复数据删去存储系统可以在存储一个副本的空间中存储20个副本,但是这些会收取必定费用,此外组织还需为额外的存储空间付费,只是以不同的方法付出。有些人这么说:重复数据删去系统使1TB存储看起来像20TB的存储空间,但是它们只收取10TB的存储空间。这意味着他们现已弄清楚怎样收取10TB的存储空间的费用,而供给的却是1TB的存储空间。

在备份系统中运用重复数据删去的大多数组织也在方程式的政策端履行,这意味着对非活动数据的重复彻底备份仍会在备份客户端发作问题。彻底备份对正在备份的系统和发送备份的网络具有功用方面影响,因此,重复的非活动数据的彻底备份会使组织的花费更多,因为需求购买更健壮的服务器和更快的网络。

在数据恢复过程中也会呈现备份非活动数据的应战。考虑一个具有PB级数据的数据中心的场景,其间900TB数据是活动的。恢复1PB的数据是一项严峻的任务,需求恰当长的时间。梦想一下,假如只需求恢复组织实践运用的100TB数据,那么这种恢复是不是要快得多?

用户从不删去任何东西所带来的另一个应战是,的确正需求的时分很难找到任何东西。这使全部的存储数据就是像屋子里放满杂物的抽屉,很难找到想要找的东西。就会发现不再运用的手机充电器,回形针,旧电池,发夹等杂畅所欲言,什么都有,但就没有所要找的东西。主存储系统也选用这种相同的方法,因此当填充大多数不活动的数据时,很难找到活动的数据文件。

此外,即使一个用户在笔记本电脑中企图查找文件也会存在这个问题。梦想一下,当人们议论数千个用户和PB级数据时,这个问题是多么的巨大。这可以导致重要的文件丢掉,使它们质上毫无价值。结果是用户将重复他们的极力,偏重新创建文件,因此这让非结构化数据问题的增加变得更加糟糕。

具有PB级数据的规划更大的企业同样也存在这样的问题,他们一般面临不同的用户在多个方位创建和运用不同的文件中的问题。他们可能希望可以共享一些数据,但是关所以PB级数据来说,这是恰当困难的。这也加剧了“废物抽屉”问题。在废物抽屉里找到什么东西很难,但假如不判定在哪个废物抽屉来找时,那就更难了。

招认宽和决非结构化数据问题

处理非结构化数据问题的仅有方法就是招认它的存在。招认在大环境中很难找到文件,甚至更难同享。招认核算、网络和存储资源的很大一部分用于存储、仿制和备份非活动数据。

处理这些问题的一个方法是创建一个全局共同的文件系统,将全部上述问题考虑在内。这并不能处理用户创建数百万个文件并将它们永久留在那里的问题,但它至少把问题放在一个可以会合处理和处理问题的保护伞下。呈现一次问题,就处理一次,而不是在企业中屡次处理这些问题。

是吊销存档的时分吗?

规划这么大的文件系统应该通过高档元数据进行集成查找。用户可以通过许多不同的元数据轻松地查找,以便找到他们正在处理的文件。他们当然会持续具有一般运用的文件系统语义,使它们可以创建目录或子目录来帮忙他们拾掇他们的文件。具有联合查找的单个文件系统还将容许他们查找其他人正在处理与他们感兴趣的元数据相匹配的文件。

最重要的是,为处理这个问题而规划的文件系统有必要了解活动和非活动的数据,它有必要以不同的方法处理。最明显的做法是主动辨认并将非活动数据搬家到本钱更低的自我保护方针存储。这将处理上述一些问题,包括在主存储和备份存储中的空间糟蹋。了解活动和非活动数据之间的差异的文件系统也有助于更简略地查找文件,因为这是可以用于查找的元数据之一。

一个单一的全局文件系统也可以帮忙世界各地的用户同享数据。多个办公室的用户可以查找同一个全局文件系统,找到他们正在寻找的数据类型,并当即拜访它,假如他们具有恰当的权限的话。因为全局文件系统了解非活动数据的概念,所以查找(假如用户需求的话)也可以包括非活动数据。

将非活动数据搬家到本钱更低的方针存储的简略行为也释放了备份系统的压力。它使备份和恢复更快,因为它们不必处理非活动数据,因此也节省了许多的存储空间。有些人认为存储在自保护方针存储中的数据根柢不需求备份。假如用户决议备份,可以这样做,以辨认其性质,并在备份系统中存储少得多的非活动数据副本。

这个问题现已存在多年。企业如同关于非结构化数据的巴望是永无止境的,IT应用程序开发人员正在开发利用非结构化数据的新方法,使得具有这样的数据更具吸引力。非结构化数据的增加不太可能很快消失,所以用户最好的方法就是处理问题。一个很好的方法是选用一个全局文件系统,用于处理问题,这包括了解元数据以及将非活动数据主动搬家到本钱较低的方针存储。

文章来源:机房专用空调 /

在线咨询 电话咨询
XML 地图 | Sitemap 地图