数据感知存储如何洞察业务信息

日期: 2015-06-07 作者:Mike Matchett翻译:张冀川 来源:TechTarget中国 英文

很多人认为IT基础设施很重要,但并没有提供独特的差异化以及竞争价值。但这一切将要发生改变,IT开始在数据中心内部署更多的“数据感知”存储。 当业务人员被问到IT应该做什么以及能够提供什么时,他们可能会列出令人困惑、与基础设施无关的天真想法(假定已经IT满足了最低的服务级别)。由于IT管理者已经成长为业务的服务提供方,因此他们越来越多地关注基础设施究竟为他们服务的系统提供了哪些价值。

最优秀的IT管理者发现仔细观察基础设施能够做什么会“自动”获得增加巨大价值的机会。 就其保存的数据而言,IT存储设施变得越来越智能。大数据处理功能提供了探究之前被忽略数据集的动力。技术资源正在变得更强大—融合成为了基……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

很多人认为IT基础设施很重要,但并没有提供独特的差异化以及竞争价值。但这一切将要发生改变,IT开始在数据中心内部署更多的“数据感知”存储。

当业务人员被问到IT应该做什么以及能够提供什么时,他们可能会列出令人困惑、与基础设施无关的天真想法(假定已经IT满足了最低的服务级别)。由于IT管理者已经成长为业务的服务提供方,因此他们越来越多地关注基础设施究竟为他们服务的系统提供了哪些价值。最优秀的IT管理者发现仔细观察基础设施能够做什么会“自动”获得增加巨大价值的机会。

就其保存的数据而言,IT存储设施变得越来越智能。大数据处理功能提供了探究之前被忽略数据集的动力。技术资源正在变得更强大—融合成为了基础设施层新的流行词—核心存储不仅可以使用闪存以及内存内方式大大提升处理速度,而且可以利用CPU强大的处理能力在本地执行额外的任务。

存储端处理不只是用于加速对延迟敏感的财务应用,元数据分析可以帮助IT创造新的有价值的数据服务。

过去,元数据主要为确保所有权以及安全访问重要文件提供帮助。面对更多的基于对象的档案,元数据为执行更长期的数据保留策略(至少保留X年,在Y年以后删除)提供了支持。为了解大量的数据,我们必须立刻对其进行处理,这恰恰成为了Hadoop/HDFS scale-out架构的内在驱动力之一。

现在我们的数据正在变得越来越大—对象、文件、版本越来越多,数据集越来越大,架构以及格式上的多样性越来越多,每天都在产生新数据源,IT部门可能会产生并保留更多有关已保存数据的元数据。

新智能存储能够自动创建更多种类的元数据,然后使用这些信息直接提供智能、快速以及高效的数据服务。目前某些存储产品提供了:

  • 细粒度的QoS。主机系统能够在对象/文件级提供特定的元数据,为确保IT存储基础设施(比如,阵列、存储网络等等)各自交付不同的性能级别提供指导。例如Oracle的FS1阵列具备QoS动态分层功能,可以追踪哪些数据位能够优先获得服务以及文件级的闪存加速。具有上述详细信息,Oracle数据库的重要文件以及应用能够有效并自动获得最优的存储服务,确保数据库性能达到最佳。
  • 细粒度的数据保护。元数据还为细粒度数据保护提供了保证。例如,在虚拟环境中不断发展的应用感知范例能够在虚拟机级别配置进行存储配置。如果存储阵列支持hypervisor的API(比如Tintri、VMware VVols),存储可以使用元数据提供并实施基于虚拟机的存储策略,比如最小的RAID类型或者要求的副本数目。
  • 内容索引与查询。针对海量非结构化文本数据,在元数据库中建立内容索引以提供强大的查询功能使你能够发现数据的价值,否则只是占用了大量的存储空间而已。过去主动归档存储只能够查找老化的静态数据,但现在建立索引后就像是将其加载到了主存储当中。示例包括Tarmin GridBank,不需要开发任何特定的应用,在大数据存储中加入了搜索引擎比如Lucene/Solr。
  • 社交媒体分析。元数据可以用于追踪哪个用户访问或者编辑了哪些数据。用户能够发现组织内哪些人对特定的内容感兴趣,查找团队协作模式,或者基于其他用户已经访问的内容提供推荐功能。例如DataGravity的存储使用高可用的备控制器基于元数据对用户/使用情况进行分析。
  • 活动容量及利用率管理。当元数据统计数据包括资源利用率指标、客户文件操作、IOPS以及其他存储管理指标时,IT管理员就能够对存储基础设施的动态行为进行深入分析。例如,Qumulo允许管理员查看存储系统在文件级别正在执行的操作。这使查看哪些文件以及目录在不同时间是否为热点以及哪些客户端正在访问数十亿文件中的哪些文件变成了现实。
  • 分析及机器学习。现代存储阵列的计算能力不断增强,数据处理以及分析任务可以直接在阵列内完成。如上所述,驱动Hadoop以及HDFS的想法是在本地并行处理大数据集。数据感知存储技术将统计分析乃至机器学习广泛应用于存储基础设施中,通过将数据存储在正确的位置,像查询、高级元数据提取以及转换功能将允许用户自动分类、转换、存储、可视化并生成数据报表。在未来,数据甚至能够告诉你那么我们需要做什么。

元数据能够为将基础设施实现智能化提供帮助。基础设施能够更多地感知数据,而且从某种意义上说,自我感知有助于我们继续凌驾于挑战和变化之上。IT盲目存储大量数据只是一个愚蠢的游戏,数据真正的价值收集的越多,我们能够获得的信息也就越多。

作者

Mike Matchett
Mike Matchett

Mike Matchett is a senior analyst and consultant at Taneja Group.

翻译

张冀川
张冀川

TechTarget中国特约专家,任职于某国企信息中心,负责数据中心硬件基础设施及信息系统运维管理工作,对虚拟化及云计算技术有浓厚兴趣,并在工作中积极应用