实施数据虚拟化应避免的十个常见错误
实施数据虚拟化应避免的十个常见错误
数据虚拟化克服硬件和软件复杂性的能力为企业提高IT灵活性和显著节省开支提供了极好的机会。随着越来越多的企业寻求这种好处,数据虚拟化正在迅速从新的想法变成主流的应用。下面是早期应用者常犯的十个错误,希望能够作为一些客观的教训帮助企业加快实现数据虚拟化可能带来的潜在的好处。
错误1:过多地进行虚拟化
数据虚拟化与存储、服务器和应用程序虚拟化类似,提供了极好的利润收益。例如,一家能源公司使用数据虚拟化把实时的油田数据与每天晚上的综合仓储信息结合起来把每天的原油产量提高了数千桶。一家金融公司把新的应用的开发时间减少了50%。同时,另一家金融服务公司每年节省了200万美元的商务智能和报告成本。
然而,数据虚拟化不是每一个数据整合问题的解决方案。例如,当消费应用程序需要从多个角度进行分析的时候,或者当数据在消费之前需要进行重大转变的时候,物理的数据整合是更好的方法。 为了避免对任何具体开发项目过多地进行虚拟化,首先要更好地理解这个业务、数据资源和数据消费者的特点。
错误2:虚拟化不够
第一个错误的反面是虚拟化不够。按常规办事,而不是寻求最佳的方法,是每一个人都做的事情。在90年代,物理数据整合的发展出现了单独的、整合的存储和特殊的ETL(提取、转换和装载)中间件软件。到2000年之后,ETL成为了默认的数据证据整合范例。但是,它应该是唯一的方法吗· 虚拟化不足会增加大量的成本,因为物理的数据整合需要时间更长的解决方案、更昂贵的开发和操作成本和更低的业务和IT灵活性(由于包含额外的开销)。幸运的是,避免这个错误的做法是在数据整合决策过程中认真分析和定义要求,以保证最佳的解决方案满足这些要求,而不是让传统的做法推动这个决策。
错误3:错误混合的机会
在许多情况下,最佳的数据整合解决方案是把虚拟和物理的方法结合起来。没有理由锁定这一种方法或者那一种方法。图2展示了混合使用的例子,并且对这些例子进行了说明。
·物理数据仓储/或者数据集市方案扩展:这是扩展现有的方案的方法,如把当前的操作数据增加到历史库中。
·物理仓储、集市和/或者联合存储:这是把多种物理整合的资源联合在一起的方法,例如合并之后的2个或者3个销售数据集。
·数据仓储和/或者数据集市原型产品:这种方法是推出新的仓储或者数据集市的原型产品,加快早期阶段的实施,从而进入更大规模的商务智能计划,
·数据仓储和/或者数据集市源数据接入:这是向数据仓储和数据集市提供虚拟访问数据源的一个方法,如当前的ETL工具不容易提供技术支持的XML或者包装的应用程序。
·消除数据集市:这是用虚拟的东西消除或者取代物理的数据集市的一种方法,如通过提供方便的和更节省成本的虚拟化选择阻止恶意的数据集市的扩散。
错误4:假定完美的数据是先决条件
糟糕的数据质量是目前企业存在的一个普遍的问题。虽然纠正和完善源数据是最终的目标,但是,我们在物理数据整合的转换和整合阶段清理仓库中数据的时候仍然会留下一些没有处理的数据 当数据质量问题是反应各个系统中的实施细节的简单的格式**问题的时候,数据虚拟化解决方案能够轻松解决这些常见的数据**问题,不会对性能产生任何影像。一些例子包括,在一个源系统中的Part_id字段读作VARCHAR,而同样的字段在另一个源系统中读作INTEGER。或者在一个系统中的销售区与另一个系统中的销售区不匹配。如果需要执行繁重的清理工作,在运行时采用专业的数据质量解决方案通常能够满足业务需求,同时打开数据虚拟化的机会。
错误5:预计对操作系统产生负面影响
虽然操作系统通常是在虚拟化数据时使用的主数据源之一,这些系统的运行时性能一般不是受到影响的结果。因此,设计师一直在物理存储的数据量和每天晚上进行的提取、转换和装载操作的数据吞吐量。当使用虚拟化的方法时,设计人员应该考虑最终解决方案在每一次查询时实际查询的数据量和这些查询实施的频繁程度。如果这些查询相对较小(例如1万行)和查询范围比较广(涉及到多个系统或者表格),或者运行次数不是很频繁(如每天运行几百次),那么,这对操作系统的影像是比较轻的。
系统设计师和架构师预计对操作系统产生负面影像一般是低估了最新的虚拟化解决方案的速度。利用一些时间计算需要的数据负荷有助于避免对操作系统产生潜在的影像的错误判断。
错误6:没有简化问题
当企业数据环境是可以理解的非常复杂的时候,开发复杂的数据虚拟化解决方案通常是不必要的。大多数成功的数据虚拟化项目都分成较小的组件,每一个组件解决整个需求的一部分问题。这种简化可以采用两种方法:利用工具和利用合适的整合组件。 数据虚拟化工具帮助解决数据整合方面的三个基本难题:
1.数据位置:数据位于多个位置和来源。
2.数据结构:数据并不总是处于需要的格式。
3.数据完整性:数据经常需要与其它数据结合在一起才有意义。 数据虚拟化中间件软件能够解决数据位置的难题,方法是让所有的数据好像都来自同一个地方,而不是这些数据实际存储的地方。
数据提取可以简化数据的复杂性,方法是把数据结构和句法转换成为商业解决方案开发人员容易理解和商业解决方案消费的可以重复使用的视图和Web服务。
数据联合把数据结合在一起组成更有意义的商业信息,产生一个客户的单个视图或者一个库存平衡组合服务。
宣宣静静 发表于: 2009-09-24
我要回答相关推荐
-
数据虚拟化帮助企业实现数据整合新方向
管理企业内部数据的IT负责人总是很忧郁,但是,数据虚拟化或许能够帮你一臂之力。本文阐述了数据虚拟化的主要功能等。