Linux虚拟化技术分析(上)

日期: 2009-03-17 作者:M. Tim Jones 来源:TechTarget中国 英文

  虚拟化的含义丰富,应用广泛。服务器虚拟化是目前一个主要的虚拟化技术,即在一个宿主计算机上提供多个独立操作系统。本文将探索虚拟化背后的思想,然后讨论实现虚拟化的一些技术。我们还将了解现有的其他一些虚拟化技术,例如Linux上操作系统的虚拟化。

  进行虚拟化就是要将某种形式的东西以另外一种形式呈现出来。对计算机进行虚拟化就是要将计算机以多台计算机或一台完全不同的计算机的形式呈现出来。

  虚拟化也可以将多台计算机组合成一台计算机的形式呈现出来。这通常称为服务器聚合或网格计算。

  下面让我们首先来看一下虚拟化的起源。

  虚拟化的历史

  虚拟化并不是什么新主题;实际上,它的存在已经超过40年了。虚拟化技术最早的一些用法包括IBM 7044、麻省理工学院(MIT)在IBM 704上开发的CTSS(Compatible Time Sharing System)以及曼彻斯特大学的Atlas项目(世界上最早的超级计算机之一),这些都是请求页面调度和监管进程调用的先驱。

  硬件虚拟化

  IBM早在20世纪60年代开发System/360 Model 67大型机时就认识到了虚拟化的重要性。Model 67通过VMM(Virtual Machine Monitor)对所有的硬件接口都进行了虚拟化。在早期计算中,操作系统被称为supervisor。能够在其他操作系统上运行的操作系统被称为hypervisor(这个术语是在20世纪70年代出现的)。

  VMM可以直接在底层硬件上运行,允许运行多个虚拟机(VM)。每个VM都可以运行一个自己私有操作系统的实例——在早些时候,这称为CMS(或 Conversational Monitor System)。之后VM继续发展,现在您可以在System z9大型机上发现VM。这提供了很好的向后兼容性,甚至是对System/360产品线的兼容性。

  处理器虚拟化

  虚拟化早期的另外一种用法(在本例中是对处理器的仿真)是 P-code(或伪码)机。P-code是一种机器语言,运行于虚拟机而不是实际硬件。P-code早在20世纪70年代就已在加州大学圣地亚哥分校(UCSD)Pascal系统上颇有名气了,它将Pascal程序编译成 P-code,然后在一个P-code虚拟机上运行。这就使P-code程序具有了高度的可移植性,而且,只要有可用的P-code虚拟机,P-code程序就可以运行。

  20世纪60年代对BCPL(Basic Combined Programming Language)的设计中也采用了相同的概念,C语言即由BCPL发展而来。在这种用法中,编译器会将BCPL代码编译成称为O-code的中间机器代码。接下来的第二个步骤是将O-code编译成目标机器的原始语言。现代编译器所使用的这种模型为将编译器移植到新目标体系结构上提供了很大的灵活性(通过一种中间语言将前端和后端分隔开来)。

  指令集虚拟化

  虚拟化最新的发展称为指令集虚拟化,或者二进制转换。在这种模型中,虚拟指令集被转换成底层硬件的物理指令集,这个过程通常都是动态的。当代码执行时,就会对代码的某个段进行转换。如果出现分支情况,就会导入新代码集并进行转换。这使它与缓存操作非常类似,后者是将指令块从内存移动到本地快速缓存中执行。

  这种模型最近在Transmeta设计的Crusoe中央处理单元(CPU)中得到了使用。二进制转换由Code Morphing的专利技术实现。类似的一个例子是完全虚拟化解决方案通过运行时代码扫描来查找和重定向特权指令(用来解决特定处理器指令集的一些问题)。

  虚拟化的类型

  实现虚拟化的方法不止一种。实际上,有几种方法都可以通过不同层次的抽象来实现相同的结果。本节将介绍Linux中常用的3种虚拟化方法,以及它们相应的优缺点。业界有时会使用不同的术语来描述相同的虚拟化方法。本文中使用的是最常用的术语,同时给出了其他术语以供参考。

  硬件仿真

  毫无疑问,最复杂的虚拟化实现技术就是硬件仿真。在这种方法中,可以在宿主系统上创建一个硬件VM来仿真所想要的硬件,如图1所示。

硬件仿真

  图1. 硬件仿真使用VM来模拟所需要的硬件

  正如您所能预见的一样,使用硬件仿真的主要问题是速度会非常慢。由于每条指令都必须在底层硬件上进行仿真,因此速度减慢100倍的情况也并不稀奇。若要实现高度保真的仿真,包括周期精度、所仿真的CPU管道以及缓存行为,实际速度差距甚至可能会达到1000倍之多。

  硬件仿真也有自己的优点。例如,使用硬件仿真,您可以在一个 ARM 处理器主机上运行为PowerPC设计的操作系统,而不需要任何修改。您甚至可以运行多个虚拟机,每个虚拟器仿真一个不同的处理器。

  完全虚拟化

  完全虚拟化(full virtualization),也称为原始虚拟化,是另外一种虚拟化方法。这种模型使用一个虚拟机,它在客户操作系统和原始硬件之间进行协调(参见图 2)。“协调”在这里是一个关键,因为VMM在客户操作系统和裸硬件之间提供协调。特定受保护的指令必须被捕获下来并在hypervisor中进行处理,因为这些底层硬件并不由操作系统所拥有,而是由操作系统通过hypervisor共享。

完全虚拟化

  图2. 完全虚拟化使用hypervisor来共享底层硬件

  虽然完全虚拟化的速度比硬件仿真的速度要快,但是其性能要低于裸硬件,因为中间经过了hypervisor的协调过程。完全虚拟化的最大优点是操作系统无需任何修改就可以直接运行。惟一的限制是操作系统必须要支持底层硬件(例如PowerPC)。

  超虚拟化

  超虚拟化(paravirtualization)是另外一种流行的虚拟化技术,它与完全虚拟化有一些类似。这种方法使用了一个hypervisor来实现对底层硬件的共享访问,还将与虚拟化有关的代码集成到了操作系统本身中(参见图3)。这种方法不再需要重新编译或捕获特权指令,因为操作系统本身在虚拟化进程中会相互紧密协作。

客户操作系统

  图3. 超虚拟化与客户操作系统共享进程

  正如前面介绍的一样,超虚拟化技术需要为hypervisor修改客户操作系统,这是它的一个缺点。但是超虚拟化提供了与未经虚拟化的系统相接近的性能。与完全虚拟化类似,超虚拟化技术可以同时支持多个不同的操作系统。

  操作系统级的虚拟化

  我们要介绍的最后一种技术是操作系统级的虚拟化,它使用的技术与前面所介绍的有所不同。这种技术在操作系统本身之上实现服务器的虚拟化。这种方法支持单个操作系统,并可以将独立的服务器相互简单地隔离开来(参见图4)。

 操作系统

  图4. 操作系统级虚拟化实现服务器的隔离

  操作系统级的虚拟化要求对操作系统的内核进行一些修改,但是其优点是可以获得原始性能。

  在本文的下半部分中,我们将介绍为什么虚拟化那么重要以及对完全虚拟化的硬件支持。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐