为满足关键业务应用对高可用性和资源灵活性的需求,使用两台物理服务器搭建VMware ESXi环境是一个经济高效且可靠的入门级企业虚拟化解决方案,与单台主机相比,双机配置为虚拟机(VM)提供了更强的抗风险能力(避免单点故障)和资源池化的基础,以下将详细介绍从规划到基本集群配置的完整过程。
核心目标与价值
- 高可用性(HA)基础: 当一台物理主机发生硬件故障或计划内维护时,运行在其上的虚拟机可以自动在另一台主机上重启,最大限度减少服务中断时间。
- 资源池化: 将两台主机的计算资源(CPU、内存)整合为一个逻辑池,更灵活地分配给虚拟机。
- 集中管理: 通过vCenter Server统一管理两台主机及其上的虚拟机,提升运维效率。
- 为未来扩展奠基: 此架构是构建更复杂功能(如vSAN、DRS)的基础。
前期规划与硬件准备 (Planning is Key!)
- 硬件兼容性(HCL): 这是成功的关键第一步! 务必访问 VMware 官方网站的 VMware Compatibility Guide,严格检查您选定的服务器型号、CPU、网卡型号(特别是用于vMotion和存储网络的)、RAID卡/HBA卡是否明确列在对应您计划安装的ESXi版本的兼容列表中,不兼容的硬件可能导致安装失败、性能低下或功能不可用。
- 服务器规格:
- CPU: 选择支持硬件虚拟化(Intel VT-x / AMD-V)且兼容ESXi的服务器级CPU,考虑核心数、线程数以满足虚拟机需求,两台主机最好型号相同或非常接近,以确保vMotion兼容性。
- 内存(RAM): ESXi本身需要内存(通常至少8GB,推荐16GB+),加上计划运行的虚拟机所需内存总和,并预留足够余量(至少20%),计划运行总需求80GB内存的VM,每台主机建议配置至少64GB或更高。
- 本地存储: 每台主机需要足够的本地存储(SSD或高速SAS硬盘)用于安装ESXi系统(最小1GB,推荐至少32GB或更多用于日志、暂存空间)以及存放少量虚拟机(如果不用共享存储),强烈建议使用RAID 1 (镜像) 保护ESXi安装盘。
- 网络接口卡(NIC): 至关重要! 每台主机至少需要4个物理网口(推荐6个或更多,使用多端口网卡或主板集成+独立网卡组合):
- 管理网络(Management): 1个端口,用于主机管理通信(ESXi Shell, DCUI, vCenter通信)。
- 虚拟机网络(VM Network): 1-2个端口,承载虚拟机对外业务流量。
- vMotion网络: 1个专用端口(强烈推荐),用于在主机间迁移虚拟机内存状态,需要高速(至少1GbE,强烈推荐10GbE)、低延迟、专用网络(或VLAN隔离)。
- 存储网络: 如果使用共享存储(强烈推荐用于实现真正的HA和灵活迁移),需要1-2个专用端口连接存储设备(iSCSI/NFS)或用于vSAN流量(如果采用vSAN),同样推荐10GbE。
- 共享存储 (强烈推荐): 这是实现无缝vMotion和虚拟机HA的关键组件,虚拟机文件(VMDK)需要存放在共享存储上,这样当一台主机故障时,另一台主机能直接访问这些文件并启动VM,可选方案:
- iSCSI SAN/NAS: 通过以太网连接的标准共享存储方案。
- NFS NAS: 另一种常见的基于文件的共享存储。
- vSAN (需vCenter和特定许可): 利用主机本地磁盘(SSD+HDD或全闪)构建分布式共享存储。注意: 双节点vSAN需要特殊的见证(Witness)组件(可以是另一台物理机、虚拟机或云见证)。
- 网络规划:
- 为管理、vMotion、存储(如果独立)、虚拟机网络等划分不同的VLAN或物理子网,提高安全性和性能。
- 规划好IP地址:为每台主机的管理接口、vMotion接口、存储接口(如果适用)分配静态IP地址,规划vCenter Server的IP地址。
- 软件许可:
- ESXi: 需要有效的VMware ESXi许可证(评估模式有60天限制),即使是免费版ESXi Hypervisor,其功能(如vCenter集成、API调用)也有限制,且不支持集群功能(HA, vMotion),要实现双机集群的核心价值(HA, vMotion),必须购买并应用vSphere Essentials Kit 或 Essentials Plus Kit 或更高版本(如Standard)的许可证,Essentials Kit包含最多3台物理主机的ESXi许可和一台vCenter Server实例(vCenter Server for Essentials)。
- vCenter Server: 是管理集群的核心,需要独立安装和许可(包含在Essentials Kit及以上套件中)。
- 安装介质: 准备好最新稳定版的VMware ESXi ISO镜像文件和VMware vCenter Server Appliance (vCSA) ISO镜像文件(推荐使用vCSA,比Windows版vCenter更易部署和管理)。
部署步骤 (Step-by-Step Implementation)
安装ESXi到每台物理机
- 制作安装介质: 将下载的ESXi ISO文件刻录到USB闪存盘或DVD,常用工具如Rufus (USB)。
- 引导安装:
- 将安装介质插入第一台服务器,开机并从该介质引导。
- 进入ESXi安装程序,选择安装位置(通常是本地RAID卷或SSD)。警告:安装过程会格式化目标磁盘!
- 设置
root
用户的强密码。 - 配置管理网络:
- 选择用于管理的物理网卡(例如
vmnic0
)。 - 分配静态IPv4地址(或DHCP,但生产环境强烈建议静态IP)、子网掩码、默认网关、首选DNS服务器。
- 设置主机名(如
esxi01.yourdomain.com
)。
- 选择用于管理的物理网卡(例如
- 确认安装摘要,开始安装,安装完成后重启服务器。
- 重复以上步骤在第二台物理服务器(
esxi02.yourdomain.com
)上安装ESXi,确保使用不同的主机名和IP地址。
- 初始配置(通过DCUI或Host Client):
- 重启后,在Direct Console User Interface (DCUI – 服务器控制台界面) 或通过浏览器访问
https://<esxi01_ip>
(使用root
和密码登录)进入ESXi Host Client。 - 配置其他网络:
- 创建虚拟交换机(
vSwitch
)和端口组(Port Group
)。vSwitch0
: 承载Management Network
端口组(默认已有)。- 创建
vSwitch1
,添加物理网卡(如vmnic1
)专用于vMotion
,并在其上创建vMotion
端口组,分配IP地址。 - 创建
vSwitch2
,添加物理网卡(如vmnic2, vmnic3
)用于VM Network
,创建VM Network
端口组。 - 如果使用独立存储网络(如iSCSI),创建
vSwitch3
,添加物理网卡(如vmnic4
),创建Storage
端口组并分配IP地址。
- 创建虚拟交换机(
- 配置NTP客户端: 在
管理
->系统
->时间配置
中,添加可靠的NTP服务器地址,确保两台主机时间精确同步(对集群至关重要)。 - 检查许可证: 在
管理
->许可
中,应用购买的vSphere许可证(评估模式可暂时使用)。
- 重启后,在Direct Console User Interface (DCUI – 服务器控制台界面) 或通过浏览器访问
部署与配置vCenter Server
- 部署vCSA (vCenter Server Appliance):
- 挂载vCSA ISO文件到一台可以访问ESXi主机管理网络的计算机(Windows/Linux)。
- 运行安装程序(
vcsa-ui-installer
目录下对应系统的可执行文件)。 - 选择
安装
。 - 接受许可协议。
- 第一阶段部署: 提供目标ESXi主机(
esxi01
或esxi02
)的管理地址、root
凭据,确认证书警告,为vCSA虚拟机设置名称(如vcenter
)和root
密码,选择部署大小(根据环境规模选择,小型环境可选Tiny
或Small
),选择部署位置(目标ESXi主机的存储)。 - 第二阶段配置: 设置vCenter Server实例的:
- SSO (Single Sign-On) 信息: 域名(如
vsphere.local
)、管理员用户名(默认为administrator@vsphere.local
)和强密码。 - 网络设置: 主机名(如
vcenter.yourdomain.com
)、静态IP地址、子网掩码、网关、DNS服务器。确保此主机名能被两台ESXi主机和您的管理电脑解析。 - 确认配置摘要,完成部署,此过程耗时较长。
- SSO (Single Sign-On) 信息: 域名(如
- 登录vCenter: 部署完成后,使用浏览器访问
https://<vcenter_ip或主机名>/vsphere-client
,使用SSO管理员账户(如administrator@vsphere.local
)登录。
创建集群并添加主机
- 创建数据中心: 在vCenter Web Client主页,右键单击您的vCenter Server实例 ->
新建数据中心
,命名(如Primary-DC
)。 - 创建集群:
- 右键单击新建的数据中心 ->
新建集群
。 - 为集群命名(如
Production-Cluster
)。 - 关键配置:
- 打开DRS (Distributed Resource Scheduler): 如果购买了包含DRS的许可(如Essentials Plus或Standard+),可以启用它(设置自动化级别),DRS负责在主机间平衡负载和初始放置。Essentials Kit不包含DRS。
- 打开vSphere HA (High Availability): 这是核心目标! 务必启用HA,配置HA选项(如主机监控、接入控制策略 – 建议选择
为群集功能预留一定的故障切换容量
并设置插槽大小或百分比)。 - EVC (Enhanced vMotion Compatibility): 如果两台主机CPU型号不完全相同(但属于同一代或兼容代),启用EVC并选择适合两主机的最低CPU特性集,确保vMotion兼容。
- vSAN (可选): 如果计划使用vSAN,在此启用并配置。双节点vSAN需要额外配置见证。
- 点击
确定
创建集群。
- 右键单击新建的数据中心 ->
- 添加主机到集群:
- 右键单击新建的集群 ->
添加主机
。 - 输入第一台ESXi主机(
esxi01
)的管理IP地址或主机名、root
用户名和密码。 - 会提示主机证书指纹验证(接受)。
- 查看主机摘要,点击
下一步
。 - 分配许可证: 选择现有的vSphere许可证或输入新许可证密钥分配给此主机。
- 锁定模式(可选): 生产环境建议启用,增强安全性(需通过vCenter管理主机)。
- 虚拟机位置: 选择将主机上的现有虚拟机(如果有)添加到vCenter清单的位置(如直接放在集群下)。
- 确认配置,完成添加。
- 重复以上步骤将第二台ESXi主机(
esxi02
)添加到同一个集群中。
- 右键单击新建的集群 ->
配置共享存储与网络 (如果使用)
- 配置共享存储访问 (iSCSI/NFS示例):
- 在vCenter中,选择集群中的一台主机 ->
配置
->存储
->存储适配器
。 - 找到软件iSCSI适配器(或依赖硬件HBA卡),启用它(如果未启用)。
- 在
动态发现
或静态发现
中添加存储阵列的iSCSI目标服务器IP地址和端口。 - 在
网络
->VMkernel适配器
下,确认用于存储网络的VMkernel适配器(绑定到Storage
端口组)已启用iSCSI
服务(或NFS
服务,如果使用NFS),确保其IP地址在存储网络的正确子网。 - 在
配置
->存储
->设备
下,应能看到存储阵列提供的LUN,将其格式化为VMFS数据存储(或挂载NFS共享)。 - 在另一台主机上重复相同的存储适配器和网络配置,确保两台主机都能看到并访问同一个共享数据存储。
- 在vCenter的集群或数据中心视图下,右键单击新创建的共享数据存储 ->
重命名
(如Shared-Datastore01
)。
- 在vCenter中,选择集群中的一台主机 ->
- 验证vMotion网络:
- 在每台主机的
配置
->网络
->VMkernel适配器
下,检查用于vMotion的VMkernel适配器(绑定到vMotion
端口组)已启用vMotion
服务,且IP配置正确。 - 确保两台主机用于vMotion的网卡通过交换机直接相连或在同一VLAN中,且网络互通(无防火墙阻断)。
- 在每台主机的
验证核心功能
- 测试vMotion:
- 在共享存储上创建一台测试虚拟机。
- 右键单击该虚拟机 ->
迁移
。 - 选择迁移类型
仅更改计算资源
。 - 选择目标主机(另一台ESXi主机)。
- 选择vMotion优先级(默认即可)。
- 点击
完成
开始迁移,观察虚拟机应能在不中断服务的情况下迁移到另一台主机,在近期任务
面板查看状态。
- 测试vSphere HA:
- 确保测试虚拟机正在运行。
- 模拟主机故障:可以直接在物理机上拔掉电源线(谨慎操作!),或在vCenter中断开该主机的连接(右键主机 ->
连接
->断开连接
)。 - 观察:
- vCenter会检测到主机故障(状态变红)。
- HA机制会自动在集群中另一台正常的主机上重启该测试虚拟机。
- 检查虚拟机控制台或服务是否恢复。注意: HA是重启虚拟机,不是实时迁移,会有短暂服务中断(重启时间+应用启动时间)。
关键注意事项与最佳实践
- 备份!备份!备份! ESXi/vCenter配置和虚拟机都需要定期备份,虚拟化环境故障影响范围大,备份是最后的安全网,使用专业的VM备份解决方案(如Veeam Backup & Replication)。
- 网络隔离与安全: 严格隔离管理、vMotion、存储网络(物理或VLAN),配置ESXi主机防火墙规则,仅开放必要的端口,使用强密码并定期更换,启用ESXi主机锁定模式。
- 文档化: 详细记录网络拓扑、IP地址规划、主机配置、存储配置、许可证密钥等。
- 固件与驱动更新: 定期检查并更新服务器BIOS、固件(RAID卡、网卡)和ESXi主机上的VMware驱动(如网卡驱动),确保稳定性和安全性。务必参考VMware HCL和厂商建议。
- 监控: 配置vCenter警报,监控主机CPU、内存、存储、网络使用率及健康状态,也可集成第三方监控工具。
- 理解限制:
- vSphere Essentials (Kit): 提供基础的HA和vMotion(存储vMotion需要共享存储),不包含DRS(自动负载均衡)、vSAN(需额外许可和配置)、高级备份API(影响第三方备份)、REST API等高级功能,最大支持3台物理主机。
- 双节点限制: 两台主机配置HA时,一台故障后,另一台需要承载所有负载,务必确保剩余单台主机的资源足够运行所有关键虚拟机(考虑HA接入控制策略),双节点vSAN配置更复杂且有特殊要求(见证节点)。
- 避免使用RDM直通磁盘: 除非有非常特定的需求(如需要VMware集群的Microsoft Failover Cluster),否则尽量使用VMDK虚拟磁盘文件存放在共享存储上,管理更灵活,兼容性更好。
使用两台物理服务器搭建ESXi环境,结合vCenter Server和共享存储,成功创建集群并启用vSphere HA和vMotion,能显著提升虚拟化环境的可用性和可管理性,为中小型企业或部门级应用提供了一个坚实的虚拟化基础平台,这不仅仅是硬件的堆砌,更是对网络规划、存储配置、软件许可和持续运维管理的系统性实践,严格遵循兼容性要求、细致的规划和实施后的验证测试,是确保环境稳定可靠运行的关键,虚拟化是高可用性的基石,但完善的备份策略才是业务连续性的最终保障。
引用说明 (References & Further Reading):
- VMware Compatibility Guide (HCL):
https://www.vmware.com/resources/compatibility/search.php
(验证硬件兼容性的权威来源 – 必备) - VMware vSphere Documentation Center:
https://docs.vmware.com/en/VMware-vSphere/index.html
(官方最全面、最权威的安装、配置、管理指南) - VMware vSphere Editions Comparison:
https://www.vmware.com/products/vsphere/compare.html
(了解不同版本的功能差异和许可限制) - VMware Knowledge Base (KB):
https://kb.vmware.com/
(查找特定错误、问题解决方案的宝库) - VMware Communities:
https://communities.vmware.com/
(与其他用户和专家交流经验、寻求帮助) - 厂商文档: 服务器硬件厂商(如Dell, HPE, Lenovo)提供的针对其硬件优化ESXi部署的指南和驱动下载页面。
- 存储厂商文档: 共享存储设备厂商提供的关于配置其设备与vSphere集成的具体指南。
原创文章,发布者:酷盾叔,转转请注明出处:https://www.kd.cn/ask/32847.html