第七章,查阅http://hi.baidu.com/nitar/blog/item/b1a0b828e1f5f2f299250aa9.html
第八章:离线服务组的配置
目标:
离线配置过程:新Cluster
离线配置过程: 已存在Cluster
使用设计的配置工作表
使用离线配置工具增加服务组
解决常见配置错误
测试服务组
离线配置过程:新Cluster
离线配置过程: 已存在Cluster
使用设计的配置工作表
使用离线配置工具增加服务组
解决常见配置错误
测试服务组
离线配置过程:新Cluster-没有服务运行
Stop VCS
停止所有系统上的VCS,确定没有可能有另一个系统管理在你修改main.cf文件的时候正在修改cluster配置
Edit the Configuration File
你必须选择一个系统来修改main.cf文件,你可以选择任何系统,但是你必须先在这系统上启动VCS
Verify the Configuration File Syntax
运行hacf命令来验证在/etc/VRTSvcs/conf/config目录下的main.cf和types.cf文件的语法在你修改他们以后。如果配置文件有错误VCS是无法启动的。
注意:hacf命令仅仅识别语法错误,不能检查配置错误。
Start VCS on the System with the Modified Configuration File
首次使用修改后的main.cf 文件启动VCS,验证VCS
Verify that VCS Is Running
在启动其他系统上的VCS之前,验证已经启动的这个VCS
Start Other System
在第一个系统上运行VCS以后,启动所有系统上面的VCS,如果你不能带起VCS到运行状态在所有系统,则查看“Solving Common Offline Configuration Problems”章节
Stop VCS
停止所有系统上的VCS,确定没有可能有另一个系统管理在你修改main.cf文件的时候正在修改cluster配置
Edit the Configuration File
你必须选择一个系统来修改main.cf文件,你可以选择任何系统,但是你必须先在这系统上启动VCS
Verify the Configuration File Syntax
运行hacf命令来验证在/etc/VRTSvcs/conf/config目录下的main.cf和types.cf文件的语法在你修改他们以后。如果配置文件有错误VCS是无法启动的。
注意:hacf命令仅仅识别语法错误,不能检查配置错误。
Start VCS on the System with the Modified Configuration File
首次使用修改后的main.cf 文件启动VCS,验证VCS
Verify that VCS Is Running
在启动其他系统上的VCS之前,验证已经启动的这个VCS
Start Other System
在第一个系统上运行VCS以后,启动所有系统上面的VCS,如果你不能带起VCS到运行状态在所有系统,则查看“Solving Common Offline Configuration Problems”章节
配置文件举例:
include "types.cf"
cluster vcs (
UserName = {admin = XXXXXXXXXXXXXX }
ClusterAddress = "192.168.27.51"
Administrators = { admin }
CounterInterval = 5
)
include "types.cf"
cluster vcs (
UserName = {admin = XXXXXXXXXXXXXX }
ClusterAddress = "192.168.27.51"
Administrators = { admin }
CounterInterval = 5
)
system S1 (
)
system S2 (
)
)
system S2 (
)
group WebSG (
SystemList = { S1 = 1, S2 = 2 }
AutoStartList = { S1 }
)
SystemList = { S1 = 1, S2 = 2 }
AutoStartList = { S1 }
)
DiskGroup WebDG (
Critical = 0
DiskGroup = WebDG
)
Critical = 0
DiskGroup = WebDG
)
IP WebIP (
Critical = 0
Device = qfe1
Address = "10.10.21.200"
)
Critical = 0
Device = qfe1
Address = "10.10.21.200"
)
Mount WebMount (
Critical = 0
MountPoint = "/Web"
BlockDevice = "/dev/dsk/WebDG/WebVol"
FSType = vxfs
)
Critical = 0
MountPoint = "/Web"
BlockDevice = "/dev/dsk/WebDG/WebVol"
FSType = vxfs
)
NIC WebNIC (
Critical = 0
Device = qfe1
)
Critical = 0
Device = qfe1
)
Process WebProcess (
Critical = 0
PathName = "/bin/ksh"
Arguments = "/sbin/tomcat"
Critical = 0
PathName = "/bin/ksh"
Arguments = "/sbin/tomcat"
)
Volume WebVol (
Critical = 0
Volume = WebVol
DiskGroup = WebDG
)
Critical = 0
Volume = WebVol
DiskGroup = WebDG
)
WebProcess requires WebIP
WebProcess requires WebMount
WebMount requires WebVol
WebVol requires WebDG
WebIP requires WebNIC
WebProcess requires WebMount
WebMount requires WebVol
WebVol requires WebDG
WebIP requires WebNIC
离线配置过程: 已存在Cluster(Part 1)
1. 关闭配置
# haconf -dump -makero
2. 进入配置目录
# cd /etc/VRTSvcs/conf/config
3. 创建工作目录
# mkdir stage
4. 拷贝main.cf和types.cf文件
# cp main.cf types.cf stage
5. 进入工作目录
# cd stage
6. 编辑main.cf
# vi main.cf
7. 验证配置文件语法
# hacf -verify
1. 关闭配置
# haconf -dump -makero
2. 进入配置目录
# cd /etc/VRTSvcs/conf/config
3. 创建工作目录
# mkdir stage
4. 拷贝main.cf和types.cf文件
# cp main.cf types.cf stage
5. 进入工作目录
# cd stage
6. 编辑main.cf
# vi main.cf
7. 验证配置文件语法
# hacf -verify
已存在Cluster(Part 2):重新启动VCS
注意:如果你修改一个已存在的服务组,你首先凝固(freeze)服务组来坚持的防止组之间的故障切换。这种简单的固定资源配置--服务组不会在系统之间切换
1. 停止VCS,留下服务运行
# hastop -all -force
2. 拷贝测试的main.cf文件
# cp main.cf ../main.cf
3. 在这个系统上面启动VCS
# hastart
4. 验证HAD正在运行
# hastartus -sum
5. 在其他系统上启动VCS
# hastart -stale
注意:如果你修改一个已存在的服务组,你首先凝固(freeze)服务组来坚持的防止组之间的故障切换。这种简单的固定资源配置--服务组不会在系统之间切换
1. 停止VCS,留下服务运行
# hastop -all -force
2. 拷贝测试的main.cf文件
# cp main.cf ../main.cf
3. 在这个系统上面启动VCS
# hastart
4. 验证HAD正在运行
# hastartus -sum
5. 在其他系统上启动VCS
# hastart -stale
一个完整的配置文件
注意:你不能在main.cf文件中带有注释行。你看到的带有//是产生通过VCS显示资源关系,任何带有//行都被在VCS起来的时剔除。
注意:你不能在main.cf文件中带有注释行。你看到的带有//是产生通过VCS显示资源关系,任何带有//行都被在VCS起来的时剔除。
离线配置工具:编辑配置文件
作为一个好习惯,拷贝main.cf和types.cf文件到staging目录中在修改之前,这是确保你防止超过一个系统管理员同时的修改配置文件。
你可以用任何文本编辑器来修改main.cf或者types.cf文件,一般在UNIX平台上面使用vi编辑器
作为一个好习惯,拷贝main.cf和types.cf文件到staging目录中在修改之前,这是确保你防止超过一个系统管理员同时的修改配置文件。
你可以用任何文本编辑器来修改main.cf或者types.cf文件,一般在UNIX平台上面使用vi编辑器
使用VCS模拟器来配置和测试
你可以使用VCS模拟器来创建和修改VCS配置文件的拷贝并加载到模拟器指定的目录中。你也可以测试新的或者修改过的配置,并将测试配置文件放入/etc/VRTSvcs/conf/config目录中。模拟器可以确保你配置文件不包含语法错误和比较容易的被引入当手动编辑文件时候。当你完成配置时,你可以拷贝文件到标准的配置目录并重启VCS在cluster系统的内存中构建配置。
你可以使用VCS模拟器来创建和修改VCS配置文件的拷贝并加载到模拟器指定的目录中。你也可以测试新的或者修改过的配置,并将测试配置文件放入/etc/VRTSvcs/conf/config目录中。模拟器可以确保你配置文件不包含语法错误和比较容易的被引入当手动编辑文件时候。当你完成配置时,你可以拷贝文件到标准的配置目录并重启VCS在cluster系统的内存中构建配置。
解决常见配置错误
如果你不按照下面的推荐离线配置流程,会出现2个常见的问题
1. 当你启动VCS因为main.cf文件有语法错误的时候,所有的系统进入一个等待状态
2. 你从错误的系统中启动cluster,并且一个旧的配置还在内存中
如果你不按照下面的推荐离线配置流程,会出现2个常见的问题
1. 当你启动VCS因为main.cf文件有语法错误的时候,所有的系统进入一个等待状态
2. 你从错误的系统中启动cluster,并且一个旧的配置还在内存中
解决第1种问题的方法:
如果所有系统在Stale_Admin_Wait或者Admin_Wait状态
1. 运行hacf -verify dir来验证语法错的那行
2. 在main.cf文件中确定语法问题
3. 验证配置
4. 强制系统来执行一个本地构建(hasys -force sys_name)
5. 等待所有系统执行远端自动建立和验证系统正在运行
如果所有系统在Stale_Admin_Wait或者Admin_Wait状态
1. 运行hacf -verify dir来验证语法错的那行
2. 在main.cf文件中确定语法问题
3. 验证配置
4. 强制系统来执行一个本地构建(hasys -force sys_name)
5. 等待所有系统执行远端自动建立和验证系统正在运行
解决第2种问题的方法:
1. 如果打开,请关闭配置
2. 在所有系统上停止VCS和保持应用运行着
3. 拷贝main.cf.previous文件覆盖main.cf文件
4. 验证配置
5. 使用hastart 命令来启动VCS在这个系统上面
6. 使用hastatus命令来验证VCS正在运行
7. 启动VCS stale在所有其他系统上确保他们等待建立他们的配置文件从第一个系统上
1. 如果打开,请关闭配置
2. 在所有系统上停止VCS和保持应用运行着
3. 拷贝main.cf.previous文件覆盖main.cf文件
4. 验证配置
5. 使用hastart 命令来启动VCS在这个系统上面
6. 使用hastatus命令来验证VCS正在运行
7. 启动VCS stale在所有其他系统上确保他们等待建立他们的配置文件从第一个系统上
测试服务组
带起服务上线,如果成功,测试交换,如果失败,进行故障排除;如果交换成功,则设置适当的Critical属性,测试failover,如果交换失败,则查看Log锁定故障后,再测试交换.
带起服务上线,如果成功,测试交换,如果失败,进行故障排除;如果交换成功,则设置适当的Critical属性,测试failover,如果交换失败,则查看Log锁定故障后,再测试交换.