现在的位置: 首页 > 综合 > 正文

SQLServer2008镜像实施过程摘要和碰到的问题

2013年02月14日 ⁄ 综合 ⁄ 共 2181字 ⁄ 字号 评论关闭

 

SQLServer2008关于可用性的解决方案

高可用性解决方案:
http://msdn.microsoft.com/zh-cn/library/bb522583(v=sql.105).aspx

镜像解决方案:http://msdn.microsoft.com/zh-cn/library/bb934127(v=sql.105).aspx

几种镜像方案的对比(图片来自:http://www.cnblogs.com/killkill/archive/2008/05/23/1205792.html

(点击图片查看大图)

选择镜像的理由如下:

  1. 选择热备份,就只有三个选择了
  2. 但故障转移集群,一需要做集群,麻烦,二需要共享磁盘,服务器是有双机了,我不想磁盘成为了潜在的单点故障,去年艺龙的宕机也是存储单点故障导致
  3. 镜像可以支持对客户端透明

同时选择了不要见证服务器,高性能模式,避免对数据库性能的影响,当然风险是一旦故障转移,可能对是部分数据有丢失

镜像实施准备和过程

在实施之前做了一份数据库镜像实施计划,大概有1400字,将实施前中后要做到事情明确,论证到位,同时与相关的同事进行讲解,计划大概有以下几个方面的内容

  1. 1、需要做到准备工作
    1. 镜像的前提工作,SQLServer版本一致等
    2. 确保镜像先期测试通过,并整理好使用的镜像sql脚本
    3. 镜像后的数据、日志文件路径等
    4. 设置要镜像的数据为完整模式,并设置完整和日志备份计划
  2. 2、镜像工作
    1. 将需要镜像的数据库都做一个完整备份并回复到镜像服务器
    2. 做某个库的镜像前,备份日志并恢复到镜像服务器
    3. 执行镜像脚本
  3. 3、更新程序配置的连接字符串,以实现镜像对客户端的透明度

镜像实施中碰到的问题

  1. 主体、镜像服务器权限问题,这个问题折腾了两个多小时,很熟悉的错误

     

    服务器网络地址 “TCP://192.168.1.4:5022″无法访问或不存在。请检查网络地址名称,并检查本地和远程端点的端口是否正常运行。
    (Microsoft SQL Server
    ,错误: 1418)

     

    后来在SQLServer日志中看到了如下错误

    Database mirroring connection error 4 ‘An error occurred while receiving data: ’10054(远程主机强迫关闭了一个现有的连接。)’.’
    for ‘TCP://192.168.1.4:5022′.

     

    通过这个错误找到了问题,c:\ProgramData\Microsoft\Crypto\RSA\MachineKeys\没有读写权限,一看真的是这样,加入管理员(即sqlserver的运行用户)的读写权限后一切正常!(如果还不行,配置权限后,再重新配置镜像)

    具体见:http://dba.stackexchange.com/questions/6222/mirroring-problems-after-removing-domain

     

    解决这个问题的经验就是,一定要先通过SQLServer日志和系统日志定位更准备的错误 ,才能快速解决问题

     

  2. 主体服务器备份后,需要拷贝备份文件到镜像服务器,由于文件太大(500G),真慢

    备份、拷贝、恢复的过程占了80%以上的时间

  3. 原本预计是停掉网站来做镜像,实际上不需要,只是尽量在业务低峰期进行就可以了

镜像实施后,可用性的解决办法

准备好镜像手工故障转移到的脚本,主要下面三个语句

都需要指定数据库,在主体服务器上执行

ALTER DATABASE AA SET PARTNER SAFETY FULL; 事务安全,同步模式

ALTER DATABASE AA SET PARTNER FAILOVER; 手动故障转移

ALTER DATABASE AA SET PARTNER SAFETY OFF;事务不安全,异步模式,高性能模式

其他

实施镜像后,数据库的升级就可以采取滚动升级了,如图所示(来自MSDN官方文档,具体链接忘记了)

 

  1. A cryptographic operation failed. This error indicates a serious problem with SQL Server. Check the SQL Server error log and the Windows event logs for further information.
  2. A system cryptographic call failed during a Service Broker or Database Mirroring operation: system error '5(failed to retrieve text for this error. Reason: 15105)'.

Any ideas /Suggestions? I'm getting desperate here!

After days of searching, I found the answer 10 minutes after this post. The problem was that the admin account did not have read/write rights on c:\ProgramData\Microsoft\Crypto\RSA\MachineKeys\ . After changing that I also had to recreate the master keys
and certificates to make it work.

 

抱歉!评论已关闭.