HP DL380 GEN10服务器报阵列卡1716Slot 0 Drive Array

HP DL 3 80GNE 10 服务器 10槽位硬盘故障,厂商更换硬盘后同步数据完成, 但 ilo 中查看相关硬件健康状态完全正常,重启自检发现 1716-Slot 0 Drive Array 报错,同时 F10 重启进入做 Raid 界面,发现阵列上出现一个 金色感叹号 !此报错来自非硬件层,属于阵列出现 逻辑块错,该错误无法修复;解决此问题方法是:只能通过删除现有阵列后重新创建阵列;


由于该设备安装Esxi7.0.3,系统中有几十个业务虚拟机,客户需要保留数据,于是尝试以下方案测试:

方案一:通过登录Esxi系统将虚拟机导出至本地

           导出报网络错误:当导出vmdk文件时则进展到600M后自动报网络错误终止导出,但实际网络没问题,完全可以正常访问;

           问题分析1:由于vmdk文件至少5G以上,根据数据量的大小每个vmdk大小不同,出现导出大文件失败联想到交换机是否做了限制大文件下载策略导致;因此尝试采取不再通过生产网交换机,选择使用直连服务器业务端口,再尝试导出问题依旧,期间尝试换了多个浏览器及重启服务器后再次导出均失败;


方案二:更换网卡、阵列卡及升级服务器相关固件

             更换网卡及升级服务器相关固件,问题依旧;


方案三:通过Esxi底层去拷贝数据

        尝试进入esxi底层,直接采用cp方式将整个虚拟机全部拷贝到,其他存储,此发现读取文件错误,输入输出错导致无法进行拷贝,因此以失败而告终;


总结:

      1716-Slot 0 Drive Array 报错, F10重启进入做 Raid界面,阵列上出现 一个 金色感叹号 !若不能修复阵列逻辑坏块,则无法保留数据,只能重新做Raid,重新部署(或从备件节点克隆或导出虚拟机后导入到重新做阵列的节点中配置即可)