网云科技

标题: RAID被降级~~~ [打印本页]

作者: 2zumys    时间: 2016-3-29 20:03
标题: RAID被降级~~~
DELL PERC6/I4个ST500做的RAID6,前段时间因为种种原因报错,刚把系统重做了一下
进去看发现RAID降级了



更新FW的时候报错,说系统不支持。。。。2008r2
网上找了一圈DELL的管理软件只有个2.67



不知道这个能更新固件不???



作者: mppu293    时间: 2016-3-29 20:03

刚回来时用着很流畅就没看过日志啥的
近段是有问题才重做系统然后才看日志发现有这个提示的

在DELL官网下的FW刷不进,WIN的报系统不支持
DOS的运行后也报错退出。。。


作者: doewdcl    时间: 2016-3-29 20:03
ID=9
主机休眠:强烈不建议阵列休眠,容易会导致阵列出错。(每个磁盘响应时间会不同,容易造成硬盘离线的误报)
ID=23-32
提示PD规格不符?这个原因待查。
ID37-41
提示PD(物理硬盘)有错误,代码(ASCQ,码表没有,所以查不到)不明。

PS:可能阵列从睡眠中唤醒后,检测到PD不合规(代码查不到),所以阵列降级。可以关掉机器,重新启动在观察日志。不建议升级固件,因为这是自检错误和固件无关。


作者: 17mdm7    时间: 2016-3-29 20:03

其实我也是这么想的


我只是好奇这个故障怎么解决,坏了我才高兴呢


作者: 105ppwf    时间: 2016-3-29 20:03

现在不是很确定

因为是正在使用当中,所以没排查到底是硬盘问题还是电池或卡的问题


作者: fljc3vb    时间: 2016-3-29 20:03
dell过保了也还是可以电话咨询的


作者: 4c8ehgc1    时间: 2016-3-29 20:03
降级是不是电池问题?

四个盘都是在线,阵列不会降级的。

建议导出日志查看,用关键字查找故障。



作者: z0mfxk    时间: 2016-3-29 20:03
打DELL电话,看上去是固件问题。用USB引导更新固件应该是可以。


作者: gqezm2    时间: 2016-3-29 20:03
降级不去检查硬盘去升级firmware干啥,这不对吧


作者: x5ggox2v    时间: 2016-3-29 20:03

这个是DELL的服务器提示的,所以我准备这么操作,但是报错了


作者: zozjh4    时间: 2016-3-29 20:03
看顶楼的提示,是硬盘的固件版本太低了。

有更换过硬盘或者升级过阵列卡的固件?不可能用着用着就出现这种情况吧?


作者: 5zcr88    时间: 2016-3-29 20:03

麻烦帮看一下
谢谢
这玩意实在不懂~~

Dell SAS RAID Storage Manager v2.67-00事件日志 - 生成于 Fri Jan 29 16:32:37 CST 2016
------------------------------------------------------------------------------
ID = 61
时间 = 29-01-2016 16:32:13
本地化信息 = 已成功登录到服务器 用户:  Administrator, 客户机:  192.168.1.10,     访问模式:  完全, 客户机时间:  2016-01-29,16:32:12

ID = 60
序列号= 15396
时间 = 29-01-2016 16:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,16:00:14      66608  秒钟

ID = 59
序列号= 15395
时间 = 29-01-2016 15:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,15:00:14      63008  秒钟

ID = 58
序列号= 15394
时间 = 29-01-2016 14:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,14:00:14      59408  秒钟

ID = 57
序列号= 15393
时间 = 29-01-2016 13:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,13:00:14      55808  秒钟

ID = 56
序列号= 15392
时间 = 29-01-2016 12:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,12:00:14      52208  秒钟

ID = 55
序列号= 15391
时间 = 29-01-2016 11:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,11:00:14      48608  秒钟

ID = 54
序列号= 15390
时间 = 29-01-2016 10:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,10:00:14      45008  秒钟

ID = 53
序列号= 15389
时间 = 29-01-2016 09:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,09:00:14      41408  秒钟

ID = 52
序列号= 15388
时间 = 29-01-2016 08:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,08:00:14      37808  秒钟

ID = 51
序列号= 15387
时间 = 29-01-2016 07:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,07:00:14      34208  秒钟

ID = 50
序列号= 15386
时间 = 29-01-2016 06:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,06:00:14      30608  秒钟

ID = 49
序列号= 15385
时间 = 29-01-2016 05:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,05:00:14      27008  秒钟

ID = 48
序列号= 15384
时间 = 29-01-2016 04:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,04:00:14      23408  秒钟

ID = 47
序列号= 15383
时间 = 29-01-2016 03:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,03:00:14      19808  秒钟

ID = 46
序列号= 15382
时间 = 29-01-2016 02:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,02:00:14      16208  秒钟

ID = 45
序列号= 15381
时间 = 29-01-2016 01:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,01:00:14      12608  秒钟

ID = 44
序列号= 15380
时间 = 29-01-2016 00:00:14
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-29,00:00:15      9008  秒钟

ID = 43
序列号= 15379
时间 = 28-01-2016 23:00:13
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-28,23:00:14      5408  秒钟

ID = 42
序列号= 15378
时间 = 28-01-2016 22:00:13
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-28,22:00:14      1808  秒钟

ID = 41
序列号= 15377
时间 = 28-01-2016 21:32:25
本地化信息 = 控制器标识号: 0   意外检测:   PD       =   :32,   CDB   =    0x12  0x00  0x00  0x00  0x04  0x00     ,   传感   =    0x70  0x00  0x05  0x00  0x00  0x00  0x00  0x0a  0x00  0x00  0x00  0x00  0x24  0x00  0x00  0x00  0x00  0x00

ID = 40
序列号= 15376
时间 = 28-01-2016 21:32:25
本地化信息 = 控制器标识号: 0   意外检测:   PD       =   :32,   CDB   =    0x12  0x00  0x00  0x00  0x04  0x00     ,   传感   =    0x70  0x00  0x05  0x00  0x00  0x00  0x00  0x0a  0x00  0x00  0x00  0x00  0x24  0x00  0x00  0x00  0x00  0x00

ID = 39
序列号= 15375
时间 = 28-01-2016 21:32:25
本地化信息 = 控制器标识号: 0   意外检测:   PD       =   :32,   CDB   =    0x12  0x00  0x00  0x00  0x04  0x00     ,   传感   =    0x70  0x00  0x05  0x00  0x00  0x00  0x00  0x0a  0x00  0x00  0x00  0x00  0x24  0x00  0x00  0x00  0x00  0x00

ID = 38
序列号= 15374
时间 = 28-01-2016 21:32:25
本地化信息 = 控制器标识号: 0   意外检测:   PD       =   :32,   CDB   =    0x12  0x00  0x00  0x00  0x04  0x00     ,   传感   =    0x70  0x00  0x05  0x00  0x00  0x00  0x00  0x0a  0x00  0x00  0x00  0x00  0x24  0x00  0x00  0x00  0x00  0x00

ID = 37
序列号= 15373
时间 = 28-01-2016 21:32:13
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-28,21:32:29      128  秒钟

ID = 36
序列号= 15372
时间 = 28-01-2016 21:31:34
本地化信息 = 控制器标识号: 0   电池充电已完成

ID = 35
序列号= 15371
时间 = 28-01-2016 21:31:34
本地化信息 = 控制器标识号: 0   当前的电池容量高于阈值

ID = 34
序列号= 15370
时间 = 28-01-2016 21:31:34
本地化信息 = 控制器标识号: 0   电池温度正常

ID = 33
序列号= 15369
时间 = 28-01-2016 21:30:48
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-28,21:32:27      42  秒钟

ID = 32
序列号= 15368
时间 = 不可用
本地化信息 = 控制器标识号: 0   驱动器不合格:       --:--:4

ID = 31
序列号= 15367
时间 = 不可用
本地化信息 = 控制器标识号: 0  设备已插入   设备类型:       Disk  设备标识号:   --:--:4

ID = 30
序列号= 15366
时间 = 不可用
本地化信息 = 控制器标识号: 0   PD 已插入:       --:--:4

ID = 29
序列号= 15365
时间 = 不可用
本地化信息 = 控制器标识号: 0   驱动器不合格:       --:--:2

ID = 28
序列号= 15364
时间 = 不可用
本地化信息 = 控制器标识号: 0  设备已插入   设备类型:       Disk  设备标识号:   --:--:2

ID = 27
序列号= 15363
时间 = 不可用
本地化信息 = 控制器标识号: 0   PD 已插入:       --:--:2

ID = 26
序列号= 15362
时间 = 不可用
本地化信息 = 控制器标识号: 0   驱动器不合格:       --:--:1

ID = 25
序列号= 15361
时间 = 不可用
本地化信息 = 控制器标识号: 0  设备已插入   设备类型:       Disk  设备标识号:   --:--:1

ID = 24
序列号= 15360
时间 = 不可用
本地化信息 = 控制器标识号: 0   PD 已插入:       --:--:1

ID = 23
序列号= 15359
时间 = 不可用
本地化信息 = 控制器标识号: 0   驱动器不合格:       --:--:0

ID = 22
序列号= 15358
时间 = 不可用
本地化信息 = 控制器标识号: 0  设备已插入   设备类型:       Disk  设备标识号:   --:--:0

ID = 21
序列号= 15357
时间 = 不可用
本地化信息 = 控制器标识号: 0   PD 已插入:       --:--:0

ID = 20
序列号= 15356
时间 = 不可用
本地化信息 = 控制器标识号: 0  设备已插入   设备类型:       Unknown  设备标识号:   :0

ID = 19
序列号= 15355
时间 = 不可用
本地化信息 = 控制器标识号: 0   PD 已插入:       :32

ID = 18
序列号= 15354
时间 = 不可用
本地化信息 = 控制器标识号: 0   机柜的通信已还原:         :  :255

ID = 17
序列号= 15353
时间 = 不可用
本地化信息 = 控制器标识号: 0  电路板修订版:   

ID = 16
序列号= 15352
时间 = 不可用
本地化信息 = 控制器标识号: 0  软件包版本       6.3.1-0003

ID = 15
序列号= 15351
时间 = 不可用
本地化信息 = 控制器标识号: 0  控制器硬件修订版标识号为: (0x0)

ID = 14
序列号= 15350
时间 = 不可用
本地化信息 = 控制器标识号: 0   电池存在

ID = 13
序列号= 15349
时间 = 不可用
本地化信息 = 控制器标识号: 0   MegaRAID 固件版本:       1.22.32-1371

ID = 12
序列号= 15348
时间 = 不可用
本地化信息 = 控制器标识号: 0   MegaRAID 固件初始化已启动:       ( PCI 标识号   0x1000/ 0x0060/ 0x1028    / 0x1f0c)

ID = 11
序列号= 15347
时间 = 不可用
本地化信息 = 控制器标识号: 0   MegaRAID 固件版本:       1.22.32-1371

ID = 10
序列号= 15346
时间 = 不可用
本地化信息 = 控制器标识号: 0   MegaRAID 固件初始化已启动:       ( PCI 标识号   0x1000/ 0x0060/ 0x1028    / 0x1f0c)

ID = 9
序列号= 15345
时间 = 28-01-2016 21:29:47
本地化信息 = 控制器标识号: 0   从主机接收到休眠命令

ID = 8
序列号= 15344
时间 = 28-01-2016 21:29:27
本地化信息 = 控制器标识号: 0   事件日志已清除

ID = 7
序列号= 15343
时间 = 28-01-2016 21:00:36
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-28,21:00:36      82120  秒钟

ID = 6
序列号= 15342
时间 = 28-01-2016 20:00:36
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-28,20:00:36      78520  秒钟

ID = 5
序列号= 15341
时间 = 28-01-2016 19:00:36
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-28,19:00:36      74920  秒钟

ID = 4
序列号= 15340
时间 = 28-01-2016 18:00:36
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-28,18:00:36      71320  秒钟

ID = 3
序列号= 15339
时间 = 28-01-2016 17:00:36
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-28,17:00:36      67720  秒钟

ID = 2
序列号= 15338
时间 = 28-01-2016 16:00:36
本地化信息 = 控制器标识号: 0   开机运行时间:   时间   2016-01-28,16:00:36      64120  秒钟

ID = 1
时间 = 28-01-2016 15:53:23
本地化信息 = 服务器日志已清除 用户:  Administrator, 客户机:  192.168.1.10,     客户机时间:  2016-01-28,15:53:23




作者: avdsgk1    时间: 2016-3-29 20:03

请教一下怎么检查啊
在这个管理软件里好像没看到哪个盘报错
因为是公司用所以一时半会又不能停机检查


作者: nsgqoi5    时间: 2016-3-29 20:03

过保还是可以打电话问一下的


作者: y1zq24    时间: 2016-3-29 20:03

这种IT当的是最窝囊的,先把利害关系书面汇报一下,然后该干嘛干嘛,丢了数据最好


作者: 91zyxy    时间: 2016-3-29 20:03
降级说明有硬盘有故障或者是预警性故障 先检查硬盘问题而不是去升级控制器固件


作者: ggfrg1c    时间: 2016-3-29 20:03

这种IT当的是最窝囊的,先把利害关系书面汇报一下,然后该干嘛干嘛,丢了数据最好。
以后就会日子好点了。


作者: 105ppwf    时间: 2016-3-29 20:03

好的
谢谢,晚上重启明天再观察一下

作者: b3zlkb    时间: 2016-3-29 20:03

导出阵列卡的log,看看吧。简单得很。


作者: 2l8zj6    时间: 2016-3-29 20:03

服务器早过保了。。。。

PS,公司的ERP就运行在这上面,领导居然连换硬盘都不肯。。。。。






欢迎光临 网云科技 (http://www.8x6x.com/) Powered by Discuz! X3.2