作者ultratimes (别人家看优点 自家找缺失)
看板Storage_Zone
标题[请益] Raid5的一颗硬碟故障後的问题
时间Sun Jul 30 20:10:43 2023
1.网路上说 Raid5很容易在一颗硬碟故障後,重建Raid的过程中又坏了一颗硬碟
因此资料容易救不回来
但如果假设,重建过程中并没有再坏一颗,那还是有可能失败导致资料毁损吗?
Raid5扣掉重建中又坏一颗的这种情形,还有没有其他可能导致重建失败?
2.另一个地方看到的是说,遇到Raid5,坏一颗硬碟时
第一个步骤不是把坏硬碟换掉重建Raid,而是先设法把重要资料copy出来
而我们知道Raid5在坏一颗硬碟时还可以装上新硬碟重建Raid
但如果我第一时间不是要重建,而是要救援资料有办法吗?
Raid5有办法在缺一颗硬碟的情况下把资料救出来吗? (假设其他硬碟都没坏的前提)
还是只能选择换掉故障硬碟重建?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.236.96.176 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Storage_Zone/M.1690719046.A.9BE.html
1F:→ concord : 这要看平常有没有做 ECC 校验,在 degraded mode 07/30 20:18
2F:→ concord : 是仰赖 XOR parity 运算做区域性的资料恢复,若ECC 07/30 20:19
3F:→ concord : 资料是错的,轻则恢复出来的资料是错的,重则有些主 07/30 20:19
4F:→ concord : 控会拒绝继续做 rebuild ,会处在不上不下的状况 07/30 20:19
5F:→ concord : 假设 parity 都是对的,其他碟也完全正常,先做重建 07/30 20:21
6F:→ concord : 或是先拉资料结果应该是相同的,但可能的话应该先拉 07/30 20:21
7F:→ concord : 资料出来,与备份比对以後再倒回恢复好的区域,避免 07/30 20:22
8F:→ concord : 在频繁读写之中又有什麽闪失 07/30 20:22
9F:推 mirc : NO/YES(data lost)/可以/可以/你不换还是可以使用 07/30 20:33
10F:→ mirc : 只是再坏一颗,raid毁损 07/30 20:33
11F:→ spfy : 因为很多人知道RAID但不知道RAID也要注意吧 07/30 20:34
12F:→ tomsawyer : 不重建也可以用 就只是degrade而已 正常读写 但再 07/30 20:35
13F:→ tomsawyer : 坏就全部消失 07/30 20:35
14F:→ tomsawyer : 如果拔掉一颗 正常状态下是不用重建也能读写 你感 07/30 20:36
15F:→ tomsawyer : 觉不出来 07/30 20:36
16F:→ spfy : 以前遇过客户找不知道哪的工作室组硬RAID5电脑 07/30 20:36
17F:→ spfy : 来找我们的时候管理软体已经警告了 4个3TDM001 07/30 20:37
18F:→ spfy : 1个挂 2个预警 只好叫他们回去找那工作室... 07/30 20:37
19F:→ comipa : DM001 www 真的是名盘阿 07/30 21:42
20F:推 ICEFTP : 我重建过一次还两次的样子 幸运成功 07/30 22:39
21F:→ ICEFTP : 但如果要选2 拷贝数据出来也会非常的慢 07/30 22:40
22F:→ ICEFTP : 硬体RAID可以拚重建 软RAID...两个选项风险差不多 07/30 22:41
23F:→ ICEFTP : 因为软RAID重建会比硬RAID慢 读资料也是 07/30 22:41
24F:→ ICEFTP : 时间一拉久、硬碟长时间工作 就真的很赌人品了 07/30 22:42
25F:→ ICEFTP : 我重建过那次是用硬RAID 换一颗後下指令 07/30 22:43
26F:→ ICEFTP : 所以後来就不完RAID5 都用RAID1 07/30 22:43
27F:→ birdy590 : 早就已经确认不安全的东西到底想亲身验证什麽? 07/30 23:58
28F:→ birdy590 : 记得二十多年前大学的时候 系计中RAID5就全毁过 07/30 23:59
29F:→ birdy590 : 磁带有定期备份 还是快把我们机房组搞死了 07/31 00:00
30F:→ birdy590 : 最常见的状况是 控制器侦测到一颗硬碟故障的同时 07/31 00:08
31F:→ birdy590 : 阵列里有另一颗甚至更多已经有坏轨的可能性很高 07/31 00:08
32F:推 heymike : 通常组RAID硬碟高机率都是同一批型号 同一批出厂 07/31 09:32
33F:→ heymike : 重建过程中再坏一颗 机率相比之下比较高 07/31 09:33
34F:→ blackstyles : 捞资料跟你重建还不是都会让原本的硬碟疯狂使用 直 07/31 18:10
35F:→ blackstyles : 接赌重建然後下次记得用R6 07/31 18:10
捞资料可以不用全捞,先捞没备份到的 或是重要的
另外可以捞完再想要重建还是全部换新吧
36F:→ raidcrash : 用R6(X) 妥善备份(O) 有做好备份计画 就没捞资料的 07/31 19:09
37F:→ raidcrash : 问题了 除非你服务不能中断 不然用RAID0都行 07/31 19:09
38F:→ Cubelia : RAID is not backup 07/31 19:14
备份是会有时差的
备份通常只会备份最重要的资料
但捞资料的话,可能还会贪心一点再捞一些次重要的
※ 编辑: ultratimes (36.236.96.176 台湾), 07/31/2023 20:51:38