作者Cubelia (大胸智乃)
看板PC_Shopping
标题Re: [请益] 2t 游戏用SSD选择
时间Thu Mar 20 01:35:01 2025
好读
https://webptt.com/cn.aspx?n=bbs/PC_Shopping/M.1742405705.A.8F7.html
先帮楼主拍拍,三爽v6真的雷自己就算了还雷到别人
现在SSD贵森森也只能送修,奇妙的是创见还允许用户拒用三爽颗粒XD
以下99%内容都是脑补出来的,请看看就好
=
研究了一下楼主flashid给出来的资料,这是很有研究价值的东西
不过里面的数据并不能完全相信
1.未有官方解释 2.几乎只能靠字面意义来推敲,缩写也很难懂
而且很多的数值都是空的(-1或0),单位更不用说
看到有fail之类的不要自己吓自己,也别拿这个去和原厂卢,就当参考用
进入主题
一. smi_nvme_flash_id.txt
https://i.imgur.com/EMhw8Bg.png
1.三星v6 136L TLC颗粒、原厂测试坏块19个、三星D4 DRAM
(创见到底三爽DRAM库存压多深==)
2.搞不懂FBlock意思
这是我们看flashid最主要的档案,上面会有控制器、韧体、颗粒等资讯
精华是下面的遥测(telemetry)数据,这些是控制器所记录的内部资料
由於NVMe SMART项目都标准化
只能从遥测看以前SATA SSD能看出的ECC、重定位、坏块资料
而台厂群联和慧荣的资料剖析方式都有被攻破了
(螃蟹、英韧、联芸我没有玩过,所以不知道有无相关资料)
下面的遥测(不同控制器项目会较少,或是可解读项目不同)
https://i.imgur.com/waNbtUj.png
ECC理论顺序为硬LDPC=>(read retry)=>软LDPC=>RAID ECC
向右修正能力越强但越费时间,SMI整套称为NANDXtend技术
硬LDPC解码不行的话就得...
1.TLC read retry(重读)
重读就是来回调整电压看能不能读出正确数据
2.ECCUnc(软LDPC失败)
重读也不行就得用软LDPC,耗时较大
正常来说多少会出现的,切勿慌张,因为还有RAID ECC这招
3.重定位和XOR Fail都有相同数值
XOR就是奇偶校验,也是RAID ECC的原理之一
猜测RAID ECC为最後防线,可以理数值和重定位次数相同
连RAID ECC也没有办法就宣告无法恢复了,也就出现ECC错误事件
这是我最近从网拍买的MTE220S 512GB(美光/Spectek AS等级96L TLC)
可以看到仅软LDPC失败有纪录,RAID ECC无失败纪录
https://i.imgur.com/0hvjNfY.png
实际没跳0E
https://i.imgur.com/TP3i0L2.png
自用了超过五年的MTE220S 512GB(美光/自封64L TLC)
这条用比上面那条还久,没想到都没软LDPC失败,可能64L旧颗粒体质更好
https://i.imgur.com/I1nFUWz.png
实际也没跳0E
https://i.imgur.com/7moRYcT.jpeg
-
二. 至於smi_nvme_flash_id_ec.txt这个是颗粒的磨损值
ec应该为Erase Count(抹除次数),里面的BAD数量可对应前述19个坏块
三. smi_nvme_flash_id_smart.txt就单纯的NVMe SMART数据
用CrystalDiskInfo也能见到
不过下面有温度警告的统计次数
四. 那真的坏掉的案例呢?
之前有板友tyf99用Klevv C720爆0E的案例,今天终於能当教材了
phison_e12_flash_id_ec.txt
前面提过这是颗粒的磨损数据
https://i.imgur.com/AVGmBIq.png
可以看到有一整排BAD,这个就是"1片"晶片坏掉
群联的数据可以看到单独的晶片,慧荣的好像不行
(正常来说一定都有坏块的,但不可能这样整栏BAD,请不要拿这个和客服卢)
phison_nvme_flash_id_smart.txt也有显示ECC错误,包含RAID ECC也没救
https://i.imgur.com/zxFf1bq.png
SSD外观颗粒内部是好几片晶片叠起来
你能看到M.2 2230 TLC用一颗2TB,里面其实就高达16片NAND Flash晶片
当然SSD正反面贴那麽多颗,全部加起来也会有很多片晶片
--
姊姊 姊姊 我们好像变成签名档了
雷姆 雷姆 好像真的是这麽一回事呢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.255.51.22 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/PC_Shopping/M.1742405705.A.8F7.html
1F:推 knight714: 这件事最搞笑的是我上个月有打开软体看111.251.226.109 03/20 01:42
2F:→ knight714: 过 那时候0E还是0111.251.226.109 03/20 01:42
3F:→ knight714: 这次出问题一看0E直接变成22万111.251.226.109 03/20 01:42
炸翻XD
4F:推 E7lijah: 推 27.242.4.13 03/20 01:43
5F:推 Depthsharky: 0E不一定吧 36.228.215.40 03/20 01:44
6F:→ Depthsharky: 我自己体感上使用出问题了 读出来是0 36.228.215.40 03/20 01:45
7F:→ Depthsharky: 後续读不到硬碟 重装重灌 就读出来 36.228.215.40 03/20 01:46
个人理解是位於故障区域的资料被用户操作动到,确认ECC错误後才会记录下来
所以有些三星SSD是用魔术师工具箱"完整扫描"才爆出0E
不然就得等控制器主动refresh碰到
我其实很想写一篇用Linux nvme-cli自我检测SSD的文章,但都懒得写
※ 编辑: Cubelia (111.255.51.22 台湾), 03/20/2025 01:54:36
8F:推 wensety2007: 详细推 111.71.213.133 03/20 02:13
9F:推 tn601374: 还好都买金金 fury 1.164.209.85 03/20 02:54
10F:推 BlackCoal: 推111.242.188.174 03/20 06:11
11F:推 jack61031: 超硬知识推一个 220.138.192.93 03/20 10:36
12F:推 arenoe: 推 27.52.99.195 03/20 12:27
13F:推 Lemming: 存资料时後面都会加较验 SSD跟HDD都一样 1.170.167.122 03/20 18:34
14F:→ Lemming: 因为有bit error rate这种东西 1.170.167.122 03/20 18:34
15F:→ Lemming: 不加下次拿出来的时候不知道有没有错 1.170.167.122 03/20 18:35
16F:→ Lemming: 但加的位元数有限不然浪费空间 1.170.167.122 03/20 18:35
17F:→ Lemming: 所已有Uncorrectable BER的概念 1.170.167.122 03/20 18:36
18F:→ Lemming: SSD一般15次方分之一 企业级17次方 1.170.167.122 03/20 18:36
19F:→ Lemming: 比同级的HDD好太多了 1.170.167.122 03/20 18:36
20F:→ Lemming: 所以读取校验时才会发现错误 1.170.167.122 03/20 18:37
21F:→ Lemming: 平常没碰到没事 我是隔壁看到TEAM客服 1.170.167.122 03/20 18:37
22F:→ Lemming: 在那边乱回才想起细节的 我大学专题(EE) 1.170.167.122 03/20 18:38
23F:→ Lemming: 做过光纤的BER 道理都类似 1.170.167.122 03/20 18:38
24F:→ Lemming: 其实量够大都会出现错误 但是这次一堆 1.170.167.122 03/20 18:38
25F:→ Lemming: 厂商在那边误导 把那种量太大跳出几个 1.170.167.122 03/20 18:38
26F:→ Lemming: 机率上发生的那种 拿来当成拒绝理由 1.170.167.122 03/20 18:39
27F:→ Lemming: 拜托 他们跳得像是有做到15次方喔干 1.170.167.122 03/20 18:39
28F:→ Cubelia: 消费级HDD是14次方分之一,再上去15次方 111.255.51.22 03/20 19:38
29F:→ Cubelia: 就NAS、企业级等规格了 111.255.51.22 03/20 19:39