作者tyfu (慎)
看板Storage_Zone
標題Re: [閒聊] SSD數據保存期(不通電會變磚?)+選購雜談
時間Tue Dec 15 18:46:42 2020
小弟只是業餘的客戶..其實應該有更多專業人士..
有人想了解我就以我的理解跟大家解釋一下、獻醜XD
如大家所知三星是第一家在2D製成推出TLC SSD廠商,
當時還沒發展3D,因此容量發展一直依靠在面積縮小,
(Ex. Toshiba NAND 19nm -> A19 -> 15nm、而A19是把Width縮小)
這其實是不利於Floating gate儲存電荷的,
這層不管面積大小、電荷存滿之後電位都是一樣的(材料物理特性、無法突破)
所以縮小面積即意味著用更少的電子分布在有限的電位,
舉例來說、舊製程(Ex. 25nm)用100顆電子切8等位(TLC 8階),
但新製程(Ex. 14nm)只能存10顆電子卻一樣切8等位,
製程愈小的NAND對於壽命跟保存期都是變相的傷害,
像Intel 25nm出的MLC P/E可以到10K,後來1x nm做MLC了不起3K,
所以後來就沒再繼續做下去改往3D垂直發展,
這條路再搞下去做的東西不能用啊XD
P.S. 3D的Floating Gate面積大非常多、所以不用太過擔心XD
那三星2D TLC發生什麼事?
如上面所講的,因為有限的電子存量,
隨便一顆電子跑掉就可能造成資料判讀錯誤,
Ex. 原本存110,因為電子跑掉被判斷成111
到這邊也都還沒關係,因為SSD有強大的ECC做Backup,
ECC又分為兩種,早期MLC時代絕大多數只有設計BCH用電路的方式硬解,
速度夠快,但就是糾錯能力偏差,1個Page錯個幾個Bit都還是可以搞定,
但超出他能力他就是完全擺爛,不是0就是1的概念。
TLC把電位切得太細了(MLC只切4階),出錯的比例大幅提升,
所以BCH無法搞定的Case非常容易就遇到了,
因此三星率先採用了LDPC ECC,這玩意跟BCH差別在於它是演算法糾錯,
他沒辦法100%解乾淨、但他可以讓機率提升到99.9999%,
代價就是..你要給他很多時間讓他慢慢算..
所以後來就衍生出速度變慢的抱怨..
後來大家也都理解LDPC的處理速度不是常人能忍受的,
所以後來SSD廠商就在從FW設計上來彌補這一塊,
電子會跑掉是必然的,只要你的環境不是絕對0K,
就不可能保證電子不會熱穿隧,所以廠商開始在NAND上面每個Block標註時間,
在電子流失到到要啟用LDPC前趕緊把資料重寫(搬到另一個Block),
這樣消費者就不會那麼快遇到LDPC的慢速解碼,多數都靠BCH搞定。
如上述所解釋、這其實也只是延遲發作時間而已,
當NAND P/E快用完時LDPC還是閃不掉的,前提是P/E快用完XD
P.S. 現今的LDPC應該有進步一點了、
但我相信還是沒人敢在一開始就讓它啟動XD
以上單純是個人見解..有錯請小力鞭..
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.163.153.36 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Storage_Zone/M.1608029204.A.CEE.html
1F:推 sdbb : 強烈建議pcshopping板也發一篇,謝謝 12/15 18:57
2F:推 Brunnhilde : 這次出包的 WD Blue 一樣也是 3D NAND 12/15 18:59
3F:推 FRX : 所以到底還能買哪個型號的呢? 12/15 19:01
4F:→ tyfu : 如果是外包設計的話..設計缺東缺西是不太意外啦.. 12/15 19:02
5F:→ tyfu : 個人對通路SSD了解不深..恕我無法回答Orz.. 12/15 19:02
6F:→ tyfu : BTW..小弟不會轉文..需要的話可以直接幫忙轉@@" 12/15 19:08
7F:推 Cubelia : 原文可以清掉沒關係XD,2000多字占太多篇幅 12/15 19:20
完工XD
8F:推 agong : 推 12/15 19:49
9F:→ kevin1221 : WD BLUE是指SATA的? 12/15 19:51
10F:推 BryantChan : 推推~ 12/15 20:17
11F:推 goldie : 推@@!! 12/15 20:39
※ 編輯: tyfu (36.228.141.87 臺灣), 12/15/2020 20:46:47
13F:→ tyfu : 嗯..SATA的我猜是外包的..WD研發都投NVMe為主.. 12/15 21:45
14F:→ tyfu : 個人猜FW設計有問題..那用量要造成Retention問題 12/15 22:02
15F:→ tyfu : 有點匪夷所思..WD應該也不會學XX拿劣等Grade出貨.. 12/15 22:03
16F:→ tyfu : 大概是標記Timer出包吧、出廠用Thermal budget模擬 12/15 22:16
17F:→ tyfu : 測不出來就代表問題是時間造成的,因為產線沒時間XD 12/15 22:17
18F:→ tyfu : 把資料的寫入時間估過久了直接啟動LDPC 挺瞎= = 12/15 22:18
※ Algg:轉錄至看板 PC_Shopping 12/16 06:41
19F:推 Ohwil : ldpc每個設計的能力與快慢都不一樣,不像bch大家同構 12/16 08:14
20F:→ Ohwil : 要去深挖主控接露各自ecc驗證多少量, 解錯多就慢 12/16 08:16
21F:→ Ohwil : 99.9999%騙人不懂數字4k碼字就是讀4GB會錯一個4k 12/16 08:18
22F:→ Ohwil : 設計者都往TB驗證走的... 12/16 08:19
23F:→ tyfu : 沒辦法..廠商必須這樣消費者才敢買啊XD 12/16 08:29
24F:推 AreLies : 推 12/16 10:13
25F:推 delaluna : 推 12/16 12:19
26F:→ commandoEX : LDPC校正速度不能用處理器性能克服嗎? 12/16 15:24
27F:→ tyfu : 錢的問題、儲存產業你IC比人家貴個一塊就沒人要了 12/16 15:50
28F:→ tyfu : 而且又是低階的SATA控制器 比PCIe更是價格導向.. 12/16 15:51
29F:→ tyfu : 個人對於SSD LDPC的理解是EOL時的垂死掙扎、 12/16 16:01
30F:→ tyfu : 假設BCH可以撐到P/E 2K,LDPC會幫他支援最後那1K 12/16 16:02
31F:→ tyfu : 單純只是為了壽命而設計、不是效能取向XD 12/16 16:02
33F:→ Ohwil : 錯誤率多少影響速度, 主控只會有一種ecc在裡面 12/17 08:19
34F:→ Ohwil : 2018年主控同樣nand錯誤率下速度差好幾倍 12/17 08:21
35F:→ Ohwil : p2 這主控速度只撐到千分之七, 主控的ecc都蠻爛的 12/17 08:23
36F:→ tyfu : O大貌似對LDPC有一番研究..希望能分享分享XD 12/17 09:03
37F:→ tyfu : 只是個人對於Client設計的LDPC完全沒啥好感.. 12/17 09:03
38F:→ tyfu : 沒毛利的產品通常就是撿人剩的..Server比較有可能 12/17 09:04
39F:→ tyfu : 採用最新的技術,畢竟正常情況都是向錢妥協Orz.. 12/17 09:05