悶! 來分析SSD Freeze的成因

1Q84 wrote:
只要最後一筆有寫入 ...(恕刪)

如果只要10ms 那麼靠psu上輸出端的濾波電容應該就夠撐10ms了

是說這種因瞬間斷電導致data lost的問題,不管SSD或HD都會遇到,只是看ecc救不救的回來

所以我實在有點搞不清楚為什麼要在SSD的場子來特別提出這個問題

簡單的作法可以參照GOOGLE SERVER,直接加一顆鋰電+電源監控管理迴路

http://www.google.com.tw/images?hl=zh-TW&source=imghp&biw=1024&bih=605&q=GOOGLE+SERVER&gbv=2&aq=f&aqi=&aql=&oq=&gs_rfai=
whydan wrote:
如果只要10ms 那...(恕刪)


沒實際去做是不明白為什麼的.
當然,,,直接上電池是最好解答的. 但你看那家消費型的這樣做的.
即使工規,可以接電池的,還是要考慮突然斷電下的問題. 或是雷擊,直接reset

單筆資料完整不代表全部完整. 百uF級的電容那麼小顆,UFD也都塞的下.但斷電就毀的UFD也不在少數.

cache RAM的資料怎麼辦?
能不能從存在flash的資料結構還完出完整的磁區?這都是挑戰.

可不是簡簡單單的最後一筆有寫進去就好這種觀點就能解釋的.

真那麼簡單,為什麼SSD進入門檻如此高?

真那麼簡單,為什麼UFD還是常見斷電就死給你看的?


有些演算法,平常發生機率根本不到1%, 但大部分的code卻是在為這1%服務.

power cycling是一個思考演算法的起點,加入power cycling這個因素後,有些看起來很有效的演算法卻都是不合格的.

不過離題好多了....
longyeekimo wrote:
沒實際去做是不明白為...(恕刪)

沒錯,的確是沒有實際作過,所以很多事只能就所學去作片面的猜測而已

先不去討論工規,畢竟有環境嚴格很多,以一般家用end user來一台online ups就很好用了

討論到雷擊的話就很麻煩,光抗雷擊的等級就有分,從最簡單用突波吸引器就擋的下,到好幾層的防護都有

我只是就先前1Q84兄提到的數ms能處理最後一筆資料,才提到如果只要10ms靠電容就好

就整體資料當然沒這麼簡單@@;另外cache ram的部分,其實靠ups電池撐住的那段時間就能多少避免

為什麼說google server作法比較簡單,以我所知道的google server的作法,其實一般人也作的到

google server先特製化到所有device都吃12v(其他的電源再VRM去轉),所以PSU出來接電池再接device

一般人可以用dc to dc的電源版來供應,前端接鋰電再接psu,dc-dc電源版像picopsu

http://www.mini-box.com/s.nl/it.A/id.417/.f

等等都算是比較完備的設計,單純只考慮SSD端來確保DATA的完整性個人覺得不太保險

anyway,再扯下去就沒完沒了了,只是提到電源的部分我就很有興趣提不完,哈哈哈

longyeekimo wrote:


可不是簡簡單單的最後一筆有寫進去就好這種觀點就能解釋的....(恕刪)


如果在資料update的時候順便把這個physical address 對應的logical address information / erase count 一起寫進 physical block的最前頭. (1個address entry應該很小)
然後開機的時候出問題再重讀每個physical block的最前頭 就可以重建mapping table /erase count table. 似乎這樣就可以避免斷電問題,不用想辦法從DRAM回寫 (連最後一筆都不用)... 不過mount device 重建mapping table的時候應該會讀到天荒地老吧...

想要有一個完整的table再加上每個physical block存logical address的information 應該就可以完善整個機制 可是就不知道斷電回復的時候要怎麼告訴controller, mapping table並沒有被on-time update..
先進這麼多,小弟浮起來一下。

其實OCZ在初期Pilot-run的SF樣品,是有做Supercap進去的。Golden Sample因為某些原因,沒有放進去,所以在各地的Media Review上是看不見的。

樣本統計的理論也是一道重要里程碑。

緊密地與Controller Vendor聯繫,大量蒐集End-User Case並不斷地update,並針對NAND FLASH現貨狀況做相容性、電性、匹配性的驗證,對於一個面向零售市場的產品來說,雖然技術含量不高,也是對於使用者整體經驗而言,卻有著相當關鍵性的作用。產品很難滿足所有的人,但是盡量讓離群值降到最低,卻是我們正在做的事情。

箇中奧妙,難以一一形容,但很高興有個園地,可以跟先進們多多交流。
whydan wrote:
沒錯,的確是沒有實際...(恕刪)

大大是做POWER IC的嗎?提到好多跟POWER有關的東西唷。

PicoPSU實際作用是用來做啥的呀?可以自己DIY嗎?
陳小方 wrote:
如果在資料updat...(恕刪)


我要脫離這行了...哈.....尺度可以大點了

小方兄的想法是flash演算法的基本之一. 方法是對,對page level來說,問題在時間上也沒錯.
時間問題好解決. 內部還隱藏更多問題.
要檢查斷電前有沒有將table update也不會很難.只要在關機的特定命令下寫入一個特別的flag到系統中.就能確認有沒有正常關機.這並不難. 難題還是在沒table下,如何找回page和LBA間的關係.因為並不是1對1的關係.

最近跟工規廠商Update了一下information, 他們說SF的東西沒想像中的好.
原因在成本和壓縮上.SF的RAM擺了一堆在IC內部,誇張啊....
其實仔細想想, 現在大部分的大量資料都屬於壓縮過的,只有少量資料為原始未壓縮的型式. 現在網路世界下,最大量的多媒體那一樣不是壓縮到極致的. Office的檔案雖以未壓縮的居多,但個人電腦上能有多少?傳到雲端server上也應該會再處理過. 所以雖然壓縮法看起來數字好看,但實用上還是力有未逮.
和 wrote:
大大是做POWER ...(恕刪)

不是,玩家而已;作power ic像我這麼弱早就抓去填海了
傷心我買了vertex2
他現在連smart的韌體都怪怪的
白老鼠+1
使用flash是必要之惡,薄薄的像顆膠囊,靠著高電壓把電子打進去從1變成0 (還是0變1,有點忘了),常常寫入抹除的結果,很快就會透穿漏電了...

所以一旦用了flash,其實不能要求天長地久,只能要求曾經擁有,至於想加上個期限,我想幾年也就夠了吧..

隨著大家要高容量,只好製程越先進,這個薄膜或許越做越薄,單位體積要塞入更多的儲存單元,所以整個flash方案更容易耗更多時間在處理資料的儲存上,比方SLC->MLC,多了容量,可是就累了後面許多的工作,像EDC/ECC bit數要求越來越高, flash內籤IC不做,就要系統CPU來做.

買了一顆intel SSD,用在小eeepc上,感覺蠻方便的,整體機子溫度也降低o至於耐用度,intel有提供一個軟體去跑,因為還沒去研究那個軟體是啥,不過經由本文討論,不知道是否在SSD開始慢下來時,去要求使用者花點時間跑一下工具程式,把一些block 被mark 該erase的去pre program一下,這樣是否可以不會讓使用者在白天工作時,遇到最糟狀況的erase情況?

防毒軟體公司設在上班時間定期運作讓電腦慢下來,所以提供使用者工具軟體,讓使用者自己選時間偶爾跑一下,應該也是一個方法吧!

目前我是盡量買大一點的SSD,同時要存到太不要存到太滿,我自己是設定在至少只用50%(我自己想的,沒啥根據),希望在SSD掛掉之前,能多撐一點時間就好,3年,是我可以接受的狀況
關閉廣告
文章分享
評分
評分
複製連結
請輸入您要前往的頁數(1 ~ 12)

今日熱門文章 網友點擊推薦!