原本系統為 DSM 5.0-4493 Update 4,系統有些小問題
(管理介面 長時間開機使用會出錯)
跟synology 原廠 請求技術支援,
卻以安裝3rd party 軟體 拒絕支援(其實只有安裝幾個 unix 常用工具)
所以只好重新安裝安裝DSM(reset 按兩次)
重新安裝完後,又立即更新到最新版本DSM 5.0-4493 Update 5
但這樣做否而變成噩夢的開始。
半夜 CPU 使用變成100% 變成100%時試圖用ssh top去查詢,反應非常慢過好幾分鐘,才傳送畫面,
看不出那個process 佔CPU支援,process CPU使用率都很低。
用資源監控 來看process ,數次皆為空白,用網頁進行重開失敗,只好用硬體方式強制開關機。
原廠告知 可以 關閉檔案索引,可能可以解決這問題。
我嘗試關閉檔案索引與把大部分的服務與套件關閉,結果還是有這樣的狀況。
在CPU使用率 80- 95%時去查看,發覺並沒有 程序占用高 CPU使用,累計起來也不到30%
所以從DSM內建的工具,完全看不出那個process 作怪。
從效能頁面 看到的應該是 系統 吃到大部分CPU資源。
像這次的問題,查了所有的工具,檢查了硬碟狀態,連線狀態
都沒辦法找到原因。 3rd party unix工具又無法安裝情況,
要查問題真的很麻煩。
這個問題已經造成嚴重的問題。一堆服務都停擺,工作變成很麻煩。
我更怕的是有資安的問題。可是DS1813+ 線上run,停機影響非常重大。
我完全不知道是不是被入侵,還是軟體Bug、或是那些 高CPU使用率的套件 作怪。
跟原廠詢問,至今快一個禮拜,卻回信很慢,無法解決問題。
不知大家有無類似的經驗。建議如何檢查與解決這問題。
BTW,這次synology 處理積極度 加上synoLocker 事件 ,
下次可能改用QNAP。至少QNAP還沒出現資安問題。少了一些憂慮。
我的建議是這樣的 : (如果在現場有可行性的話 , 這些動作也是因地制宜的 .)
1. 換上測試用的硬碟 , 安裝乾淨的NAS作業系統 , 排除外在軟體干擾因素 .
2. 隔絕網路環境下作業 , 確保不是攻擊或者入侵問題 .
二種情境 , 可能都要測試一些時間 , 以觀察狀況與變化 .
疑難雜症之所以困擾系統管理者 , 通常就是變因比較多 ,
超出了管理者的預想可能性範圍之外 .
外在的 DoS 攻擊 像是 TCP SYN flood , 其實也都可能癱瘓掉主機 ,
掛上有記錄與觀察能力的防火牆 , 也是個好方法 , 有機會觀察到現況 .
以上提供您參考 .
中小企業 基礎建設 採購參考文件 :
http://www.PCPiLOT.com.tw
請參考
http://www.mobile01.com/topicdetail.php?f=494&t=3240488&p=1#42247470
cdrw wrote:
原本系統為 DSM ...(恕刪)
生活部落格
https://www.germs.idv.tw
Germs wrote:
你有自己安裝額外的記憶體嗎???
有, 不過之前額外裝記憶體 跑了快一年, 沒有遇到問題。
不過為了排除問題,等利用無人使用的空檔,先把記憶體拔掉。將問題單純化。
Mowd wrote:
System loading很大時,還要檢查硬碟是否有不正常頻繁讀寫
有懷疑過是不是硬碟故障 或是硬碟Loading大。
不過用內建的S.M.A.R.T 檢查過 沒發現異常。
發生這問題時,從資源監控中,並沒有看到大量硬碟讀取。
硬碟使用率0.x 至1 MB/s 左右
其實這台工作量比以前小很多。當初買這台是看上4 Port 1G 網路port
對於效能不甚滿意。單檔傳輸Samba效能不佳,同時有兩人存取大檔案時,速度便很慢。
從上月開始,會大量使用的大檔都已經移到Windows File Server去。
這台只有放 專案檔案、與備份用。甚至硬碟分流 5顆儲存空間1 3顆儲存空間2,
其實在重裝DSM 之前跑的服務更多, 之前有在運作的服務 FTP、FTPS、 網路備份目的地、網路備份儲存空間目的地、Web Station、 NFS 服務、Audio Station、Download station、phpMyAdmin、Piwik、一些套件更是用很多。
現在服務只剩下Windows 檔案服務、MAC 檔案服務、VPN Server、MariaDB、Cloud station。
之前CPU衝高時,有嘗試關閉 MariaDB 與Cloud Station,但沒改善
Cloud station 關閉幾天過,也是有再發生這問題,所以又再打開。
Windows 檔案服務 通常只有2-3人再用,使用者有無大量讀取很容易排除。
且發生CPU使用率暴增問題似乎都是在半夜。Windows 檔案服務
VPN Serve、Cloud station甚至只有我在用。
pcpilot wrote:
我的建議是這樣的 : (如果在現場有可行性的話 , 這些動作也是因地制宜的 .)
1. 換上測試用的硬碟 , 安裝乾淨的NAS作業系統 , 排除外在軟體干擾因素 .
2. 隔絕網路環境下作業 , 確保不是攻擊或者入侵問題 .
這個做不到。目前就是機器在運作。如果可以停擺,早就停擺啦
pcpilot wrote:
外在的 DoS 攻擊 像是 TCP SYN flood , 其實也都可能癱瘓掉主機 ,
掛上有記錄與觀察能力的防火牆 , 也是個好方法 , 有機會觀察到現況 .
有懷疑這問題。
目前是區網1-區網3 跑 Link Aggregation,是內部網路用
區網4 跑 PPPoE,
但PPPoE 防火牆 除了開放 Web station、FTP 與VPN Port
其他都關閉(設定 若以上規則不符合時 拒絕存取 )
cweng12345 wrote:
連RAID-6都會出大包的..且目前正在交涉善後中 ..(恕刪)
那就算啦,CPU衝高,至少資料還正常。
我也不是說一定是 synology 問題
難保是因為某些設定或是硬體問題,造成這狀況。
我也盡量在排除,只是在系統內建可以追查的工具有限。又禁止裝3rd party套件。
使用者能處理的是有限,原廠也沒給一個好的快速處理方式,都是慢慢回。
關閉廣告