有個經銷商的user是在HP約6年前的server上裝ESXi跑service的....
去年底開始會當機,當機期間不論ESXi或Guest都沒有log,經銷商一直要柪鵝去on site一趟....
連上ESXi只看到storage有突然offline的狀況,可是HW廠商只隨便跑了一下diagnostic,就說不是HW的問題....
踢皮球大賽....

鵝想辦法透過ESXi的ssh裝上ipmitool,再把iLo的網路設好,但還是連不上iLo,請他們check user端的環境也沒下文,就不了了之了....
最近開始又發作了,好不容易"拜託"經銷商把FW上iLo相關部份擺平,就看到兩筆可能相關的log....
踢皮球大賽....

踢皮球大賽....

它X的,明明是HW的問題,server也不是鵝賣的,那柪鵝on site就有用嗎....
文章關鍵字
吐完口水來點有教育意義的好了....

標準的server通常有一定程度的遠端管理能力,請參考一下第一張圖....


黃色框框內就是主CPU(跑OS/Hypervisor那顆),紅色框框內那顆叫BMC(Baseboard Management Controller,包括自己的CPU/RAM/ROM和一堆I/O,獨立跑自己的OS/AP,基本上就是顆SoC),負責server的event log及遠端控制(分為業界標準的IPMI,或各廠自行Web化的UI,Dell叫iDRAC,IBM/Lenovo叫IMM,HP叫iLo),可以看到server的狀態並做基本的管理,而BMC也透過PCI-E提供主機端的VGA controller,加上紫色框框內的RAM就成了onboard VGA,搭配firmware就可以透過IP KVM的方式提供remote console(此功能Dell/HP/Lenovo通常列為option,要另外買license )....

以往BMC都是那幾家大廠自行開發,國內的系統廠比較缺乏這方面的能力,但現在已經有chipset廠開發出通用的solution了,所以Acer/ASUS或Gigabyte這類系統廠可能也會在其server產品內附加此類功能(畢竟成本大降,又能讓賣相變好),請參考一下第二張圖....


從block diagram中可以看到除了PCI-E外(主要用於VGA),BMC還透過USB及SM BUS與主系統界接,另外還有ADC/GPIO/SD等界面,USB主要是在遠端管理時模擬成keyboard/mouse及storage供主系統用(所以必要時也可以遠端安裝OS),SM BUS則是供BMC/主CPU間溝通event log用,ADC/GPIO則是監控電壓/溫度及風扇用,部份機型若外加Ethernet PHY(灰色框框部份)就可以提供BMC獨立的Ethernet port,只是經驗畢竟不如國外大廠充分,做出來的UI/UX會比較銼,也只能等時間去累積了....
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!