Dell 服務器是否硬體異常
1.服務器燈號
2.iDrac 報錯誤訊息.
那內建的 Lifecycle controller Hardware diagnostics
ePSA (Enhanced Pre-Boot System Assessment) ,PSA Pre-Boot System Assessment. Diagnostics 是做啥用途?
其實ePSA , PSA 規劃原理
官方已經聲明了
當您的 Dell 電腦、平板電腦或伺服器似乎無法正常運作時,診斷公用程式可用來協助 找出潛在的硬體問題。
https://www.dell.com/support/kbdoc/zh-tw/000180971/resolve-hardware-issues-with-built-in-and-online-diagnostics-supportassist-epsa-epsa-or-psa-error-codes
這是給Dell 到府的上門工程師使用. 當做完硬體更換後 硬體還是繼續報錯後 用來找出很不好搞的問題.
假設ePSA 沒過,那真的代表電腦硬體就有立刻問題嗎?
翻開 Dell EMC PowerEdge Servers Troubleshooting Guide
PSA 錯誤代碼參考
有發現流程BIOS 都要求更新到最新嗎? 並且反覆測試
這是因為有可能會有BUG 還有誤判可能
如這PCI Device報錯誤 是BUG造成
https://www.dell.com/support/kbdoc/en-us/000195458/unknown-pcie-network-adapter-health-status-in-idrac9?lang=en
因此要PSA 完全都沒有錯誤
1. BIOS要更新到最新
2.重複做PSA流程
3.順便嘗試修正可能造成錯誤原因
總結
PSA 完整測試 是給你 “確定硬體或懷疑硬體有故障” 做的細節檢測方式… 並且主要給Dell上門維修工程師 檢測用
還不如 PSA 針對每項目 如DRAM ,CPU ,HDD 會比較簡單可確定資訊.
特別是老機Server ,當只更換某些零件而要求 PSA 全通過. 這是比較沒有必要的.