مقدمه
سرورهای G10 شرکت Hewlett Packard Enterprise (HPE) به دلیل پایداری، قدرت پردازش بالا و امکانات مدیریتی پیشرفته، در بسیاری از مراکز داده و سازمانها مورد استفاده قرار میگیرند. با این حال، گاهی اوقات هنگام بوت شدن (Startup) این سرورها، خطاهایی رخ میدهد که ممکن است عملکرد سیستم را مختل کند. این خطاها میتوانند به دلایل مختلفی مانند مشکلات سختافزاری، ناسازگاریهای نرمافزاری یا تنظیمات اشتباه در BIOS/UEFI باشند.
در این مقاله، به بررسی خطاهای رایج بوت در سرور G10 و کدهای خطای مربوطه میپردازیم و راهکارهای رفع این خطاها را ارائه میدهیم.
۱. خطای POST Failure و کدهای مرتبط
(Power-On Self-Test – POST) فرآیندی است که سرور قبل از بوت شدن سیستمعامل، قطعات سختافزاری را بررسی کرده و در صورت وجود مشکل، یک پیام خطا نمایش داده یا از طریق LED و صفحهنمایش iLO اطلاعرسانی میکند.
کدهای خطای POST مربوط به سرور G10 و معانی آنها:
کد خطا | شرح خطا | راهحل پیشنهادی |
---|---|---|
900-series | مشکلات مربوط به پردازنده | بررسی نصب صحیح پردازنده، اطمینان از پشتیبانی شدن توسط BIOS |
1000-series | مشکلات مربوط به حافظه (RAM) | بررسی نصب صحیح ماژولهای رم، تعویض یا تغییر اسلات |
1400-series | خطای مربوط به چیپست سیستم | بررسی تنظیمات BIOS و آپدیت Firmware |
2000-series | مشکلات مربوط به دستگاههای جانبی | بررسی کارتهای PCIe و تجهیزات متصل |
3000-series | مشکلات مربوط به کنترلر RAID | بررسی وضعیت آرایههای ذخیرهسازی و سلامت دیسکها |
۲. خطای “No Bootable Device Found”
شرح خطا:
این خطا نشان میدهد که سرور نمیتواند یک دستگاه بوت معتبر را پیدا کند. این مشکل میتواند به دلایل زیر رخ دهد:
🔸 تنظیمات نادرست بوت در BIOS/UEFI
🔸 مشکلات کنترلر RAID یا پیکربندی اشتباه
🔸 خرابی یا جدا شدن کابل دیسکهای ذخیرهسازی
🔸 خرابی سیستمعامل یا از بین رفتن فایلهای بوت
راهکارهای پیشنهادی:
✔ وارد BIOS/UEFI سرور G10 شوید و ترتیب بوت را بررسی کنید.
✔ در صورت استفاده از RAID، تنظیمات آن را در HPE Smart Storage Administrator (SSA) بررسی کنید.
✔ درایوهای ذخیرهسازی را از لحاظ اتصال فیزیکی و سلامت دیسکها بررسی کنید.
✔ اگر از بوت شبکه (PXE Boot) استفاده میکنید، تنظیمات DHCP و TFTP را بررسی کنید.
۳. خطای “Processor Configuration Error”
شرح خطا:
این خطا معمولاً به دلیل مشکلاتی در پردازنده (CPU) رخ میدهد و ممکن است با کدهایی مانند 900-CPU Configuration Error در iLO نمایش داده شود.
علل احتمالی:
🔹 نصب نادرست پردازنده
🔹 ناسازگاری CPU با مادربرد یا BIOS
🔹 مشکلات حرارتی یا Overheating
🔹 آسیبدیدگی پردازنده یا پینهای سوکت
راهکارهای پیشنهادی:
✔ بررسی کنید که پردازنده به درستی در سوکت نصب شده باشد و هیچ پینی خم نشده باشد.
✔ از آخرین نسخه BIOS استفاده کنید.
✔ اگر دو پردازنده روی سرور نصب شده است، اطمینان حاصل کنید که ماژولهای رم به درستی توزیع شده باشند.
✔ تست سرور با یک پردازنده برای بررسی سلامت سختافزار.
۴. خطای “Memory Initialization Error”
شرح خطا:
این خطا معمولاً مربوط به مشکلات حافظه (RAM) است و کدهایی مانند 1000-Memory Configuration Error نمایش داده میشود.
علل احتمالی:
🔹 ماژولهای RAM به درستی نصب نشدهاند.
🔹 ناسازگاری ماژولهای RAM با سرور.
🔹 استفاده از ترکیب نامناسب رمهای LRDIMM و RDIMM.
🔹 اسلاتهای RAM دچار مشکل شدهاند.
راهکارهای پیشنهادی:
✔ ماژولهای RAM را مجدداً جا بزنید و ترتیب نصب را طبق مستندات HPE QuickSpecs بررسی کنید.
✔ از رمهای سازگار با سرور استفاده کنید (HPE Smart Memory).
✔ سرور را با حداقل حافظه (Minimal Configuration) بوت کنید.
✔ در صورت تداوم مشکل، iLO System Logs را بررسی کنید.
۵. خطای “Fan Failure Detected”
شرح خطا:
این خطا نشاندهنده خرابی فنهای خنککننده یا عدم عملکرد صحیح آنهاست.
علل احتمالی:
🔹 خرابی فیزیکی یکی از فنها
🔹 جدا شدن کابل اتصال فن به مادربرد
🔹 ناسازگاری فن با سرور
راهکارهای پیشنهادی:
✔ بررسی کنید که همه فنها متصل و در حال چرخش باشند.
✔ از iLO برای مشاهده وضعیت فنها استفاده کنید.
✔ در صورت استفاده از فنهای جدید، از سازگاری آنها با سرور اطمینان حاصل کنید.
۶. خطای “RAID Controller Failure”
شرح خطا:
این خطا معمولاً هنگام بوت شدن سرور G10 و در HPE Smart Array Controller ظاهر میشود.
علل احتمالی:
🔹 خرابی سختافزاری کنترلر RAID
🔹 ناسازگاری Firmware کنترلر
🔹 مشکلات مربوط به کش (Cache) یا باتری بکاپ (BBWC)
راهکارهای پیشنهادی:
✔ بررسی کنید که کنترلر RAID به درستی در اسلات PCIe قرار گرفته باشد.
✔ از آخرین نسخه Firmware برای کنترلر استفاده کنید.
✔ در صورت وجود مشکل در کش یا باتری بکاپ، تعویض آن را بررسی کنید.
✔ وضعیت RAID را در HPE Smart Storage Administrator چک کنید.
۷. خطای “iLO Communication Error”
شرح خطا:
این خطا معمولاً در iLO (Integrated Lights-Out) رخ داده و میتواند عملکرد مدیریتی سرور را مختل کند.
راهکارهای پیشنهادی:
✔ بررسی اتصال شبکه iLO و تنظیمات IP.
✔ ریست کردن iLO از طریق iLO Web Interface یا سرور.
✔ آپدیت Firmware iLO از طریق HPE SPP.
نتیجهگیری
خطاهای بوت در سرورهای HPE نسل ۱۰ میتوانند دلایل سختافزاری یا نرمافزاری داشته باشند. استفاده از iLO، HPE Smart Storage Administrator و System Logs میتواند به تشخیص سریع مشکلات کمک کند. همچنین، بهروزرسانی Firmware، بررسی سختافزار و استفاده از قطعات سازگار با سرور از جمله روشهای پیشگیری از این خطاها هستند.