پشتیبانی آنلاین

49 17 49 66 021

 

امکان ارسال

به تمام نقاط ایران

 

بررسی خطاهای رایج در سرور G10

سرور G10

مقدمه

سرورهای G10 شرکت Hewlett Packard Enterprise (HPE) به دلیل پایداری، قدرت پردازش بالا و امکانات مدیریتی پیشرفته، در بسیاری از مراکز داده و سازمان‌ها مورد استفاده قرار می‌گیرند. با این حال، گاهی اوقات هنگام بوت شدن (Startup) این سرورها، خطاهایی رخ می‌دهد که ممکن است عملکرد سیستم را مختل کند. این خطاها می‌توانند به دلایل مختلفی مانند مشکلات سخت‌افزاری، ناسازگاری‌های نرم‌افزاری یا تنظیمات اشتباه در BIOS/UEFI باشند.

در این مقاله، به بررسی خطاهای رایج بوت در سرور G10 و کدهای خطای مربوطه می‌پردازیم و راهکارهای رفع این خطاها را ارائه می‌دهیم.


۱. خطای POST Failure و کدهای مرتبط

(Power-On Self-Test – POST) فرآیندی است که سرور قبل از بوت شدن سیستم‌عامل، قطعات سخت‌افزاری را بررسی کرده و در صورت وجود مشکل، یک پیام خطا نمایش داده یا از طریق LED و صفحه‌نمایش iLO اطلاع‌رسانی می‌کند.

کدهای خطای POST مربوط به سرور G10 و معانی آن‌ها:

کد خطاشرح خطاراه‌حل پیشنهادی
900-seriesمشکلات مربوط به پردازندهبررسی نصب صحیح پردازنده، اطمینان از پشتیبانی شدن توسط BIOS
1000-seriesمشکلات مربوط به حافظه (RAM)بررسی نصب صحیح ماژول‌های رم، تعویض یا تغییر اسلات
1400-seriesخطای مربوط به چیپست سیستمبررسی تنظیمات BIOS و آپدیت Firmware
2000-seriesمشکلات مربوط به دستگاه‌های جانبیبررسی کارت‌های PCIe و تجهیزات متصل
3000-seriesمشکلات مربوط به کنترلر RAIDبررسی وضعیت آرایه‌های ذخیره‌سازی و سلامت دیسک‌ها

۲. خطای “No Bootable Device Found”

شرح خطا:

این خطا نشان می‌دهد که سرور نمی‌تواند یک دستگاه بوت معتبر را پیدا کند. این مشکل می‌تواند به دلایل زیر رخ دهد:

🔸 تنظیمات نادرست بوت در BIOS/UEFI
🔸 مشکلات کنترلر RAID یا پیکربندی اشتباه
🔸 خرابی یا جدا شدن کابل دیسک‌های ذخیره‌سازی
🔸 خرابی سیستم‌عامل یا از بین رفتن فایل‌های بوت

راهکارهای پیشنهادی:

✔ وارد BIOS/UEFI سرور G10 شوید و ترتیب بوت را بررسی کنید.
✔ در صورت استفاده از RAID، تنظیمات آن را در HPE Smart Storage Administrator (SSA) بررسی کنید.
✔ درایوهای ذخیره‌سازی را از لحاظ اتصال فیزیکی و سلامت دیسک‌ها بررسی کنید.
✔ اگر از بوت شبکه (PXE Boot) استفاده می‌کنید، تنظیمات DHCP و TFTP را بررسی کنید.


۳. خطای “Processor Configuration Error”

شرح خطا:

این خطا معمولاً به دلیل مشکلاتی در پردازنده (CPU) رخ می‌دهد و ممکن است با کدهایی مانند 900-CPU Configuration Error در iLO نمایش داده شود.

علل احتمالی:

🔹 نصب نادرست پردازنده
🔹 ناسازگاری CPU با مادربرد یا BIOS
🔹 مشکلات حرارتی یا Overheating
🔹 آسیب‌دیدگی پردازنده یا پین‌های سوکت

راهکارهای پیشنهادی:

✔ بررسی کنید که پردازنده به درستی در سوکت نصب شده باشد و هیچ پینی خم نشده باشد.
✔ از آخرین نسخه BIOS استفاده کنید.
✔ اگر دو پردازنده روی سرور نصب شده است، اطمینان حاصل کنید که ماژول‌های رم به درستی توزیع شده باشند.
✔ تست سرور با یک پردازنده برای بررسی سلامت سخت‌افزار.


۴. خطای “Memory Initialization Error”

شرح خطا:

این خطا معمولاً مربوط به مشکلات حافظه (RAM) است و کدهایی مانند 1000-Memory Configuration Error نمایش داده می‌شود.

علل احتمالی:

🔹 ماژول‌های RAM به درستی نصب نشده‌اند.
🔹 ناسازگاری ماژول‌های RAM با سرور.
🔹 استفاده از ترکیب نامناسب رم‌های LRDIMM و RDIMM.
🔹 اسلات‌های RAM دچار مشکل شده‌اند.

راهکارهای پیشنهادی:

✔ ماژول‌های RAM را مجدداً جا بزنید و ترتیب نصب را طبق مستندات HPE QuickSpecs بررسی کنید.
✔ از رم‌های سازگار با سرور استفاده کنید (HPE Smart Memory).
✔ سرور را با حداقل حافظه (Minimal Configuration) بوت کنید.
✔ در صورت تداوم مشکل، iLO System Logs را بررسی کنید.


۵. خطای “Fan Failure Detected”

شرح خطا:

این خطا نشان‌دهنده خرابی فن‌های خنک‌کننده یا عدم عملکرد صحیح آن‌هاست.

علل احتمالی:

🔹 خرابی فیزیکی یکی از فن‌ها
🔹 جدا شدن کابل اتصال فن به مادربرد
🔹 ناسازگاری فن با سرور

راهکارهای پیشنهادی:

✔ بررسی کنید که همه فن‌ها متصل و در حال چرخش باشند.
✔ از iLO برای مشاهده وضعیت فن‌ها استفاده کنید.
✔ در صورت استفاده از فن‌های جدید، از سازگاری آن‌ها با سرور اطمینان حاصل کنید.


۶. خطای “RAID Controller Failure”

شرح خطا:

این خطا معمولاً هنگام بوت شدن سرور G10 و در HPE Smart Array Controller ظاهر می‌شود.

علل احتمالی:

🔹 خرابی سخت‌افزاری کنترلر RAID
🔹 ناسازگاری Firmware کنترلر
🔹 مشکلات مربوط به کش (Cache) یا باتری بکاپ (BBWC)

راهکارهای پیشنهادی:

✔ بررسی کنید که کنترلر RAID به درستی در اسلات PCIe قرار گرفته باشد.
✔ از آخرین نسخه Firmware برای کنترلر استفاده کنید.
✔ در صورت وجود مشکل در کش یا باتری بکاپ، تعویض آن را بررسی کنید.
✔ وضعیت RAID را در HPE Smart Storage Administrator چک کنید.


۷. خطای “iLO Communication Error”

شرح خطا:

این خطا معمولاً در iLO (Integrated Lights-Out) رخ داده و می‌تواند عملکرد مدیریتی سرور را مختل کند.

راهکارهای پیشنهادی:

✔ بررسی اتصال شبکه iLO و تنظیمات IP.
✔ ریست کردن iLO از طریق iLO Web Interface یا سرور.
✔ آپدیت Firmware iLO از طریق HPE SPP.


نتیجه‌گیری

خطاهای بوت در سرورهای HPE نسل ۱۰ می‌توانند دلایل سخت‌افزاری یا نرم‌افزاری داشته باشند. استفاده از iLO، HPE Smart Storage Administrator و System Logs می‌تواند به تشخیص سریع مشکلات کمک کند. همچنین، به‌روزرسانی Firmware، بررسی سخت‌افزار و استفاده از قطعات سازگار با سرور از جمله روش‌های پیشگیری از این خطاها هستند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

سایر مطالب پیشنهادی به شما

تماس با ما

خواندن این مطالب را هم به شما پیشنهاد می‌کنیم