شرکت AMD با معرفی کارت رابط شبکهای جدید Pensando Pollara، نخستین کارت شبکه ۴۰۰ گیگابیتی سازگار با Ultra Ethernet را برای خوشههای هوش مصنوعی در مقیاس زتابایتی عرضه کرد. در ادامه با مشخصات این کارت شبکه که از کارتهای معمولی تا 40 برابر سریعتر است آشنا شوید.
چرا AMD به طراحی کارت شبکه ۴۰۰ گیگابیتی روی آورد؟
با افزایش سریع کاربردهای هوش مصنوعی، حجم دادههایی که میان شتابدهندههای گرافیکی در مراکز داده جابهجا میشود، به سطحی رسیده که زیرساختهای شبکه سنتی دیگر پاسخگو نیستند. در چنین مقیاسی، آنچه حیاتی است، پهنای باند بسیار بالا، تأخیر حداقلی و مدیریت هوشمند ترافیک شبکه است.
بنابر گزارش Toms Hardware، در پاسخ به این نیاز، AMD با تکیه بر فناوری شرکت زیرمجموعه خود، Pensando، اقدام به توسعه کارت شبکهای با سرعت انتقال ۴۰۰ گیگابیت بر ثانیه کرده است. این کارت با عنوان Pensando Pollara 400GbE، نخستین رابط شبکهای است که بهطور کامل با استاندارد Ultra Ethernet سازگار است و برای خوشههای محاسباتی عظیم در حوزه AI و HPC طراحی شده است.
این کارت رابط شبکهای (NIC) که از طریق معماری پردازنده اختصاصی AMD Pensando طراحی و تولید شده، بهعنوان بخش کلیدی در استقرار خوشههای AI و محاسبات با عملکرد بالا (HPC) در مقیاس زتابایت معرفی شده و قابلیت انتقال داده با نرخ 40 برابر سریعتر از کارتهای رده مصرفی را در بستر اترنت ارائه میدهد.
طراحی برای شبکههای در مقیاس میلیونواحدی
کارت شبکه Pollara 400GbE مبتنی بر یک پردازنده اختصاصی با معماری اختصاصی شرکت طراحی شده که توانایی پردازش وظایف حیاتی شبکهای مانند موارد زیر را در سطح سختافزار داراست:
- دسترسی مستقیم به حافظه از راه دور (RDMA)
- پشتیبانی از پروتکلهای حمل سفارشیشونده
- برونسپاری عملکرد کتابخانههای ارتباطی (Communication Offloading)
همچنین باید اشاره کرد که طراحی تطبیقپذیر این NIC باعث شده بهخوبی در کلاسترهای هوش مصنوعی متشکل از صدها هزار GPU قابل استقرار باشد.
بهینهسازی مسیریابی و مدیریت ترافیک در مقیاس ابر
کارت Pollara از توزیع هوشمند جریان داده (Flow Splitting) پشتیبانی میکند؛ بدین معنا که دادهها بهصورت پویا از چندین مسیر انتقال مییابند تا از گلوگاههای پهنای باند جلوگیری شود. همچنین، مسیردهی مجدد پویای ترافیک با تشخیص مسیرهای اشباعشده، موجب حفظ نرخ انتقال پایدار و کاهش تأخیر در ارتباطات بین GPUها میشود.
از دیگر مزایای فنی این کارت، میتوان به فناوری Failover با تأخیر بسیار کم اشاره کرد که اتصال بین GPUها را در صورت بروز خطا، بدون اختلال محسوس حفظ میکند؛ ویژگیای که در محیطهای با تعداد بالا از شتابدهندهها، حیاتی است.
برتری عددی نسبت به رقبا؛ مقایسه با CX7 و Thor2
AMD مدعی است که عملکرد RDMA این NIC، حدود ۱۰ درصد بالاتر از کارت CX7 انویدیا و ۲۰ درصد بیشتر از Thor2 برادکام است. RDMA یا «دسترسی مستقیم به حافظه از راه دور» فناوریای است که امکان انتقال داده میان سیستمها را با کمترین تأخیر و بدون درگیر کردن پردازنده فراهم میسازد.
این افزایش عملکرد بهواسطه پشتیبانی کامل از ویژگیهای مشخصه استاندارد Ultra Ethernet 1.0 محقق شده که شامل تعادل بار تطبیقی (Load-Aware Balancing)، بازارسال انتخابی بستهها (Selective Retransmission) و کنترل تراکم مبتنی بر آگاهی از مسیر (Path-Aware Congestion Control) است.
در مقایسه با فناوری سنتی RoCEv2، این ویژگیها مجموعاً تا ۲۵ درصد بهبود در عملکرد RDMA را بهویژه در توپولوژیهای چندمسیره ارائه میکنند.
اولین مشتری، اوراکل
در جریان رویداد Advancing AI شرکت AMD اعلام کرد که زیرساخت ابری Oracle Cloud Infrastructure (OCI) نخستین شرکت ابری خواهد بود که از این NIC و همچنین نسل جدید شتابدهندههای گرافیکی Instinct MI350X بهرهبرداری خواهد کرد. این زیرساخت قرار است میزبان بزرگترین خوشه GPU محور AMD تا امروز، با بیش از ۱۳۱,۰۷۲ عدد MI355X باشد که برای استقرار مدلهای عظیم هوش مصنوعی طراحی شده است.
آماده برای نسل جدید مدلهای AI در مقیاس عظیم
باید به این نکته نیز توجه داشته باشیم که این روزها مدلهایی مانند GPT-5 و Gemini به منابع پردازشی عظیم و زیرساخت شبکهای با تاخیر پایین نیاز دارند. از اینرو AMD با ارائه Pollara 400GbE و پشتیبانی کامل از Ultra Ethernet، گامی استراتژیک در برابر رقبای دیرینهاش مانند انویدیا و برادکام برداشته است.
با استقرار این کارت در پلتفرم اوراکل و سایر شرکتهای بزرگ، انتظار میرود تجهیزات شبکه Ultra Ethernet بهسرعت در مراکز داده AI و HPC رایج شوند. طبق اعلام رسمی، ارسال این کارتها به شرکای منتخب هماکنون آغاز شده است.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت