بنابر جدیدترین اخبار واصله، انویدیا از سازندگان SSD خواسته به نرخ تبادل ۱۰۰ میلیون IOPS برسند؛ سطحی از عملکرد که برای حذف گلوگاه ذخیرهسازی در شتابدهندههای AI ضروری است. این هدف بلندپروازانه حالا شرکتهایی مانند Kioxia و Silicon Motion را وارد رقابتی کرده که میتواند معماری حافظههای آینده را متحول کند.
در حالیکه معماری شتابدهندههای هوش مصنوعی به سمت نرخ انتقال حافظههای داخلی در سطح چند ترابایت بر ثانیه رفته، زیرساختهای ذخیرهسازی به عنوان یکی از بارزترین گلوگاههای کارایی در سیستمهای یادگیری ماشین و استنتاج، به چالشی اساسی بدل شدهاند. در این میان، شرکت انویدیا (NVIDIA) در تلاش است تا با همکاری تولیدکنندگان سختافزار ذخیرهسازی مانند Silicon Motion، Kioxia و Western Digital، راهکارهایی را برای عبور از این محدودیت ارائه دهد.
بنابر گزارش Toms Hardware، طبق اطلاعات ارائهشده در مصاحبه اختصاصی این رسانه با Wallace C. Kuo مدیرعامل Silicon Motion Inc، هدف مشترک، توسعه SSDهای با نرخ IOPS در محدوده ۱۰۰ میلیون است؛ رقمی که تا امروز در هیچ معماری ذخیرهسازی قابلحمل یا سروری دیده نشده است.
همانطور که میدانید معیار IOPS (عملیات ورودی/خروجی در ثانیه) معیاری برای سنجش تعداد عملیات خواندن یا نوشتن تصادفی است که یک دستگاه ذخیرهسازی، مانند SSD، میتواند در هر ثانیه انجام دهد. این شاخص بهخصوص برای بارهای کاری حساس به تأخیر، مانند پردازش دادههای کوچک و پراکنده در هوش مصنوعی، اهمیت حیاتی دارد.

شتابدهندههای AI به پهنای باند فراتر از تصور امروزی نیاز دارند
انویدیا در نسل جدید شتابدهندههای GPU مانند B200، از حافظههای HBM3E با نرخ ۸ ترابایت بر ثانیه استفاده میکند. این نرخ پهنای باند حافظه، چندین برابر بیشتر از ظرفیت گذرگاههای (باس) ذخیرهسازی استاندارد مانند PCIe Gen5 x4 است که حداکثر به ۱۴.۵ گیگابایت بر ثانیه میرسند. اگرچه این میزان برای کاربردهای مصرفی یا تجاری قابل قبول است، اما برای پشتیبانی از الگوهای دسترسی تصادفی و خرد (Small-block Random Access) مورد نیاز مدلهای Transformer و LLMها، بههیچوجه کفایت نمیکند.
SSDهای PCIe 5.0 x4 فعلی مانند Samsung PM1743 یا Solidigm P5430 معمولاً بین ۲ تا ۳ میلیون IOPS برای بلوکهای تصادفی ۵۱۲ بایتی و ۴ کیلوبایتی فراهم میکنند. در این معماریها، بلوکهای ۴ کیلوبایتی برای بهینهسازی نرخ انتقال مفید هستند، اما کاربردهای AI اغلب به تاخیر بسیار پایین در خواندن حجم اندک داده (یعنی بلوکهای 512 بایتی یا حتی کوچکتر) وابستهاند، چراکه مدلهای یادگیری عمیق به صورت پراکنده و با نرخ بالای فراخوانی پارامترها کار میکنند.
چرا دستیابی به 100 میلیون IOPS چالشبرانگیز است؟
دستیابی به افزایش ۳۳ برابری نرخ IOPS نسبت به سطح فعلی بازار، مستلزم بازنگری در طراحی کنترلر SSD، معماری فریمور و ساختار NAND Flash است. اکثر SSDهای امروزی از حافظه NAND نوع TLC یا QLC استفاده میکنند که از نظر زمان پاسخدهی (latency) و توان عملیاتی در سطح سختافزار محدودند.

حتی با بهرهگیری از پردازندههای کنترلی چندکاناله و فریمورکهای مبتنی بر NVMe 2.0 نیز رسیدن به این مقدار عملیات بر ثانیه در یک درایو منفرد، از نظر حرارتی و مصرف انرژی، در محدوده عملیاتی قابل قبول ممکن نیست. اما راهکار صنعت اس اس دی با وجود این محدودیتها چیست؟
گزینههای فعلی صنعت: XL-Flash، Optane، و HBF
Kioxia، بهعنوان یکی از معدود تولیدکنندگان فعال در حافظههای پرسرعت، در حال کار روی محصولی تحت عنوان AI SSD بر پایه XL-Flash است؛ نوعی حافظه NAND با تأخیر کمتر از SLCهای سنتی و IOPS هدف بالای ۱۰ میلیون در اندازه بلوک ۵۱۲ بایت. زمانبندی اعلامشده برای عرضه این محصول، نیمه دوم سال ۲۰۲۵ و احتمالاً همزمان با معرفی پلتفرم Vera Rubin انویدیا خواهد بود.
اما دستیابی به ۱۰۰M IOPS روی یک واحد درایو منفرد هنوز با فناوریهای فعلی NAND بعید به نظر میرسد. کوئو در این زمینه میگوید:
رسیدن به این هدف با NAND معمولی، آن هم با محدودیتهای مصرف انرژی و هزینه، فوقالعاده دشوار است. شاید لازم باشد به دنبال تغییر بستر درایوهای SSD باشیم.
او اشاره میکند که فناوری Optane اینتل (مبتنی بر حافظههای 3D XPoint) قرار بود این خلأ را پر کند، اما پروژه آن در تیم آبی به دلیل مشکلات تجاری و مقیاسپذیری، متوقف شده است. از طرفی Western Digital روی فناوری High Bandwidth Flash (HBF) کار میکند که تلاش دارد حافظه فلش را با پهنای باند بالاتر جایگزین کند.
با این حال، کوئو به موفقیت این راهکارها خوشبین نیست و میگوید:
در حال حاضر هر شرکتی به دنبال معرفی فناوری خاص خود است، اما صنعت بیش از هر چیز به یک تحول بنیادین نیاز دارد. بدون آن، دستیابی به ۱۰۰ میلیون IOPS در شرایط اقتصادی و مصرف توان مطلوب، ممکن نخواهد بود.
آینده: حافظههای NVM در راهاند؟
در حال حاضر، بازیگرانی همچون Micron، SK Hynix، SanDisk و حتی سامسونگ نیز در حال توسعه فناوریهای Non-Volatile Memory (حافظههای غیرفرار) خارج از معماریهای سنتی NAND هستند. اما سؤال کلیدی این است که کدام فناوری میتواند هم در ابعاد فنی و هم در مقیاس تجاری، پایداری و بازدهی لازم را فراهم کند.
در نهایت نظر مدیرعامل سیلیکون موشن درباره سرعت مطالبه انویدیا این است:
تا زمانیکه رسانهای نوظهور با تأخیر پایین، توان مصرفی بهینه و هزینه تولید مناسب وارد بازار نشود، صحبت از ۱۰۰ میلیون IOPS بیشتر یک هدف تئوریک باقی خواهد ماند.
با این وجود باید ببینیم آینده صنعت پردازش هوش مصنوعی به کدام سمت میرود؟ آیا انویدیا یا دیگر توسعه دهندگان شتابدهندههای AI خود را با سرعتهای پایین SSDهای امروزی سازگارتر کرده و صبر میکنند این حوزه پیشرفت بیشتری کند یا به ناگاه انقلابی از سوی سازندگان درایوهای SSD فوق سریع را خواهیم دید که خود را به مطالبه انویدیا نزدیک میکند؟
شاید کمک فضاییها را نیاز داشته باشیم!! نظر شما دوستان در این مورد چیست؟
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت