به نظر میرسد دعوای AMD و انویدیا بر سر اینکه کدامیک از شتاب دهندههای MI300X یا H100 عملکرد بهتری دارد تمام نشدنی است؛ چرا که هرکدام از این شرکتها به منظور نمایش عملکرد بهتر شتاب دهنده خود بنچمارک جدیدی را منتشر میکنند. AMD در جدیدترین بنچمارک منتشر شده نشان داده است که حتی با استفاده از نرم افزارهای بهینه شده، MI300X چیزی در حدود 30 درصد بهتر از شتاب دهنده H100 عمل میکند.
پس از اینکه AMD در مراسم معرفی شتاب دهنده گرافیکی MI300X اعلام کرد آن چیزی در حدود 1.6 برابر عملکرد بهتری نسبت به Nvidia H100 دارد انویدیا دو روز پیش با انتشار اطلاعیهای نشان داد که AMD در هنگام مقایسه عملکرد این دو تراشه از نرم افزار بهینه شده توسط آن استفاده نکرده است و این بنچمارک نشان دهنده عملکرد شتاب دهنده این شرکت نیست. انویدیا در این اطلاعیه نتایج بنچمارکی را منتشر کرده بود که نشان میداد در صورت بهینه سازی مناسب، شتاب دهنده H100 آن قادر است تا 1.5 برابر سریعتر از شتاب دهنده MI300X عمل کند.
انویدیا در این مطلب خود اعلام کرده است که AMD در بنچمارکهای جدید خود از کتابخانههای بهینه شده نظیر TensorRT-LLM استفاده نکرده است. استفاده از این کتابخانه سبب میشود که عملکرد این شتاب دهنده انویدیا بهبود فراوانی پیدا کند. آنطور که انویدیا نشان داده است این کتابخانه سبب میشود کارت H100 چیزی در حدود 50 درصد از شتاب دهنده Instinct MI300X عملکرد بهتری را فراهم کند.
اما براساس گزارشی که امروز از سوی Tomshardware منتشر شد، AMD پس از انتشار این اطلاعات از سوی انویدیا دست به کار شده است تا نشان دهد حتی در صورت استفاده از نرم افزار بهینهسازی مناسب، بازهم شتاب دهنده MI300X میتواند عملکرد بسیار بهتری را از خود نشان دهد. AMD با انتشار نتایج این بنچمارک اعلام کرده است که Instinct MI300X حتی در این حالت میتواند تا 30 درصد بهتر از Nvidia H100 عمل کند.
AMD اعلام کرده که در بنچمارکهای این شرکت از کتابخانه vLLM بر روی شتاب دهنده H100 استفاده شده است این در حالی است که در بنچمارک جدید منتشر شده از سوی انویدیا شاهد استفاده از کتابخانه TensorRT-LLM هستیم. این شرکت همچنین عنوان کرده است که در این بنچمارکهای انویدیا عملکرد شتاب دهنده Instinct MI300X به صورت FP16 با عملکرد H100 به صورت FP8 به مقایسه گذاشته شده است. این شرکت همچنین معتقد است که میزان زمان تاخیر گزارش شده توسط آن در بنچمارکهای انویدیا به اشتباه لحاظ شده است.
در بنچمارک جدید AMD که در پاسخ به بنچمارکهای انویدیا منتشر شده است میتوان دید که شتاب دهنده Instinct MI300X با استفاده از کتابخانه vLLM چیزی در حدود 30 درصد بهتر از شتاب دهنده H100 با استفاده از کتابخانه TensorRT-LLM عمل میکند. این در حالی است که در صورت استفاده از کتابخانه vLLM بر روی هردوی این شتاب دهندهها شاهد عملکرد 2.1 برابر بهتر Instinct MI300X نسبت به H100 هستیم. با توجه به اینکه vLLM یک کتابخانه متن باز است از سوی توسعه دهندگان بیشتر مورد استفاده قرار میگیرد.
در همین رابطه بخوانید:
- AMD پردازنده های دیتاسنتر و هوش مصنوعی سری Instict MI300 را معرفی کرد؛ 1.5 ترابایت حافظه HBM برای رقابت با انویدیا
- مصرف انرژی پردازنده گرافیکی MI300X مشخص شد؛ 750 وات ناقابل!
- رونمایی AMD از غولهای پردازشی Instinct MI300؛ تا 4 برابر سریعتر از H100 انویدیا
در بخش سوم از این بنچمارک جدید AMD نیز اعلام شده است که شتاب دهنده Instinct MI300X دارای زمان تاخیر کمتری نیز نسبت به شتاب دهنده H100 انویدیا است. اکنون باید دید که انویدیا در پاسخ به این بنچمارک جدید منتشر شده از سوی AMD چه اطلاعاتی را منتشر میکند. انتشار این بنچمارکهای متعدد از سوی انویدیا و AMD نشان میدهد که هوش مصنوعی از اهمیت زیادی برای آنها برخوردار است و هیچکدام حاضر به پذیرش شکست در مورد شتاب دهندههای خود نیستند.
ورود اینتل به این صنعت با شتاب دهندههای Gaudi 3 میتواند جذابیت این رقابت را بیشتر نیز کند. این شرکت قصد دارد این رده از شتاب دهندههای هوش مصنوعی خود را در سال 2024 روانه بازار کند. با توجه به اینکه بیش از یکسال از عرضه شتاب دهندههای H100 انویدیا میگذرد باید دید این شرکت برای پاسخ به AMD و اینتل چه محصولاتی را تولید و عرضه خواهد کرد.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت