همانطور که می دانید شب گذشته انویدیا شتاب دهنده Tesla V100 مجهز به یک پردازنده گرافیکی مبتنی بر ریزمعماری جدید Volta را معرفی کرد. GV100 کُد تراشه بکار رفته در این شتاب دهنده است که ویژگی های خارق العاده ای چون برخورداری از در مجموع 5376 هسته CUDA و 16 گیگابایت حافظه HBM دارد. با اینکه ما درباره یک شتاب دهنده مخصوص مصارف حرفه ای صحبت می کنیم، اما برای گیمرها هم اهمیت خاص خود را دارد، چراکه تراشه GV100 نیرو بخش دو کارت TITAN Xv و GTX 2080 Ti نیز خواهد بود. در ادامه به تشریح کامل این تراشه بسیار پیشرفته می پردازیم.

تراشه GV100 دارای ساختار و اجزای مشابه نسل پیشین انویدیا است اما تغییرات اساسی در بخش محاسباتی و واحدهای SM صورت گرفته است. واحدهای SM مبتنی بر ریزمعماری Volta که در تراشه GV100 یافت می شوند دارای هر دو هسته های  CUDA نوع FP64 و FP32 هستند. البته در کارت های گرافیک مخصوص مصرف کننده یا به طور مشخص مخصوص گیمینگ مبتنی بر این تراشه، هسته های FP64 غیر فعال خواهد بود.

هر واحد SM دربرگیرنده 64 هسته CUDA  نوع FP32 و 32 هسته  نوع FP64 است. هسته های FP64 قادر به اجرای عملیات 32 بیتی، 16 بیتی و 8 بیتی هستند. تراشه GV100 در مجموع دارای 84 واحد SM است، بنابراین ما با تعداد 5,376 هسته CUDA نوع FP32 و 2,688 هسته CUDA نوع FP64 روبرو هستیم. همچنین با ریزمعماری Volta شاهد گونه جدیدی از هسته های پردازشی به نام Tensor هستیم که مخصوص یادگیری ماشین هستند. هر واحد SM دارای 8 هسته Tensor است، بنابراین این تراشه در مجموع دارای 672 هسته Tensor است. هسته های Tensor نیز برای کارت های گرافیک مخصوص مصرف کنندگان غیرفعال خواهند شد.  تراشه GV100 دارای 336 واحد TMU است. توان حرارتی این تراشه 300 وات است.

به ادعای انویدیا Tesla V100 در مقایسه با شتاب دهنده Tesla P100 مبتنی بر ریزمعماری Pascal در محاسبات FP32 و FP64 تا 50 درصد کارایی بالاتری ارائه می کند. حداکثر قدرت محاسباتی FP32 این شتاب دهنده به 15 ترافلاپ و قدرت محاسباتی FP64 آن حداکثر به 7.5 ترافلاپ می رسد. هسته های Tensor نیز قدرت محاسباتی 120 ترافلاپ را ارائه می کنند. البته هسته های Tensor استفاده بسیار خاص دارند و برخلاف هسته های CUDA چندمنظوره نیستند. این هسته ها برای ضرب ماتریس-ماتریس طراحی شده اند که عملیات ریاضی اصلی در یادگیری شبکه های مصنوعی است. به ادعای انویدیا تعبیه هسته های Tensor یادگیری و ساخت شبکه های عصبی مصنوعی را 12 برابر سرعت می بخشد.

GV100 یک تراشه متشکل از چندین ماژول (موسوم به MCM) با انداز 815 میلی متر مربع است که از 21.1 میلیارد ترانزیستور تشکیل شده است. این تراشه با بکارگیری فناوری ساخت 12 نانومتری تولید می شود. GV100 به 16 گیگابایت حافظه HBM2 متشکل از چهار تراشه 32 گیگابیتی تعبیه شده بر روی همان قطعه سیلیکونی اصلی مجهز است که از طریق رابط حافظه 4096 بیتی با پردازنده گرافیکی در ارتباط است. این تراشه ها دارای فرکانس موثر 1 گیگاهرتز هستند و پهنای باند حافظه موثر 1 ترابایت را فراهم می کنند.

از آنجایی که بکارگیری تراشه های HBM2 می تواند به افزایش چشمگیر هزینه ساخت منجر شود، ممکن است گونه مخصوص کارت های رده مصرف کننده این تراشه از تراشه های GDDR6 بهره بگیرند. در این حالت افزون قبر هسته های FP64 و هسته های Tensor، حافظه HBM2 نیز برای مصرف کنندگان ارائه نخواهد شد.

لازم به ذکر است اولین محصول مبتنی بر تراشه GV100 که شتاب دهنده Tesla P100 خواهد بود، مبتنی بر گونه تقلیل یافته ای از تراشه مزبور است. جدول مشخصات موجود در این نوشتار مربوط به گونه تقلیل نیافته (چاق) تراشه GV100 است.

نظر خود را اضافه کنید.

ارسال نظر بدون عضویت در سایت

0

نظرات (45)

  • خیر استاد ، پرو دیو تشکیل شده از دوتا r9 290 نه دوتا فیوری ، فیوری 3500 هسته داره اما پرو دیو دو تا 4000 هسته هست

    اشتباه میکنی، زور چپونیم میکنی ، حرف حق هم قبول نمیکنی

  • مهمان - amir467

    در پاسخ به: raminr

    یه احمق واقعی هستی که لنگت تو ایران پیدا نمیشه:(

  • در پاسخ به: raminr

    باو این دیگه کیه
    یکی جمعش کنه
    هیچی بارش نیست و داره کاملا اشتباه میگه ، حتی حالیش نیست بره یه سرچ بکنه ببینه قضیه چیه

  • مهمان - amir467

    در پاسخ به: raminr

    به والله هیچی حالیت نیس. گفته Supercomputing Stations قیمتش 150k عه

  • مهمان - حسین

    در پاسخ به: raminr

    هم خنگی هم بی‌سواد مگه برات لینک نزاشتم.
    در ضمن من نگفتم فیوری گفتم فیوری اکس.
    بس که چرت و پرت میگی و بی‌سواد هستی برام دم از حرف حق میزنی ؟ تو اصلا میدونی سیلیکون Fiji xt چی هست ؟ برات دوباره لینک میزارم لینک برو بخون هرچند میدونم سواد نداری ولی میتونی تو عکس ببینی که تو این کارت از ۸ گیگ حافظه hbm استفاده شده ( هر سیلیکون ۴ گیگ) چیزی که تو زمان معرفی ۲۹۵ وجود نداشت . این هم لینک کارت ۲۹۵. برو ببین از چی تشکیل داده شده . میدونی سیلیکون Hawaii چی هست؟ میدونی چند نانومتره ؟ فیجی چند نانومتره ؟ حرف زدن باهات فایده نداره و بر بی‌سوادیت هم تاکید داری چون سواد نداری برات دوتا عکس میزارم شاید یکم مغزت باز بشه که بعید میدونم. این تصاویر ۲۹۵
    https://www.techpowerup.com/reviews/AMD/R9_295_X2/images/front.jpg
    https://www.techpowerup.com/reviews/AMD/R9_295_X2/images/back.jpg
    مشخصه که از حافظه‌های gddr5 استفاده شده (اگه بفهمی)
    این هم پرو دیو
    https://www.techpowerup.com/reviews/AMD/Radeon_Pro_Duo_Preview/images/pcb2.jpg
    اینجا هم مشخصه که از حافظه‌های hbm استفاده شده (جهت اطلاع حافظه ‌های hbm رو برد مدار چاپی نصب نمیشن رو سیلیکون نصب میشن) اینو گفتم چون میدونم سوادش رو نداری.گفتم و تکرار میکنم نمیدونی تو چه کارتی از چه سیلیکونی استفاده شده هیچی هم بارت نیست فقط بلدی عر‌عر کنی.

  • مهمان - witcher

    در پاسخ به: مهمان - حسین

    الان همین هایی که براش گفتی رو میاد کپی میکنه ۲ جا میفرسته که بگه خیلی وارد هستش! :) :)

  • مهمان - Division

    این یک هیولای واقعی هست.
    کامپیوتر Volta DGX-1 هنوز نیومده، از طرف IBM و ایلان ماسک، برای اون تقاضا داده شده.
    واحدهای پرازشی Tensor هم، به‎نظر می‎رسه مخصوص گوگل باشه. گوگل که قبلاً مشتری دائم اِنویدیا بود، حالا خیلی بیش‎تر از تراشه‎های اِنویدیا تهیّه می‎کنه.

    NVLINK 2.0 هم معرّفی شد، که نزدیکِ 4 تا 5 برابر، پهنای باند بیش‎تری نسبت‎به PCIe 3.0 داره.

    ــ واقعاً، هیچ‎چیز جلودار اِنویدیا نیست.

  • مهمان - حسین

    در پاسخ به رامین رستمی
    کارت پرو دیو یک نسخه بیشتر نداره که از دوتا سیلیکون فیوری اکس متشکل شده متن شما برای لینک کردن
    کارت ایسوس اریس ۳ همون نسخه کاستوم ۲۹۵ هست. چجوری میای میگی دوقلوی ۲۹۵ ؟ خود ۲۹۵ dual GPU هست چطور میشه دو کارت dual GPU رو تو یک کارت جا سازی کرد؟ یعنی ۴ سیلیکون تو یک کارت ؟ تو دیگه چقدر بیسواد و احمقی متن شما برای لینک کردن برو بخون ببین ایسوس اریس از چی تشکیل داده شده.
    تو حتی نمیدونی تو چه کارتی از چه سیلیکونی استفاده شده فقط میای چرت و پرت تحویل مردم میدی.

  • خیر استاد ، پرو دیو تشکیل شده از دوتا r9 290 نه دوتا فیوری ، فیوری 3500 هسته داره اما پرو دیو دو تا 4000 هسته هست

    اشتباه میکنی، زور چپونیم میکنی ، حرف حق هم قبول نمیکنی

  • تو خوبی ، عجیبه که بعضیا جای تحقیق ، رک گردنشون بالا میزنه

بارگذاری بیشتر ...

ورود به شهرسخت‌افزار

ثبت نام در شهر سخت افزار
ورود به شهر سخت افزار

ثبت نام در شهر سخت افزار

نام و نام خانوادگی(*)
لطفا نام خود را وارد کنید

ایمیل(*)
لطفا ایمیل خود را به درستی وارد کنید

رمز عبور(*)
لطفا رمز عبور خود را وارد کنید

شماره موبایل
Invalid Input

جزو کدام دسته از اشخاص هستید؟(*)

لطفا یکی از موارد را انتخاب کنید