در خلال کنفرانس GTC 2017 مدیر عامل انویدیا رسماً از شتاب دهنده جدید TESLA V100 مبتنی بر ریزمعماری پردازنده گرافیکی Volta برای مصارف حرفه ای پرده برداشت. این پردازنده پرقدرت دارای 5376 هسته CUDA و حافظه HBM2 است.
تراشه بکار رفته در TESLA V100یک هیولای به تمام معنا با برخورداری از 21 میلیارد ترانزیستور است. این تراشه با بکارگیری فناوری ساخت 12 نانومتری مبتنی بر ترانزیستورهای FinFET توسط کمپانی TSMC تولید خواهد شد. بکارگیری فناوری ساخت کوچک این امکان را با انویدیا بخشیده تا به رغم افزایش نسبتاً ناچیز اندازه تراشه، منابع بیشتری در آن تعبیه کند. این تراشه از 84 واحد SM، هر واحد با برخورداری از 64 هسته CUDA تشکیل شده که در مجموع تعداد 5376 هسته FP32 CUDA را تشکیل می دهند. این تراشه تعداد 2688 هسته FP64 CUDA (نسبت هسته های FP32 به FP64ا1:2) را نیز در خود جای داده است. همچنین انویدیا هسته های جدیدی به نام Tensor Core تعبیه کرده است.
هسته ای Tensor گونه تازه ای از هسته پردازشی هستند که در پردازنده های گرافیکی مبتنی بر ریزمعماری Volta یافت می شود. این هسته ها به رغم قابل برنامه ریزی بودن انعطاف پذیری کمتری نسبت به هسته های CUDA دارد و به طور اختصاصی برای یادگیری عمیق Tensor طراحی شده اند.
در حقیقت این هسته ها مجموعه عظیمی از واحدهای محاسبه و منطق (موسوم به ALU) برای اجرای عملیات ماتریس 4x4 یا به طور مشخص ضرب کردن ماتریس (A*B+C) به صورت ضرب دو ماتریس 4x4 FP16 و سپس اضافه کردن نتیجه به یک ماتریس FP16 یا FP32 4x4 برای تولید ماتریس 4x4 FP32 matrix حاصل هستند.
Volta V100 به 16 گیگابایت حافظه HBM2 مجهز است که پهنای باند حافظه 900 گیگابایت بر ثانیه را به آن می بخشد. این تراشه دارای توان حرارتی 300 وات است.
قدرت محاسباتی FP32 این شتاب دهنده 15 ترافلاپ و قدرت محاسباتی FP64 آن 7.5 ترافلاپ است.
می توان انتظار داشت پردازنده گرافیکی پرقدرت بکاررفته در شتاب دهنده Volta V100 نیرو بخش کارت گرافیک Titan X و یا حتی GTX Ti بعدی انویدیا باشد. همچنین احتمالاً پردازنده های گرافیک سری GTX 20xx انویدیا نیز با بکارگیری فناوری ساخت 12 نانومتری تولید شوند.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت