تراشه GP100 انویدیا زیر ذره‎بین، معماری پاسکال را بهتر بشناسید

تراشه GP100 انویدیا زیر ذره‎بین، معماری پاسکال را بهتر بشناسید

شهر سخت افزار/ به نظر می رسد معماری ریز پردازنده گرافیکی پیش روی انویدیا با کُد Pascal یک هیولای به تمام معنا خواهد بود. اولین محصول مبتنی بر این معماری با نام Tesla P100، که یک شتاب دهنده است، طی کنفرانس GTC2016 معرفی شد. Tesla P100 توان مهیب خود را از تراشه ای با کُد GP100 می گیرد که خوشبختانه دیاگرام بلاک آن منتشر شده و اکنون می توانیم شناخت بهتری از این تراشه و معماری Pascal داشته باشیم. در ادامه به تشریح اجزای مختلف این تراشه قدرتمند می پردازیم، با ما باشید.

برای شروع، GP100 همانند AMD Fiji، یک ماژول در برگیرنده چندین تراشه مختلف است. این تراشه خود در برگیرنده پردازنده گرافیکی نسبتاً بزرگ، چهار تراشه حافظه پشته سازی شده و رابط فیزیکی ویژه ای به نام interposer است که ارتباط میان پردازنده گرافیکی با تراشه های حافظه را ممکن می کند. GP100 دارای رابط حافظه عریض 4096 بیتی HBM2 با پهنای باند اسمی 1 ترابایت بر ثانیه است. در شتاب دهنده Tesla P100، پهنای باند حافظه 720 گیگابایت برثانیه است. ساختار تراشه GP100 بجز دو تفاوت اساسی شامل گذرگاه (باس) و حافظه، مشابه دیگر تراشه های انویدیا است. یک رابط PCI-Express gen 3.0 x16 ارتباط پردازنده گرافیکی با سیستم را ممکن می کند، موتور GigaThread بار پردازشی را بین شش خوشه پردازشی توزیع می کند. هشت کنترلر حافظه رابط عریض 4096 بیتی HBM2 را فراهم می کنند. همچنین یک کامپوننت جدید در این تراشه وجود دارد که Hub پرسرعت خوانده می شود و چهار درگاه NVLink را ارائه می کند. هنوز مشخص نیست که هر یک از این درگاه ها دارای پهنای باند حافظه 80 گیگابایت بر ثانیه هستند و یا این مقدار اعلام شده از سوی انویدیا، مجموع پهنای باند هر چهار درگاه است.

GP100 متشکل از شش خوشه پردازشی است. این خوشه ها زیر مجموعه هایی با استقلال بالا از پردازنده گرافیکی هستند و هر یک از آنها، تمامی اجزای لازم برای پردازش گرافیکی را داراست. با معماری Pascal و یا حداقل در تراشه GP100، هر خوشه پردازشی از 10 واحد SM (streaming multiprocessors) تشکیل شده است. هر یک از این واحد های SM دارای 64 هسته CUDA است. بنابراین هر خوشه پردازشی در برگیرنده 640 هسته CUDA و تراشه GP100 در مجموع دارای تعداد 3,840هسته CUDA است. از دیگر اجزای کلیدی این پردازنده گرافیکی می توان تعداد 240 واحد آدرس دهی بافت (TMU) را برشمرد. در شتاب دهنده Tesla P100 انویدیا از 56 واحد SM از مجموع 60 واحد موجود بهره گرفته تا به 3584 هسته CUDA دست یابد، بنابراین تراشه مورد استفاده در Tesla P100، گونه تقلیل یافته ای از GP100 است و گونه کامل (چاق) می تواند در محصول دیگری چون یک Titan و یا Quadro جدید مورد استفاده قرار گیرد.

به نظر می رسد فرکانس هسته پردازنده های گرافیکی بر پایه Pascal بسیار بالا باشد. علی‎رغم اینکه Tesla P100 برای گیمرها و یا کاربران خانگی طراحی نشده، اما فرکانس پایه هسته آن 1328 مگاهرتز است که در حالت بوست تا 1480 مگاهرتز فرا می رود و توان حرارتی به 300 وات می رسد. احتمالاً اکنون فکر می کنید 300 وات بسیار زیاد است و ما با یک تراشه داغ و پرمصرف روبرو هستیم، اما پیش از قضاوت باید در نظر داشته باشید که تراشه های حافظه از سطح برد PCB کارت گرافیک به همان قطعه سیلیکونی پردازنده گرافیکی منتقل شده اند و این یعنی تغذیه و حرارت تولید شده به حساب تراشه اصلی خواهد بود. بنابراین حرارت گیری که بر روی پردازنده گرافیکی نصب می شود، تراشه های حافظه را نیز خنک نگه خواهد داشت.

مهترین اطلاعات تراشه GP100 اینها بودند، البته قسمت های مربوط به رابط NVLink را می توان بیشتر تشریح کرد اما از آنجایی که این فناوری در کارت های گرافیک معمولی مورد استفاده قرار نمی گیرد، از آن صرف نظر می کنیم.

تراشه GP100 انویدیا زیر ذره‎بین، معماری پاسکال را بهتر بشناسید

[ منبع این خبر سایت ماچو می باشد، برای مشاهده متن اصلی خبر می توانید روی این قسمت کلیک کنید ]

برای نمایش تمام اخبار مرتبط با عنوان «تراشه GP100 انویدیا زیر ذره‎بین، معماری پاسکال را بهتر بشناسید» اینجا کلیک کنید. شفاف سازی:
خبر فوق در سایت ماچو منتشر شده و صرفا در این سایت بازنشر شده است. چنانچه به خبر فوق اعتراض دارید برای حذف آن روی این قسمت کلیک کنید.

نکته: با توجه به جمع آوری خودکار مطالب از سطح وب در صورت مشاهده هرگونه تخلف و یا اخبار غیر مجاز و یا اعتراض به انتشار مطالب سایت ها با ایمیل khabargroup.info@gmail.com در تماس باشید

تبلیغات





تبلیغات