انجام پردازش های سنگین توسط new nvidia Tesla C2070

gp-gpu

Member
سلام و صد سلام و درود و دو صد درود
________________________________
Nvidia_SC09_Fermi_Tesla_2.jpg

Nvidia_Tesla_C2050-C2070.jpg

آخرين کارتهاي پردازشي nvidia که بر پايه معماري fermi ساخته شده اند TESLA C2050 و TESLA C2070 هستند که از قدرت خارق العاده اي برخوردار مي باشند.TESLA C2070 & TESLA C2050 با ساختاري جديد طراحي شده اند تا امکان استفاده از انجام محاسبات با کارايي بسيار بالا و ايجاد ابر کامپيوتر هاي خانگي براي همگان فراهم باشد.:cool:
ارائه عملکرد خوشه اي "cluster" با يک دهم هزينه.دارا بودن 448 هسته کودا که موجب افزايش توان پردازشي در حالت دو دقتي تا 515 GFLOP/s در هر پردازنده گرافيکي و توانايي فعال سازي يک ايستگاه کاري با توان پردازشي معادل يک TFLOP/s و بيشتر،دارا بودن حداکثر توانايي در حالت تک دقتي يعني تواني بيش از يک TFLOP/s در هر GPU.
مجهز به 6 GB حافظه RAM از نو,ع GDDR5 .اين رم ها داراي قابليت کد تصحيح خطا يا همان ECC مي باشند.
ECC:Error Correction Code استفاده از اين قابليت براي پردازشهاي موازي از اهميت بالايي برخوردار است و سبب حفاظت از اطلاعات موجود در حافظه به منظور افزايش يکپارچگي داده ها و افزايش ضريب اطمينان در برنامه هاي کاربردي مي شود.
در اين سري از کارتهاي تسلا ، فايل هاي رجيستر ، L1/L2 caches ، Shared memory و DRAM=Dedicated RAM همگي داراي ECC هستند.
دارا بودن ميزان 6 گيگ رم: در TESLA C2070 با نگه داري مجموعه هاي بزرگتري از داده ها و انتقال مستقيم آن به GPU موجب رسيدن به نهايت کارايي و کاهش تعداد انتقال ها مي گردد.
الگوريتم هاي تسريع شده از قبيل حل کننده هاي فيزيک ، ري-تريسينگ و ضرب ماتريس پراکنده.اين شامل حافظه نهان مرحله اول قابل تنظيم در هر بلوک SM که مخفف Streaming Multiprocessor و حافظه سطح دوم متحد بين تمام هسته هاي GPU مي شود.
extrusion-1-small.gif

galleryofgraphs2.png

بکارگيري nvidia gigathread engine: حد اکثر توان عملياتي با چارچوب تعويض سريعتر که 10بار سريعتر از معماري قبلي است را به ارمغان آورده است.
تکنيک انتقال ناهمگام:توربو شارژ کردن کارايي سيستم با انتقال داده از درگاه PCIe در حالي هسته هاي پردازشي دگير ديگر داده ها هستند.حتي برنامه هايي که نيازمند انتقال داده هاي حجيم هستند مانند برنامه هاي پردازش لرزه اي مي توانند توسط انتقال داده ها به حافظه محلي قبل از اينکه مورد نياز باشند به حداکثر کارايي در محاسبات دست يابند.
برنامه ريزي:پشتيباني از زبانهاي برنامه نويسي و API هاي C و ++C و OpenCL و Microsoft Direct Compute و فورترن براي برنامه هاي سفارشي پردازش موازي.همچنين nvidia Parallel Nsight tool براي کاربران و توسعه دهنگاني که از Microsoft Visual Studio استفاده مي کنند در دسترس است.
توانايي کار با سيستم عامل هاي windows XP و ٌvista و 7 32 و 64 بيتي و Linux هاي 32 و 64 بيتي.
ديگر خصوصيات :
number of GPU:1
number of CUDA Cores:448
Frequency of CUDA Cores:1.15GHz
Double precision floating point performance:515 GFLOPS Peak
Single precision floating point performance peak:1.03 Tflops
Total Dedicated memory in TESLA C2050:3 GB GDDR5
Total Dedicated memory in TESLA C2070 :6 GB GDDR5
Memory speed:1.5 GHz
Memory Interface:384-bit
Memory bandwidth:144 GB/s
Power consumption:247 W TDP
System interface:pCIe X16 gen 2
thermal solotion:active fansink
Software dvelopment tools:CUDA-C-C++-Fortran-OpenCL-Direct compute tool kits-nvidia parallel nsight for MVS Developers
_______________________________________
نکته:وقتي ECC در رم فعال باشد اگر براي مثال 3 گيگ رم داشته باشيم 12.5% از آن کم شده و به bit هاي Error Correction Code اختصاص داده مي شود که نهايتا ميزان 2.625 'گيگا بايت باقي مي ماند.
________________________________________________________________________________________
snipshot_e4pxdsrep8v.jpg
 

جدیدترین ارسال ها

بالا