Чего стоит ожидать от новых Nvidia GeForce GTX 800?

12.08.2014, 00:31

Шрифт: A- A+

Редактировать статью

Корпорация Nvidia и ее партнеры из числа производителей видеокарт, как ожидается, смогут выпустить следующее поколение решений на основе GeForce GTX 800-серии в октябре (или даже в конце сентября), согласно нескольким отчетам. Но в то время как новые графические решения появятся всего лишь через пару месяцев, еще неизвестно, чего стоит от них ожидать. Итак, что же известно наверняка о GM204, графическом процессоре, что будет установлен в новые видеокарты, и каких характеристик и производительности стоит от него ожидать.

Несмотря на то, что достоверных фактов из источников, близких к Nvidia существует немного, вот те факты, которые известны о GM204, и заслуживают доверия, либо по крайней мере, выглядят таковыми:

     Nvidia GM204 базируется на архитектуре под кодовым названием Maxwell;

     Nvidia GM204 выполнен с использованием техпроцесса 28 нм;

     Nvidia GM204 имеет размер около 300mm²;

Nvidia GM204, скорее всего, будет обладать 256-битной шиной памяти (судя по тому, что видеокарта на основе GM204 имеет 16 микросхем памяти GDDR5 (с 16-битными или 32-битными интерфейсами), следовательно, 256-битная шина памяти выглядит наиболее вероятным вариантом);

В то время как пока еще нет ни малейшего представления о точных спецификациях GM204, известны спецификации GM107, блягодаря официальному запуску GeForce GTX GPU 750-серии ранее в этом году и, следовательно, стала известна информация об архитектуре Maxwell в целом.

Архитектура Maxwell

Графические процессоры Nvidia состоят из нескольких ключевых блоков: основной sheduler/dispatch процессор, который Nvidia называет GigaThread Engine, GPC, SMMS (потоковый многопроцессорный модуль), ROP, кэш и  контроллеры памяти.

Графический процессор на основе архитектуры Maxwell первого поколения GM107 имеет один GPC блок, 16 блоков ROP, кэш L2 2 Мб и два 64-битных контроллера памяти. GPC у GM107 состоит из пяти SMMS. Каждый SMM первого поколения Maxwell имеет собственный PolyMorph Engine 2.0 и делится на четыре блока с собственным логическим управлением, файл регистров, два текстурных блока и 32 потоковых процессора.

Согласно информации, полученной от Nvidia, благодаря улучшениям SMM, компания увеличила пиковую производительность потоковых процессоров на 35% по сравнению со своими чипами с архитектурой предыдущего поколения Kepler. Поэтому  GPU на основе Maxwell с равным (или более или менее равным) количеством потоковых процессоров будет работать на 35 процентов лучше, нежели чипы на основе GPU Kepler.

Графический процессор GM107 от Nvidia содержит 640 потоковых процессоров, 40 текстурных блоков, 16 блоков ROP, кэш 2 Мб и 128-битный контроллер памяти. Чип содержит 1870000000 транзисторов и имеет размер 148mm².

Что Nvidia нужно от GM204?

Поскольку GM204 является преемником процессора GK104 (GeForce GTX 670, 680, 760 и 770), изготовленных с использованием 28nm техпроцесса, Nvidia скорее всего не сможет действительно превзойти своего предшественника в два раза или еще больше. Реально, Nvidia должна ощутимо превзойти лучший GK104 примерно на 30 или 40 процентов. Невохможно, чтобы 300mm² чип Maxwell превзошел GK110 GPU с 2880 потоковыми процессорами (размер которого 551mm²), следовательно, эта задача для GM204 невыполнима.

Возможные конфигурации GM204

Каждая архитектура может быть расширена, чтобы предложить лучшую производительность или низкое энергопотребление. Можно предположить, как Nvidia сможет масштабировать архитектуру GM107, чтобы предложить лучшую производительность в GM204, сохраняя 300mm² размер.

Самый простой способ вдвое превзойти GM107 - это удвоить количество практически всего, что находится внутри: GPC, ROP, кэш, контроллеры памяти. Такой чип будет иметь 1280 потоковых процессора, 80 текстурных блоков, 32 блоков ROP и 256-битную шину памяти. GPU никогда не превзойти GK104 (1536 потоковых процессора, 128 текстурных блока, 32 ROP, и т.д.), и во многих случаях будет предпочтимо более старшее решение. Таким образом, вряд ли Nvidia действительно хотели идти этим путем. Тем более, что чип будет значительно меньше, чем 300mm², поскольку не все элементы чипа должны быть удвоены.

А вот что Nvidia сделали с GK110, сравнимо с GK104, по крайней мере, касаемо организации исполнительных блоков, так это увеличили количество потоковых мультипроцессоров на GPC от двух до трех. Тот же подход может быть использован и для GM204 тоже. Nvidia может расширить GPC до шести SMM, а затем удвоить количество GCP (а так же блоков ROP, кэша, контроллеров памяти) на чип. Такой GPU будет состоять из 1536 потоковых процессоров, 96 текстурных блоков, 32 блоков ROP, а также 256-битной шины памяти, и мог бы предложить на 35 процентов более высокую производительность по сравнению с GK104 с той же тактовой частотой. Объем такой микросхемы, вероятно будет около 300mm², но так как о точных размерах элементов GPU ничего не известно, это не стопроцентная информация.

Теоретически, Nvidia сможет поставить по шесть блоков на каждый SMM (таким образом увеличивая количество потоковых процессоров на SMM до 192), а затем удвоить количество GCP (с блоками ROP, кэшем, контроллером памяти) в GPU. Если Nvidia удастся сделать это, то окончательный чип будет содержать в себе 1920 потоковых процессоров, 120 текстурных блоков, 32 блока ROP и 256-битный контроллер памяти. Впишется ли это в 300mm² размер? Возможно. Однако, поскольку это принципиально меняет архитектуру SMM, это может повлиять на эффективность архитектуры Maxwell в целом. Таким образом, расширение GPX до семи SMM (и удвоение количества GCP и т.д.) звучит более реалистичным (GPU будет иметь 1792 потоковых процессора, 112 текстурных блока, 32 блока ROP и 256-битную шину памяти).

В то время как дизайнеры чипа могут сделать много неожиданных вещей, а иногда и творить настоящие чудеса, они не смогут отменить законы физики. Инженеры не смогут выжать 3200 потоковых процессоров из GM204, производимого с использованием техпроцесса 28 нм и имеющего размер около 300mm². Таким образом, наиболее логичными конфигурациями полноценного GM204 (GeForce GTX 880), являются следующие:

     1536 потоковых процессоров, 96 текстурных блоков, 32 блока ROP, 256-битная шина памяти

     1792 потоковых процессора, 112 текстурных блока, 32 блока ROP, 256-битная шина памяти

     1920 потоковых процессоров, 120 текстурных блоков, 32 блока ROP, 256-битная шина памяти

Конечно, эти характеристики могут отличаться от реального положения дел, но они, по крайней мере, выглядят наиболее возможными.

Изображения к материалу:

Чтобы написать здесь комментарий необходимо

КОММЕНТАРИИ: 0 СВЕРНУТЬ


    Нет комментариев. Ваш будет первым!




Система Orphus