Intel Haswell - обзор платформы

30.09.2012, 22:11

Шрифт: A- A+

Редактировать статью

 

Не стоит ожидать от мейнстримовых четырехядерников Haswell особого прироста производительности (если, конечно, ПО не адаптировано под новые наборы процессорных инструкций), их конек - уменьшенное энергопотребление и соотношение ценапроизводительность. Впрочем, когда речь заходит о топовом железе, то подход "победа любой ценой" по-прежнему актуален.
 
Тик-ток, тик-ток...

Тик-ток, тик-ток...

 
 
 
 
Мейнстримовые CPU Intel стали двухядерными в 2006 году, с пришествием Core 2 Quad. Четырехядерники “пошли в народ” в 2008 году, с переходом на Nehalem и LGA1156, и в ближайшее время количество ядер не изменится - по крайней мере до 2014 года, когда планируется выход чипов Broadwell, которые будут выпускаться по 14 нм техпроцессу. Это решение вполне оправдано, учитывая что преимущества, предоставляемые дополнительными ядрами, до сих пор не востребованы большинством программ - эффект от более мощного графического процессора или дополнительной кэш-памяти будет существенней. Однако с процессорами высшего ценового диапазона все было не так однозначно, т.к. ПО для рабочих станций и серверов отлично оптимизировано под многоядерные процессоры и как увеличение количества ядер, так и увеличение отдачи каждого ядра может принести результат. 
 
Теперь же, благодаря нашим источникам в IDF, мы можем немного прояснить ситуацию. Как наши читатели уже знают, к середине следующего года топовый процессор для серверных систем, 10-ядерный 2.4 ГГц Xeon E7 4800 семейства “Westmere EX” будет заменен на представителя архитектуры “Ivy Bridge EX” Xeon E7 4800 v2, располагающего 15-ю ядрами и работающий на частотах от 2.2 ГГц, который будет устанавливаться в сокет LGA2011, но с другой распиновкой. В середине 2014 его можно будет заменить на 16-20 ядерный Xeon E7 4800 / 8800 v3 (архитектура Haswell EX), причем сокет останется прежним. За ним последует Xeon E7 4800 / 8800 v4 (архитектура Broadwell EX), который будет выпущен уже в 2015 году. Последние три модели имеют общую черту
в виде шины QPI с тремя линиями - Westmere располагает четырьмя - что негативно скажется на возможностям по взаимодействию с сопроцессорами Xeon Phi или возможности предоставления доступа к системной памяти на полной скорости, что может пригодиться при подключении FPGA.
 
Самый интересный случай - двухпроцессорная конфигурация, ведь у нее много общего (как минимум - сокет и чипсет) с железом, позиционируемым как домашний high-end. К настоящему моменту ситуация выглядит так:
текущий 8-ядерник Xeon E5 2600 / 4600 (Sandy Bridge EP) будет заменен в середине следующего года 10-ядерным Xeon E5 2600 / 4600 v2 (Ivy Bridge EP), который будет использовать тот же сокет. Следующий апгрейд намечается уже на 2014 год - Xeon E5 2600 / 4600 v3 (Haswell EP) будет располагать аж 14-ю ядрами и 14-канальным контроллером DDR4-2133, заменяющим DDR3, использовавшийся в системах Ivy Bridge EP и двойные каналы QPI с пропускной способностью около 9,6 ГТ/с, чуть больше чем
сейчас, который будет устанавливаться в сокет, аналогичный 2011 по размерам но с другой распиновкой. Но зачем увеличивать число ядер и дальше, если компоненты серии ЕХ и так являются эталоном производительности?
 
 
 
 
Приходят на ум две основные причины. Во-первых, прирост удельной  производительности на ядро, который дает Haswell, не так велик - около 10% по сравнению с Ivy Bridge, если не адаптировать ПО под использование новых процессорных инструкций, которые могут быть использованы не во всех алгоритмах. Что неудивительно, так как основное внимание при проектировании Haswell уделялось снижению энергопотребления (ультрабуки!). Так откуда взять прирост производительности, который бы подстегнул продажи?
 
С другой стороны, понижение энергопотребления позволяет разместить больше ядер на одном кристалле при неизменном TDP. Таким образом 14-ядерный процессор  укладывается в лимит 145 Вт (для серверов) и 160 (для рабочих станций), при этом объем L3-кэша на ядро остался прежним - 2,5 Мб. Оправданна ли такая стратегия экстенсивного роста - вопрос спорный. В пределах того же TDP я бы предпочел увидеть процессор с меньшим количеством ядер, но большим объемом кэша на ядро и более
высокими тактовыми частотами, и значительное число владельцев high-end машин
были бы со мной согласны, ведь способность ПО использовать большее число потоков за 5 сменившихся поколений процессоров Intel увеличилась незначительно. Так или иначе, даже с 14-ю ядрами новые модели должны иметь по меньшей мере такие же тактовые частоты как их предшественники на Ivy Bridge в пределах того же TDP, а это значит как минимум 3,2 ГГц для топовых моделей для рабочих станций.
 
На таких частотах теоретическая пиковая производительность на сокет будет равняться 3/4 терафлопс с двойной точностью, таким образом одна двухпроцессорная рабочая станция образца середины 2014 года будет выдавать “на гора” 1,5 терафлопс. Добавьте к этому 8-канальный контроллер памяти DDR4 и вы поймете, что у Nvidia Maxwell появился серьезный конкурент. В конце концов, если CPU обладает достаточной
мощностью и под него не нужно переписывать ПО почти с нуля, то почему бы не использовать его? В любом случае, оптимизация приложений под GPGPU с их огромным количеством потоков также приведет к тому что ни одно ядро в многоядерных процессорах не будет простаивать. Также не стоит забывать, что Intel не единственная компания на рынке, и у его конкурента имеется опыт разработки комбинированных вычислительных блоков, которые в свете сближения CPU и GPU могут оказаться шансом AMD наверстать упущенное. Ждем Opteron APU?
 
Если на процессорном фронте AMD уже давно занимается партизанской борьбой, то что касается рынка видеоадапторов ей пока что приходилось бороться только с “заклятым другом” Nvidia. Но ситуация может вскоре измениться.
 
Следующее поколение архитектуры Intel, под кодовым названием Haswell, это не просто очередной «тик» в мерном такте совершенствования технологий компанией Intel, это новый этап в ее деятельности. Этап, на котором она становится серьезной угрозой как для AMD так и Nvidia. Впервые Intel готова бросить вызов им обоим на рынке массовых графических решений одновременно подрывая позиции Nvidia в бизнесе GPGPU. В то же время маломощные и энергоэффективные решения (ULV-версии процессоров имеют TDP в 10 Вт) станут серьезными конкурентами для SoC на платформе  Brazos второго поколения от AMD (кодовое название Kabini), а также любых ноутбуков на базе ARM-процессоров на основе Windows 8 какие могут вывести на рынок такие компании, как Qualcomm.
 
 Давайте рассмотрим эту архитектуру повнимательнее, начиная с CPU.
 
 
 
 
Шире, больше, быстрее.
 
Haswell является логическим продолжением микроархитектурных улучшений, впервые представленных Intel в Sandy Bridge. Новый чип получил поддержку второго поколения набора процессорных инструкций Advanced Vector Extensions (AVX2), которые удваивают пиковую пропускную способность FPU ядра. Пропускная способность кэша L1 и L2 была удвоена, чтобы обеспечить загруженность работой исполняющих блоков, а регистровые файлы целочисленных вычислений и FPU были увеличены. Эффективность прогнозирования ветвления также была повышена. Производительность Haswell на один поток в реальных задачах на неоптимизированном коде, по ожиданиям, должна повыситься на 10-15%. Если же оптимизация под AVX2 есть, разрыв будет намного  больше - алгоритмы AVX2 включают поддержку векторизации целочисленных значений, что нет в первой версии.
 
Наращивание мощности FPU и дополнительная функциональность AVX2 будут иметь огромное значение для увеличения производительности в операциях с плавающей точкой. Процессор способен выполнять до 32 операций с плавающей точкой стандартной точности на одном ядре и 16 с двойной точностью. То есть вдвое больше чем Sandy Bridge; теоретически восьмиядерный процессор на архитектуре Haswell с тактовой частотой 3.8 ГГц будет выдавать 972,8 гигафлопс при стандартном уровне точности и 486,4 гигафлопс при удвоенном. И хотя GPU текущего поколения показывают даже лучшие результаты, в рукаве Intel есть козырь – х86 совместимость. Intel отправил на свалку истории поставщиков RISC-суперкомпьютеров в 1990-х и начале 2000-х просто благодаря тому, что их процессоры были «достаточно хороши», и сейчас то же самое угрожает Nvidia и ее концепции GPGPU. Пропускная способность кэша L1/L2 увеличилась радикально, пропускная способность шины L1 также удвоена. Весь дополнительный объем пропускной способности предназначен для того, чтобы блоки AVX2 не простаивали; ожидается, что Haswell покажет достаточно близкое соответствие теоретических значений производительности к скорости выполнения реальных задач.
 
И хотя у команда под зеленым флагом скорее всего сохранит преимущество в чистой производительности, четырехъядерник Haswell, достигающий 4 ГГц в турборежиме будет выдавать 256 гигафлопс для операций удвоенной точности (512 гигафлопс при стандартной точности). Такой уровень производительности для операций со стандартной точностью находится очень близко к Nvidia GT 640. А так как производительность операций с удвоенной точностью у карт потребительского сектора Nvidia всегда хромала, четырехъядерные процессоры Haswell вполне могут превзойти GTX 680 от Nvidia и, возможно сровняться с GTX 580 в операциях с удвоенной точностью.
 
Nvidia может выиграть битву за high-end пользователей, но ценой проигрыша на других направлениях – если Intel решит конкурировать с ней серьезно. Хуже того, не стоит забывать про факт, что каждый ПК, оборудованный видеокартой от Nvidia поставляется с ускорителем Intel по умолчанию. Несомненно, Intel собирается сыграть на  потенциальной связи с Xeon Phi, учитывая, что три семинара компании на IDF обращались к проблеме векторизации и касались как Haswell так и Xeon Phi.
 
 
 
 
GPU Haswell усиливает давление на Nvidia, AMD.
 
 
GPU Haswell – по сути модифицированная версия ядер, в настоящее время используемых в Ivy Bridge. Главные изменения наблюдаются в шейдерном массиве - Intel будет предлагать Haswell в версиях с блоком, включающим 10, 20 или 40-шейдеров (GT1, GT2, GT3 соответственно). Чип также будет предлагаться в вариантах, которые включают до 128 Мб встроенной памяти – такой вариант предоставляет каждому GPU небольшой выделенный объем памяти. Intel не особо распространяется о изменениях, внесенных в GPU, но компания заявила, что прирост производительности, демонстрируемый новой конфигурацией GT3 в сравнении с производительностью графического ядра HD 4000, встроенного в Ivy Bridge составляет до 200%.
 
Даже если рассматривать эту информацию со здоровой долей скептицизма, она все равно не предвещает ничего хорошего для AMD и Nvidia. По данным Anandtech, GPU Trinity в среднем на 18% быстрее, чем Liano в играх. По сравнению с Sandy Bridge, Trinity почти на 80% быстрее. Если же сравнить ее с Ivy Bridge, преимущество уменьшается до 20%. Учитывая то, что уже известно о GPU Haswell и его прогнозируемой производительности, для Intel будет не слишком сложно обеспечить прирост производительности в реальных играх в 30-50%. Если это произойдет, Trinity потеряет статус быстрейшего интегрированного GPU на рынке, переходя в разряд середняков, а AMD теряет свой козырь на рынке видеокарт, который она разыгрывала с момента запуска чипсета AMD 780G четыре года назад.
 
Ну и кто тут теперь дракон?

Ну и кто тут теперь дракон?

Таким образом у Саннивейла практически не остается места для маневра. 28 нм APU Kaveri, оснащенный графическим ядром следующего поколения на базе Radeon HD 7000 и новые процессоры на архитектуре Steamroller до сих пор не получили даты анонса. Это означает, что мы можем не увидеть их до конца 2013, и это если производство пойдет без запинок. AMD, скорее всего, предложит обновление – что-нибудь вроде Trinity 2.0, чтобы сдержать натиск со стороны Haswell, но слегка повышенные частоты едва ли спасут ситуацию для AMD.
 
Последними бастионами AMD остаются рынки, которые Intel в общем-то и неинтересны. Это неустойчивое положение для любой компании, которая мечтает бросить вызов лидеру рынка; AMD просто не может позволить себе тратить на НИОКР достаточно чтобы догнать своего давнего соперника. И едва ли Nvidia стоит почивать на лаврах. Планы Intel недвусмысленно дают понять, что компания абсолютно намерена свести к минимуму ценность отдельных графических процессоров за счет использования интегрированных решений там, где это возможно и поддерживать переход на все меньшие форм-факторы, там где это (пока) невозможно.
 
Таким образом, если Haswell не будут полным провалом, именно он, а не Kaveri станет новой точкой отсчета для энтузиастов. Этот чип с энергопотреблением в 10 Вт не сможет напрямую конкурировать с потенциальными конкурентами – планшетами на базе Tegra 4 – это задача Bay Trail, 22 нм SoC на базе Atom.
 
Нет, Haswell не обанкротит AMD или напугать Nvidia до такой степени, что та бросит Tesla, - но если план Intel не будет полным провалом, обе компании будут выдавливаться на рынки узкоспециализированных нишевых продуктов. AMD этот ход берет за живое - ее выдавливают на рынки low-end продуктов, которые не представляют ценности для Intel. Nvidia же теперь придется очень постараться, чтобы убедить OEM-производителей найти место для отдельного GPU в их компьютеров, хотя маркетинговая политика Intel и предпочтения покупателей тянут в другую сторону. Предпочтения энтузиастов, исторически слабая поддержка драйверов Intel, и сила бренда Nvidia поможет, но свалка истории IT-индустрии полна компаний, которые считали, что их бренд будет  держать пользователей, даже если технические характеристики их продукции хуже чем у конкурентов. Энтузиастов интересует только производительность, а не то, какая компания за ней стоит.
 
Однако пока что мы поговорили только о решениях для энтузиастов и настольных решений, что немного нелогично, учитывая растущую не по дням а по часам рыночную долю ноутбуков и ультрабуков. Многие усовершенствования архитектуры Haswell были направлены именно на  оптимизацию под них. Какие именно? Давайте разберемся.
 
Интеграция
 
 
 
 
Haswell для ультрабуков будет иметь TDP 15 Вт, почти как Sandy Bridge, на котором основываются ультрабуки сегодня. Главной новостью здесь является  то, что Intel переместит PCH (хаб контроллера платформы) на ту же подложку, что и процессор благодаря чему версия Haswell для ультрабуков будет содержать все компоненты платформы в едином чипе. Sandy Bridge состоял из двух компонентов, поставляемых Intel - процессора и PCH, Haswell же будет единым MCP (многочиповым пакетом). Это означает что на одной подложке будут размещены два вычислительных кристалла, что зачастую явлется предпосылкой к объединению и самих кристаллов (возможно, после перехода на 14 нм техпроцесс?). Единый MCP будет занимать меньшую площадь, чем связка CPU + PCH которая используется сейчас сегодняшний день,  что позволит сделать компоновку материнских плат менее плотной (или сделать сам платы меньше), и, возможно, ставить в ультрабуки еще большие батареи. Это значительный шаг который демонстрирует, что грань между железом для планшетов и ультрабуков начинает размываться.
Стоит отметить, что Haswell для ультрабуков может располагать двумя ядрами максимум, хотя версии для ноутбуков и настольных систем могут иметь и больше.
 
Энергоэффективная память и новый сокет
 
Список поддерживаемой памяти также скорректирован в сторону оптимизации энергопотребления. Все три версии Haswell будут поддерживать DDR3L, хотя настольное исполнение дополнительно может использовать обычную DDR3, а версия для ультрабуков - LPDDR3. Все три варианта оснащены двумя каналами памяти.
Важно отметить, что, несмотря на фокусирование Haswell на энергоэффективности, архитектура, масштабируется ничуть не хуже, чем Sandy Bridge (будут доступны компоненты для настольных систем с TDP в 95 Вт, хотя прямое сравнение тепловых пакетов может быть не вполне корректным). Что логично, так как единая эффективная архитектура, как правило, может охватывать широкий спектр TDP, не теряя в эффективности.
Другие особенности Haswell включают встроенные регуляторы напряжения (что должно упростить компоновку материнских плат), поддержку набор инструкций AVX 2.0 ну и, разумеется, AES-NI и Hyper-Threading. Выход Haswell также повлечет за собой смену сокета: на настольных компьютерах пропишется LGA-1150.
 
 
 
 
Заключение
 
В действительности, удивительного тут мало. Все знали встроенные графические ядра будут становиться все быстрее, хотя по-прежнему неясно, насколько именно мощным будет вариант GT3. Настоящей проверкой его возможностей будет решение компаний-производителей, продолжать ли устанавливать в свои продукты дискретные видеоадаптеры (весьма показательным был бы пример Apple в отношении, скажем, Macbook Pro). Насколько нам известно, планы Intel по усилению своих позиций в сегменте интегрированной графики были встречены с полным одобрением в Купертино.  
Продолжение интегрирования новых функций в одном чипе – значительный шаг в области x86 CPU высокого класса, и все указывает, что в грядущем 2013 году разница между планшетами и ноутбуками будет размываться и дальше.

Изображения к материалу:

Чтобы написать здесь комментарий необходимо

КОММЕНТАРИИ: 0 СВЕРНУТЬ


    Нет комментариев. Ваш будет первым!




Система Orphus