Раньше
компания NVIDIA предлагала поддержку технологии
SLI только в своих чипсетах. С закатом бизнеса
разработчикам пришлось ослабить поводья
― поддержка SLI появилась во многих чипсетах
Intel. Наконец, в лагере «зеленых» решили
сдаться окончательно. Если верить опубликованным
данным, компания собирается активировать
свою технологию в чипсетах для будущих
процессоров AMD на основе микроархитектуры
Bulldozer.
Информация была
получена из внутренней презентации компании
NVIDIA.
Разработчик
предложит поддержку SLI в чипсетах AMD 990FX
(SLI, 3-way SLI) и AMD 990X (SLI). Эти чипсеты предназначены
для работы с процессорами под кодовым
именем Zambezi ― это настольные “монстры”
для энтузиастов. Компания NVIDIA предполагает,
что будущая платформа AMD предложит весьма
высокую производительность в играх, так
что SLI отлично дополнит общую функциональность.
Что важно, компания не собирается активировать
поддержку технологии через переходный
мост NF200 ― чипсеты обойдутся без дополнительной
дорогостоящей логики – это значительно
упростит слияние технологий этих компаний
и снизит цену.
Технологии
AMD (раннее название
ATI, сейчас – AMD)
- VISION
Engine является кроссплатформенным программным
обеспечением и поддерживает, помимо персонального
компьютера также игровые консоли PlayStation
3, Wii и Xbox 360. Ускоряет обработку графики.
- ATI
Eyefinity (AMD Eyefinity или просто
Eyefinity) — технология, разработанная
американской компанией AMD, которая обеспечивает
совместное подключение нескольких дисплеев
к персональному компьютеру, предполагает
подключение от одного до шести дисплеев
включительно к одной видеокарте.
- AMD
EyeSpeed Technology - технология ускорения видео:
новый уровень качества онлайн-видео,
превосходное качество любимых фильмов
в HD форматах, высокая скорость приложений,
реалистичные эффекты в играх.
- AMD
HD3D Technology - технология позволяющая формировать
панорамное стереоскопическое изображение.
- AMD
CrossFireX Technology - технология, позволяющая
одновременно использовать мощности двух
и более видеокарт Radeon для построения
трёхмерного изображения.
- AMD
PowerPlay Technology - технология динамического
управления питанием, используемая в некоторых
графических процессорах (GPU) производства
фирмы AMD (ранее — ATI). Принцип работы основан
на отслеживание загрузки GPU, определении
оптимальных параметров и соответственном
изменении тактовой частоты чипа, памяти
и напряжения питания, тем самым оптимизируя
энергопотребление и тепловыделение видеокарты.
Технология в режимах простоя может отключать
неиспользуемые блоки графического процессора.
- ATI
HyperMemory Technology - технология, разработанная
американской компанией AMD, позволяющая
использовать ОЗУ как часть или весь кадровый
буфер видеокарт линейки Radeon и чипсетами
материнских плат. Она опирается на скоростной
обмен данными по двунаправленной шине
PCI Express (x16 считается уже приемлемым).
Интерфейсы
видеокарт.
- AGP (Accelerated
Graphics Port или Advanced Graphics Port) — это высокоскоростной
интерфейс, основанный на спецификации
PCI, но созданный специально для соединения
видеокарт и системных плат. Шина AGP лучше
подходит для видеоадаптеров по сравнению
с PCI (не Express!) потому, что она предоставляет
прямую связь между центральным процессором
и видеочипом, а также некоторые другие
возможности, увеличивающие производительность
в некоторых случаях, например, GART — возможность
чтения текстур напрямую из оперативной памяти, без их копирования
в видеопамять; более высокую тактовую
частоту, упрощенные протоколы передачи
данных и др.В отличие от универсальной
шины PCI, AGP используется только для видеокарт.
Интерфейс имеет
несколько версий, последняя из них
— AGP 8x с пропускной способностью 2.1 Гб/с,
что в 8 раз больше начального стандарта
AGP с параметрами 32-бит и 66 МГц. Новых системных
плат с AGP уже не выпускают, они окончательно
уступили рынок решениям с интерфейсом
PCI Express, но AGP до сих пор имеет широкое распространение
и дает достаточную пропускную способность
даже для новых видеочипов.Спецификации
AGP появились в 1997 году, тогда Intel выпустил
первую версию описания, включающую две
скорости: 1x и 2x. Во второй версии (2.0) появился
AGP 4x, а в 3.0 — 8x. Рассмотрим все варианты
подробнее:
AGP 1x — это 32-битный канал, работающий на
частоте 66 МГц, с пропускной способностью
266 Мбайт/с, что в два раза выше полосы PCI
(133 Мбайт/с, 33 МГц и 32-бит).
AGP 2x — 32-битный канал, работающий с удвоенной
пропускной способностью 533 Мбайт/с на
той же частоте 66 МГц за счет передачи
данных по двум фронтам, аналогично DDR памяти (только для направления
«к видеокарте»).
AGP 4x — такой же 32-битный канал, работающий
на 66 МГц, но в результате дальнейших ухищрений
была достигнута учетверенная «эффективная»
частота 266 МГц, с максимальной пропускной
способностью более 1 ГБ/с.
AGP 8x — дополнительные изменения в этой
модификации позволили получить пропускную
способность уже до 2.1 ГБ/с.Видеокарты
с интерфейсом AGP и соответствующие слоты
на системных платах совместимы в определенных
пределах. Видеокарты, рассчитанные на
1.5 В, не работают в 3.3 В слотах, и наоборот.
Но существуют универсальные разъемы,
которые поддерживают оба типа плат. В
настоящее время этот интерфейс устарел,
но используется на многих старых ПК
и энтузиастами, ведь основная проблема
этого интерфейса – отсутствие технологической
поддержки (например, DirectX 10 или PhysX.)
- PCI
Express (PCIe или PCI-E, не путать с PCI-X), ранее
известная как Arapaho или 3GIO, отличается
от PCI и AGP тем, что это последовательный,
а не параллельный интерфейс, что позволило
уменьшить число контактов и увеличить
пропускную способность. PCIe — это лишь
один из примеров перехода от параллельных
шин к последовательным, вот другие примеры
этого движения: HyperTransport, Serial ATA, USB и FireWire.
Важное преимущество PCI Express в том, что
он позволяет складывать несколько одиночных
линий в один канал для увеличения пропускной
способности. Многоканальность последовательного
дизайна увеличивает гибкость, медленным
устройствам можно выделять меньшее количество
линий с малым числом контактов, а быстрым
— большее.Интерфейс PCIe пропускает данные
на скорости 250 Мбайт/с на одну линию, что
почти вдвое превышает возможности обычных
слотов PCI. Максимально поддерживаемое
слотами PCI Express количество линий — 32, что
дает пропускную способность 8 ГБ/с. А PCIe слот с восемью
рабочими линиями примерно сопоставим
по этому параметру с быстрейшей из версий
AGP. Что еще больше впечатляет при учете
возможности одновременной передачи в
обоих направлениях на высокой скорости.
Наиболее распространенные слоты PCI Express
x1 дают пропускную способность одной линии
(250 Мбайт/с) в каждом направлении, а PCI Express
x16, который применяется для видеокарт,
и в котором сочетается 16 линий, обеспечивает
пропускную способность до 4 ГБ/с в каждом
направлении.Несмотря на то, что соединение
между двумя PCIe устройствами иногда собирается
из нескольких линий, все устройства поддерживают
одиночную линию, как минимум, но опционально
могут работать с большим их количеством.
Физически, карты расширения PCIe входят
и работают нормально в любых слотах с
равным или большим количеством линий,
так, PCI Express x1 карта будет спокойно работать
в x4 и x16 разъемах. Также, слот физически
большего размера может работать с логически
меньшим количеством линий (например,
на вид обычный x16 разъем, но разведены
лишь 8 линий). В любом из приведенных вариантов,
PCIe сам выберет максимально возможный
режим, и будет нормально работать.Чаще
всего для видеоадаптеров используются
разъемы x16, но есть платы и с x1 разъемами.
А большая часть системных плат с двумя
слотами PCI Express x16, работает в режиме x8
для создания SLI и CrossFire систем. Физически
другие варианты слотов, такие как x4, для
видеокарт не используются. Напоминаю,
что всё это относится только к физическому
уровню, попадаются и системные платы
с физическими PCI-E x16 разъемами, но в реальности
с разведенными 8, 4 или даже 1 каналами.
И любые видеокарты, рассчитанные на 16
каналов, работать в таких слотах будут,
но с меньшей производительностью.PCI Express
отличается не только пропускной способностью,
но и новыми возможностями по энергопотреблению.
Эта необходимость возникла потому, что
по слоту AGP 8x (версия По разъему PCI Express
можно передавать до 75 Вт, а дополнительные
75 Вт получают по стандартному шестиконтактному
разъему питания. В последнее время появились
видеокарты с двумя такими разъемами,
что в сумме дает до 225 Вт.
- PCI
Express 2.0. В дальнейшем, группа PCI-SIG, которая
занимается разработкой соответствующих
стандартов, представила основные спецификации
PCI Express 2.0. Вторая версия PCIe вдвое увеличила
стандартную пропускную способность,
с 2.5 Гб/с до 5 Гб/с, так что разъем
x16 позволяет передавать данные на скорости
до 8 ГБ/с в каждом направлении. При этом
PCIe 2.0 совместим с PCIe 1.1.Спецификация PCIe
2.0 поддерживает как 2.5 Гб/с, так и 5 Гб/с скорости
передачи, это сделано для обеспечения
обратной совместимости с существующими
PCIe 1.0 и 1.1 решениями. Обратная совместимость
PCI Express 2.0 позволяет использовать прошлые
решения с 2.5 Гб/с в 5.0 Гб/с слотах, которые
просто будут работать на меньшей скорости.
А устройство, разработанное по спецификациям
версии 2.0, может поддерживать 2.5 Гб/с и/или
5 Гб/с скорости.
Основное нововведение
в PCI Express 2.0 — это удвоенная до 5 Гб/с скорость, но это не
единственное изменение, есть и другие
нововведения для увеличения гибкости,
новые механизмы для программного управления
скоростью соединений и т.п. В PCI-SIG разработали
новую спецификацию для обеспечения увеличивающегося
энергопотребления графических карт,
она расширяет текущие возможности энергоснабжения
до 225/300 Вт на видеокарту. Для поддержки
этой спецификации используется новый
8-ми-штырьковый разъем питания.
- PCI
Express 2.1.Основное нововведение в PCI Express
2.1 — это удвоенная до 10 Гб/с скорость.
- PCI
Express External. В 2007 году группа PCI-SIG, занимающаяся
официальной стандартизацией решений
PCI Express, объявила о принятии спецификации
PCI Express External Cabling 1.0, описывающих стандарт
передачи данных по внешнему интерфейсу
PCI Express 1.1. Эта версия позволяет передавать
данные со скоростью 2.5 Гб/с, а следующая должна
увеличить пропускную способность до
5 Гб/с. В рамках стандарта представлены
четыре внешних разъема: PCI Express x1, x4, x8 и
x16. Старшие разъемы оснащены специальным
язычком, облегчающим подключение. Внешний
вариант интерфейса PCI Express может использоваться
не только для подключения внешних видеокарт,
но и для внешних накопителей и других
плат расширения. Максимальная рекомендованная
длина кабеля при этом равна 10 метров,
но её можно увеличить при помощи соединения
кабелей через повторитель.Чем это может
быть полезно для видеокарт? Например,
это точно может облегчить жизнь любителей
ноутбуков, при работе от батарей будет
использоваться маломощное встроенное
видеоядро, а при подключении к настольному
монитору — мощная внешняя видеокарта.
Значительно облегчится апгрейд подобных
видеокарт, не нужно будет вскрывать корпус
ПК. Производители смогут делать совершенно
новые системы охлаждения, не ограниченные
особенностями карт расширения, с питанием
должно быть меньше проблем — скорее всего,
будут использоваться внешние блоки питания,
рассчитанные специально на определенную
видеокарту, их можно в один внешний корпус
с видеокартой встроить, используя одну
систему охлаждения. Должна облегчиться
сборка систем на нескольких видеокартах
(SLI/CrossFire).
Функциональные
блоки видеокарт.
Графический процессор
содержит много различных функциональных
блоков. По количеству некоторых компонентов
можно оценить, насколько графический
процессор мощный.. Рассмотрим самые
важные функциональные блоки:
- Вершинные
процессоры (блоки вершинных
шейдеров). Как и блоки пиксельных шейдеров,
вершинные процессоры выполняют код программ-шейдеров,
которые касаются вершин. Поскольку больший
бюджет вершин позволяет создавать более
сложные 3D-объекты, производительность
вершинных процессоров очень важна в 3D-сценах
со сложными объектами или с большим их
количеством. Впрочем, блоки вершинных
шейдеров всё же не так очевидно влияют
на производительность, как пиксельные
процессоры.
- Пиксельные
процессоры (блоки пиксельных
шейдеров). Пиксельный процессор - это
компонент графического чипа, выделенный
на обработку пиксельных программ-шейдеров.
Эти процессоры выполняют вычисления,
касающиеся только пикселей. Поскольку
пиксели содержат информацию о цвете,
пиксельные шейдеры позволяют достичь
впечатляющих графических эффектов. Например,
большинство эффектов воды, которые вы
видели в играх, создаётся с помощью пиксельных
шейдеров. Обычно число пиксельных процессоров
используется для сравнения пиксельной
производительности видеокарт. Если одна
карта оснащена восемью блоками пиксельных
шейдеров, а другая - 16 блоками, то вполне
логично предположить, что видеокарта
с 16 блоками будет быстрее обрабатывать
сложные пиксельные программы. Также следует
учитывать и тактовую частоту, но сегодня
удвоение числа пиксельных процессоров
эффективнее по энергопотреблению, чем
удвоение частоты графического чипа.
- Унифицированные
шейдеры. Унифицированные (единые) шейдеры
используются стандартом DirectX 10. То есть
структура кода вершинных, геометрических
и пиксельных программ будет единая, хотя
шейдеры будут выполнять разную работу.
Новую спецификацию можно посмотреть
в Xbox 360, где графический процессор был
специально разработан ATi для Microsoft.
- Блоки
наложения текстур (Texture
Mapping Unit, TMU). Текстуры следует выбрать
и отфильтровать. Эта работа выполняется
блоками наложения текстур, которые работают
совместно с блоками пиксельных и вершинных
шейдеров. Работа TMU заключается в применении
текстурных операций над пикселями. Число
текстурных блоков в графическом процессоре
часто используется для сравнения текстурной
производительности видеокарт. Вполне
разумно предположить, что видеокарта
с большим числом TMU даст более высокую
текстурную производительность.
- Блоки
растровых операций (Raster
Operator Unit, ROP). Процессоры растровых операций
отвечают за запись пиксельных данных
в память. Скорость, с которой выполняется
эта операция, является скоростью заполнения
(fill rate). В ранние дни 3D-ускорителей число
ROP и скорость заполнения являлись очень
важными характеристиками видеокарт.
Сегодня работа ROP по-прежнему важна, но
производительность видеокарты уже не
упирается в эти блоки, как было раньше.
Поэтому производительность (и число)
ROP уже редко используется для оценки скорости
видеокарты.
- Конвейеры
используются для описания архитектуры
видеокарт и дают вполне наглядное представление
о производительности графического процессора.Конвейер
нельзя считать строгим техническим термином.
В графическом процессоре используются
разные конвейеры, которые выполняют отличающиеся
друг от друга функции. Исторически под
конвейером понимали пиксельный процессор,
который был подключён к своему блоку
наложения текстур (TMU). Например, у видеокарты
Radeon 9700 используется восемь пиксельных
процессоров, каждый из которых подключён
к своему TMU, поэтому считают, что у карты
восемь конвейеров.Но современные процессоры
описать числом конвейеров весьма сложно.
По сравнению с предыдущими дизайнами,
новые процессоры используют модульную,
фрагментированную структуру. Новатором
в этой сфере можно считать ATi, которая
с линейкой видеокарт X1000 перешла на модульную
структуру, что позволило достичь прироста
производительности через внутреннюю
оптимизацию. Некоторые блоки процессора
используются больше, чем другие, и для
повышения производительности графического
процессора ATi постаралась найти компромисс
между числом нужных блоков и площадью
кристалла (её нельзя очень сильно увеличивать).
В данной архитектуре термин "пиксельный
конвейер" уже потерял своё значение,
поскольку пиксельные процессоры уже
не подключены к собственным блокам TMU.
Например, у графического процессора ATi
Radeon X1600 есть 12 блоков пиксельных шейдеров
и всего четыре блока наложения текстур
TMU. Поэтому нельзя говорить, что в архитектуре
этого процессора есть 12 пиксельных конвейеров,
как и говорить, что их всего четыре. Впрочем,
по традиции пиксельные конвейеры всё
ещё упоминают.