Архитектура видеоадаптеров

Автор работы: Пользователь скрыл имя, 08 Апреля 2011 в 06:15, реферат

Описание работы

принципы работы, основные технологии

Содержание работы

Введение……………………………………………………………………………………….3
Основные характеристики видеокарт……………………………………………….………5
Основные компоненты видеокарты………………………………………………………....6
Технологии…………………………………………………………………………………....6
Технологии NVIDIA………………………………………………………………………….7
Технологии AMD………………………………………………………………………….…8
Интерфейсы видеокарт……………………………………………………………………....9
Функциональные блоки видеокарт…………………………………………………………12
Решения на нескольких видеокартах……………………………………………………….13
Устройство видеоускорителя………………………………………………………………..15
Классический пример конвейера……………………………………………………………20
Унифицированная архитектура……………………………………………………………...21
Ядро и память.Разгон.………………………...…………………………………..…………..22
Заключение………………………………………………….…………………………….…...22
Источники……………………………………………………………………………………...23

Файлы: 1 файл

Видеокарты.docx

— 71.67 Кб (Скачать файл)

Раньше компания NVIDIA предлагала поддержку технологии SLI только в своих чипсетах. С закатом бизнеса разработчикам пришлось ослабить поводья ― поддержка SLI появилась во многих чипсетах Intel. Наконец, в лагере «зеленых» решили сдаться окончательно. Если верить опубликованным данным, компания собирается активировать свою технологию в чипсетах для будущих процессоров AMD на основе микроархитектуры Bulldozer.

Информация была получена из внутренней презентации компании NVIDIA.

 Разработчик предложит поддержку SLI в чипсетах AMD 990FX (SLI, 3-way SLI) и AMD 990X (SLI). Эти чипсеты предназначены для работы с процессорами под кодовым именем Zambezi ― это настольные “монстры” для энтузиастов. Компания NVIDIA предполагает, что будущая платформа AMD предложит весьма высокую производительность в играх, так что SLI отлично дополнит общую функциональность. Что важно, компания не собирается активировать поддержку технологии через переходный мост NF200 ― чипсеты обойдутся без дополнительной дорогостоящей логики – это значительно упростит слияние технологий этих компаний и снизит цену. 

Технологии  AMD (раннее название ATI, сейчас – AMD)

  1. VISION Engine является кроссплатформенным программным обеспечением и поддерживает, помимо персонального компьютера также игровые консоли PlayStation 3, Wii и Xbox 360. Ускоряет обработку графики.
  2. ATI Eyefinity (AMD Eyefinity или просто Eyefinity) — технология, разработанная американской компанией AMD, которая обеспечивает совместное подключение нескольких дисплеев к персональному компьютеру, предполагает подключение от одного до шести дисплеев включительно к одной видеокарте.
  3. AMD EyeSpeed Technology - технология ускорения видео: новый уровень качества онлайн-видео, превосходное качество любимых фильмов в HD форматах, высокая скорость приложений, реалистичные эффекты в играх.
  4. AMD HD3D Technology - технология позволяющая формировать панорамное стереоскопическое изображение.
  5. AMD CrossFireX Technology  - технология, позволяющая одновременно использовать мощности двух и более видеокарт Radeon для построения трёхмерного изображения.
  6. AMD PowerPlay Technology - технология динамического управления питанием, используемая в некоторых графических процессорах (GPU) производства фирмы AMD (ранее — ATI). Принцип работы основан на отслеживание загрузки GPU, определении оптимальных параметров и соответственном изменении тактовой частоты чипа, памяти и напряжения питания, тем самым оптимизируя энергопотребление и тепловыделение видеокарты. Технология в режимах простоя может отключать неиспользуемые блоки графического процессора.
  7. ATI HyperMemory Technology - технология, разработанная американской компанией AMD, позволяющая использовать ОЗУ как часть или весь кадровый буфер видеокарт линейки Radeon и чипсетами материнских плат. Она опирается на скоростной обмен данными по двунаправленной шине PCI Express (x16 считается уже приемлемым).
 

Интерфейсы  видеокарт.

  1. AGP  (Accelerated Graphics Port или Advanced Graphics Port) — это высокоскоростной интерфейс, основанный на спецификации PCI, но созданный специально для соединения видеокарт и системных плат. Шина AGP лучше подходит для видеоадаптеров по сравнению с PCI (не Express!) потому, что она предоставляет прямую связь между центральным процессором и видеочипом, а также некоторые другие возможности, увеличивающие производительность в некоторых случаях, например, GART — возможность чтения текстур напрямую из оперативной памяти, без их копирования в видеопамять; более высокую тактовую частоту, упрощенные протоколы передачи данных и др.В отличие от универсальной шины PCI, AGP используется только для видеокарт.

    Интерфейс имеет  несколько версий, последняя из них  — AGP 8x с пропускной способностью 2.1 Гб/с, что в 8 раз больше начального стандарта AGP с параметрами 32-бит и 66 МГц. Новых системных плат с AGP уже не выпускают, они окончательно уступили рынок решениям с интерфейсом PCI Express, но AGP до сих пор имеет широкое распространение и дает достаточную пропускную способность даже для новых видеочипов.Спецификации AGP появились в 1997 году, тогда Intel выпустил первую версию описания, включающую две скорости: 1x и 2x. Во второй версии (2.0) появился AGP 4x, а в 3.0 — 8x. Рассмотрим все варианты подробнее: 
    AGP 1x — это 32-битный канал, работающий на частоте 66 МГц, с пропускной способностью 266 Мбайт/с, что в два раза выше полосы PCI (133 Мбайт/с, 33 МГц и 32-бит). 
    AGP 2x — 32-битный канал, работающий с удвоенной пропускной способностью 533 Мбайт/с на той же частоте 66 МГц за счет передачи данных по двум фронтам, аналогично 
    DDR памяти (только для направления «к видеокарте»). 
    AGP 4x — такой же 32-битный канал, работающий на 66 МГц, но в результате дальнейших ухищрений была достигнута учетверенная «эффективная» частота 266 МГц, с максимальной пропускной способностью более 1 
    ГБ/с. 
    AGP 8x — дополнительные изменения в этой модификации позволили получить пропускную способность уже до 2.1 ГБ/с.Видеокарты с интерфейсом AGP и соответствующие слоты на системных платах совместимы в определенных пределах. Видеокарты, рассчитанные на 1.5 В, не работают в 3.3 В слотах, и наоборот. Но существуют универсальные разъемы, которые поддерживают оба типа плат. В настоящее время этот интерфейс устарел, но используется на многих старых ПК  и энтузиастами, ведь основная проблема этого интерфейса – отсутствие технологической поддержки (например, DirectX 10 или PhysX.)

  1. PCI Express (PCIe или PCI-E, не путать с PCI-X), ранее известная как Arapaho или 3GIO, отличается от PCI и AGP тем, что это последовательный, а не параллельный интерфейс, что позволило уменьшить число контактов и увеличить пропускную способность. PCIe — это лишь один из примеров перехода от параллельных шин к последовательным, вот другие примеры этого движения: HyperTransport, Serial ATA, USB и FireWire. Важное преимущество PCI Express в том, что он позволяет складывать несколько одиночных линий в один канал для увеличения пропускной способности. Многоканальность последовательного дизайна увеличивает гибкость, медленным устройствам можно выделять меньшее количество линий с малым числом контактов, а быстрым — большее.Интерфейс PCIe пропускает данные на скорости 250 Мбайт/с на одну линию, что почти вдвое превышает возможности обычных слотов PCI. Максимально поддерживаемое слотами PCI Express количество линий — 32, что дает пропускную способность 8 ГБ/с. А PCIe слот с восемью рабочими линиями примерно сопоставим по этому параметру с быстрейшей из версий AGP. Что еще больше впечатляет при учете возможности одновременной передачи в обоих направлениях на высокой скорости. Наиболее распространенные слоты PCI Express x1 дают пропускную способность одной линии (250 Мбайт/с) в каждом направлении, а PCI Express x16, который применяется для видеокарт, и в котором сочетается 16 линий, обеспечивает пропускную способность до 4 ГБ/с в каждом направлении.Несмотря на то, что соединение между двумя PCIe устройствами иногда собирается из нескольких линий, все устройства поддерживают одиночную линию, как минимум, но опционально могут работать с большим их количеством. Физически, карты расширения PCIe входят и работают нормально в любых слотах с равным или большим количеством линий, так, PCI Express x1 карта будет спокойно работать в x4 и x16 разъемах. Также, слот физически большего размера может работать с логически меньшим количеством линий (например, на вид обычный x16 разъем, но разведены лишь 8 линий). В любом из приведенных вариантов, PCIe сам выберет максимально возможный режим, и будет нормально работать.Чаще всего для видеоадаптеров используются разъемы x16, но есть платы и с x1 разъемами. А большая часть системных плат с двумя слотами PCI Express x16, работает в режиме x8 для создания SLI и CrossFire систем. Физически другие варианты слотов, такие как x4, для видеокарт не используются. Напоминаю, что всё это относится только к физическому уровню, попадаются и системные платы с физическими PCI-E x16 разъемами, но в реальности с разведенными 8, 4 или даже 1 каналами. И любые видеокарты, рассчитанные на 16 каналов, работать в таких слотах будут, но с меньшей производительностью.PCI Express отличается не только пропускной способностью, но и новыми возможностями по энергопотреблению. Эта необходимость возникла потому, что по слоту AGP 8x (версия По разъему PCI Express можно передавать до 75 Вт, а дополнительные 75 Вт получают по стандартному шестиконтактному разъему питания. В последнее время появились видеокарты с двумя такими разъемами, что в сумме дает до 225 Вт.
  2. PCI Express 2.0. В дальнейшем, группа PCI-SIG, которая занимается разработкой соответствующих стандартов, представила основные спецификации PCI Express 2.0. Вторая версия PCIe вдвое увеличила стандартную пропускную способность, с 2.5 Гб/с до 5 Гб/с, так что разъем x16 позволяет передавать данные на скорости до 8 ГБ/с в каждом направлении. При этом PCIe 2.0 совместим с PCIe 1.1.Спецификация PCIe 2.0 поддерживает как 2.5 Гб/с, так и 5 Гб/с скорости передачи, это сделано для обеспечения обратной совместимости с существующими PCIe 1.0 и 1.1 решениями. Обратная совместимость PCI Express 2.0 позволяет использовать прошлые решения с 2.5 Гб/с в 5.0 Гб/с слотах, которые просто будут работать на меньшей скорости. А устройство, разработанное по спецификациям версии 2.0, может поддерживать 2.5 Гб/с и/или 5 Гб/с скорости.

    Основное нововведение в PCI Express 2.0 — это удвоенная до 5 Гб/с скорость, но это не единственное изменение, есть и другие нововведения для увеличения гибкости, новые механизмы для программного управления скоростью соединений и т.п. В PCI-SIG разработали новую спецификацию для обеспечения увеличивающегося энергопотребления графических карт, она расширяет текущие возможности энергоснабжения до 225/300 Вт на видеокарту. Для поддержки этой спецификации используется новый 8-ми-штырьковый разъем питания.

  1. PCI Express 2.1.Основное нововведение в PCI Express 2.1 — это удвоенная до 10 Гб/с скорость.
  2. PCI Express External. В 2007 году группа PCI-SIG, занимающаяся официальной стандартизацией решений PCI Express, объявила о принятии спецификации PCI Express External Cabling 1.0, описывающих стандарт передачи данных по внешнему интерфейсу PCI Express 1.1. Эта версия позволяет передавать данные со скоростью 2.5 Гб/с, а следующая должна увеличить пропускную способность до 5 Гб/с. В рамках стандарта представлены четыре внешних разъема: PCI Express x1, x4, x8 и x16. Старшие разъемы оснащены специальным язычком, облегчающим подключение. Внешний вариант интерфейса PCI Express может использоваться не только для подключения внешних видеокарт, но и для внешних накопителей и других плат расширения. Максимальная рекомендованная длина кабеля при этом равна 10 метров, но её можно увеличить при помощи соединения кабелей через повторитель.Чем это может быть полезно для видеокарт? Например, это точно может облегчить жизнь любителей ноутбуков, при работе от батарей будет использоваться маломощное встроенное видеоядро, а при подключении к настольному монитору — мощная внешняя видеокарта. Значительно облегчится апгрейд подобных видеокарт, не нужно будет вскрывать корпус ПК. Производители смогут делать совершенно новые системы охлаждения, не ограниченные особенностями карт расширения, с питанием должно быть меньше проблем — скорее всего, будут использоваться внешние блоки питания, рассчитанные специально на определенную видеокарту, их можно в один внешний корпус с видеокартой встроить, используя одну систему охлаждения. Должна облегчиться сборка систем на нескольких видеокартах (SLI/CrossFire).
 

Функциональные  блоки видеокарт.

Графический процессор  содержит много различных функциональных блоков. По количеству некоторых компонентов  можно оценить, насколько графический  процессор мощный.. Рассмотрим самые важные функциональные блоки:

  1. Вершинные процессоры (блоки вершинных шейдеров). Как и блоки пиксельных шейдеров, вершинные процессоры выполняют код программ-шейдеров, которые касаются вершин. Поскольку больший бюджет вершин позволяет создавать более сложные 3D-объекты, производительность вершинных процессоров очень важна в 3D-сценах со сложными объектами или с большим их количеством. Впрочем, блоки вершинных шейдеров всё же не так очевидно влияют на производительность, как пиксельные процессоры.
  2. Пиксельные процессоры (блоки пиксельных шейдеров). Пиксельный процессор - это компонент графического чипа, выделенный на обработку пиксельных программ-шейдеров. Эти процессоры выполняют вычисления, касающиеся только пикселей. Поскольку пиксели содержат информацию о цвете, пиксельные шейдеры позволяют достичь впечатляющих графических эффектов. Например, большинство эффектов воды, которые вы видели в играх, создаётся с помощью пиксельных шейдеров. Обычно число пиксельных процессоров используется для сравнения пиксельной производительности видеокарт. Если одна карта оснащена восемью блоками пиксельных шейдеров, а другая - 16 блоками, то вполне логично предположить, что видеокарта с 16 блоками будет быстрее обрабатывать сложные пиксельные программы. Также следует учитывать и тактовую частоту, но сегодня удвоение числа пиксельных процессоров эффективнее по энергопотреблению, чем удвоение частоты графического чипа.
  3. Унифицированные шейдеры. Унифицированные (единые) шейдеры используются стандартом DirectX 10. То есть структура кода вершинных, геометрических и пиксельных программ будет единая, хотя шейдеры будут выполнять разную работу. Новую спецификацию можно посмотреть в Xbox 360, где графический процессор был специально разработан ATi для Microsoft.
  4. Блоки наложения текстур (Texture Mapping Unit, TMU). Текстуры следует выбрать и отфильтровать. Эта работа выполняется блоками наложения текстур, которые работают совместно с блоками пиксельных и вершинных шейдеров. Работа TMU заключается в применении текстурных операций над пикселями. Число текстурных блоков в графическом процессоре часто используется для сравнения текстурной производительности видеокарт. Вполне разумно предположить, что видеокарта с большим числом TMU даст более высокую текстурную производительность.
 
  1. Блоки растровых операций (Raster Operator Unit, ROP). Процессоры растровых операций отвечают за запись пиксельных данных в память. Скорость, с которой выполняется эта операция, является скоростью заполнения (fill rate). В ранние дни 3D-ускорителей число ROP и скорость заполнения являлись очень важными характеристиками видеокарт. Сегодня работа ROP по-прежнему важна, но производительность видеокарты уже не упирается в эти блоки, как было раньше. Поэтому производительность (и число) ROP уже редко используется для оценки скорости видеокарты.
  2. Конвейеры используются для описания архитектуры видеокарт и дают вполне наглядное представление о производительности графического процессора.Конвейер нельзя считать строгим техническим термином. В графическом процессоре используются разные конвейеры, которые выполняют отличающиеся друг от друга функции. Исторически под конвейером понимали пиксельный процессор, который был подключён к своему блоку наложения текстур (TMU). Например, у видеокарты Radeon 9700 используется восемь пиксельных процессоров, каждый из которых подключён к своему TMU, поэтому считают, что у карты восемь конвейеров.Но современные процессоры описать числом конвейеров весьма сложно. По сравнению с предыдущими дизайнами, новые процессоры используют модульную, фрагментированную структуру. Новатором в этой сфере можно считать ATi, которая с линейкой видеокарт X1000 перешла на модульную структуру, что позволило достичь прироста производительности через внутреннюю оптимизацию. Некоторые блоки процессора используются больше, чем другие, и для повышения производительности графического процессора ATi постаралась найти компромисс между числом нужных блоков и площадью кристалла (её нельзя очень сильно увеличивать). В данной архитектуре термин "пиксельный конвейер" уже потерял своё значение, поскольку пиксельные процессоры уже не подключены к собственным блокам TMU. Например, у графического процессора ATi Radeon X1600 есть 12 блоков пиксельных шейдеров и всего четыре блока наложения текстур TMU. Поэтому нельзя говорить, что в архитектуре этого процессора есть 12 пиксельных конвейеров, как и говорить, что их всего четыре. Впрочем, по традиции пиксельные конвейеры всё ещё упоминают.

Информация о работе Архитектура видеоадаптеров