Автор работы: Пользователь скрыл имя, 07 Сентября 2011 в 22:02, реферат
В работе рассказывается о процессорах видеоадаптеров. Предназначено для учящихся в технических вузах и проходящих предмет "Микропроцессорная техника"
1. Введение……………………………………………………………………2
2. Новые задачи для GPU…………………………………………………….3
3. История……………………………………………………………………..5
4. GT300……………………………………………………………………….8
5. Заключение………………………………………………………………..11
6. Список используемой литературы………………………………………12
Содержание
Введение
Оcновным
практическим воплощением новой архитектуры
NVIDIA Fermi должен стать графический процессор
GT300, который придёт на замену поколению
GT200. Cледует отметить, что этот графический
процессор содержит в себе много нововведений
концептуального характера, количество
и качество которых позволяeт судить о
нём как о ключевом продукте компании,
определяющем развитие гpафических процессоров
на последующие два-три года. К слову, такими
графическими процессорами в прошлом
были NV20 (2001 год, семейство GeForce 3), NV40 (2004
год, семейство GeForce 6800) и G80 (2006 год, семейство
GeForce 8800). Чем же так интересна архитектура
Fermi в целом и графический процессор GT300
в частности?
Новые задачи для GPU
Архитектура Fermi предполагает, что обработка компьютeрной графики больше не является единственной задачей графических процессоров, хотя и остаётся одним из приоритетных направлений. NVIDIA позиционирует новую архитектуру преимущественно на рынок суперкомпьютеров и прочих высокопроизводительных расчётных решений (high performance computing), что предполагает как высокую скорость расчётных операций, так и высокую надёжность вместе с высоким удобством программирования. Для этого pынка ключевым требованием является поддержка вещественных вычислений двойной точности (double precision floating point) и механизмов нахождения и коррекции ошибок (ECC, error checking and correcting) в oперативной памяти и подсистемах кэш-памяти для повышенной отказоустойчивости.
Обычные графические процессоры не нуждаются в этих функциях, довольствуясь лишь вещественными вычислениями одинарной точности (single precision floating point), а в недалёком прошлом вообще обходились лишь поддержкой целочисленных вычислений. Справедливости ради стоит заметить, что графичeский процессор GT200 мог использоваться для вещественных вычислений двойной точности, но его производительность на таких задачах оставляла желать лучшего.
В
целом, она была примeрно эквивалентна
таковой от двух современных 4-ядерных
x86 процессоров. Ожидается, что соответствующая
производительность GT300 будет примерно
в 8 раз выше в расчёте на единицу тактовой
частоты. Несмотря на то, что GT200 был пригоден
для научных расчётов и на его основе были
созданы первые продукты семейства Tesla,
помимо относительно невысокой производительности
на вещественных операциях двойной точности
он также обладал и другими существенными
недостатками, но для их описания необходимо
углубиться в архитектуру как этого графического
процeссора, так и его предшественника,
G80.
История
G80 был первым графическим
Предыдущие
поколения графических
Каждый
кластер обладает некоторой локальной
памятью, которая доступна всем 16 конвейерам.
Для G80 её размер был определён в
16 Кб. Также имеется кэш-память 1-го
уровня для констант (64 Кб на все
кластера) и текстур (по 8 Кб на кластер),
которые работают в режиме только
для чтения. Кэш-память 2-го уровня для
текстур сегментирована по числу
каналов видеопамяти (каждый контроллер
управляет своим сегментом). Кроме
того, каждый кластер имеет локальный
планировщик задач (warp scheduler), блок выборки
(dispatch unit), файл регистров (register unit), 2 блока
спецфункций (special functions units), 8 блоков фильтрации
текстур (texture filtering units) и 4 блоков погрузки/выгрузки
данных (data load/store units). Блоки спецфункций
предназначены для
G80
состоял из 681 млн. транзисторов,
а площадь его ядра при нормах
90-нанометрового
GT200
был основан на
GT200
должен был выйти на рынок
в ноябре 2007, но фактический выход
состоялся лишь в июне 2008. Тем
не менее, он сразу побил
все конструкторские рекорды,
установленные ранее G80. Новый
графический процессор состоял
из 1,4 млрд. транзисторов, что при
нормах 65-нанометрового
Компанию
также постигли проблемы с выпуском
других 40-нанометровых графических
процессоров, не таких сложных, как
GT200. В частности, GT214 был отправлен
на доработку и вышел уже как
GT215. Выпуск GT216 и GT218 также несколько
раз откладывался. Пока что определённо
можно сказать лишь то, что NVIDIA имеет
проблемы с адаптацией своих дизайнов
к 40-нанометровому
GT300
Архитектурных и технологических
подробностей о GT300 пока известно немного.
Заявлено наличие 512 шейдерных конвейеров,
которые сгруппированы в 16 кластеров.
Каждый кластер состоит из 2 субкластeров
по 16 конвейеров каждый, а также 2 локальных
планировщиков задач, 2 блоков выборки,
4 блоков спецфункций, 16 блоков погрузки/выгрузки
данных и пр. На каждый кластер приходится
64Кб встроенной памяти, которая должна
быть поделена между локальной памятью
и кэш-памятью 1-го уровня. Предполагается
выделение 16 Кб под локальную память и
48 Кб под кэш-память или наоборот. GT300 также
обладает общей кэш-памятью 2-го уровня
размером в 768Кб, точнее по 128 Кб на каждый
канал видеопамяти. Хотя GT200 также обладал
кэш-памятью 2-го уровня размером в 256 Кб
(по 64 Кб на каждый канал видеопамяти),
но шeйдерные конвейеры к ней доступа не
имели, только текстурные. Ширина шины
памяти у GT300 будет меньше, чем у GT200: 384
бита, то есть 6 каналов по 64 бита каждый.
Общее количество транзисторов явно будет превышать 3 млрд., а площадь ядра составит примерно 530 мм кв., что с учётом более высокой стоимости нового техпроцесса сделает GT300 в производстве существенно дороже 55-нанометрового GT200b. Если же учесть количество ресурсов, вложенных в разработку GT300 и архитектуры Fеrmi, а также низкий выход полностью работоспособных экземпляров в первое время, то себестоимость продуктов на основе GT300 может оказаться не по карману многим потенциальным покупателям. Что касается сроков их выхода на рынок, то информация также неопределённа. В самом лучшем случае первые продукты появятся в продаже в ноябре 2009, хотя возможны варианты с задержками в несколько месяцев.
Что
касается расчётной производительности
GT300, то она в основной мере зависит
от практической сбалансированности новой
архитектуры и реально
Из
предыдущих разработок AMD/ATI в сфере
научных расчётов стоит отметить
FirеStream 9270 на основе RV790, который при тактовой
частоте в 850 МГц демонстрировал 1200 Gflops
одинарной точности и 240 Gflops двойной точности.
Очевидно, что следующая модель FireStream
на основе RV870 будет обладать примерно
вдвое более высокой производительностью.
Также очевидно, что продукты на основе
GT300 не будут обладать значительным преимуществом
перед конкурентами на основе RV870 в скорости
расчётов одинарной точности, но значительно
превзойдут их возможности в области расчётов
двойной точности. Следовательно, в игровых
приложениях видеокарты на основе GT300
или RV870 будут демонстрировать примерно
сопоставимую производительность, а в
научных и прочих расчётах, требующих
двойной точности вычислений, продукты
на основе GT300 будут предпочтительнее.
Заключение
Предварительные тесты показали, что для достижения приемлемого уровня производительности достаточно 24 ядер Larrabее, работающих с тактовой частотой в 1,0 ГГц. Такой графический процессор обладал бы производительностью в 768 Gflops одинарной точности. Тесты также показали, что при увеличении числа ядер с 24 до 48 производительность увеличивалась почти линейно, что свидетельствует о высоком потенциале архитектуры. В целом, если учесть ресурсный потенциал Intel как разработчика и производителя, то продукты на основе архитектуры Larrabee станут достойными конкурентами продукции NVIDIA и AMD/ATI.
Это
одна из причин, по какой NVIDIA следует
поспешить с выпуском GT300. Что
касается позиционирования будущих
продуктов на основе GT300 преимущественно
на рынок на рынок суперкомпьютеров
и прочих высокопроизводительных расчётных
решений, то следует учесть тот факт,
что в этом году примерно 2/3 прибыли
компании принесли решения семейства
Quadro и Tеsla, поэтому ориентация на эти семейства
в ближайшем будущем очевидна. Жёсткая
конкуренция на рынке игровых видеокарт,
мировой экономический кризис, неудачи
с DirеctX 10 и Windows Vista
привели к тому, что норма прибыли на этом
рынке упала до очень низкого уровня, граничащего
с нерентабельностью. Время покажет, удастся
ли переломить эту тенденцию в ближайшем
будущем или нет, но вряд ли игровой индустрии
в этом существенно поможет GT300.
Список используемой литературы