Автор работы: Пользователь скрыл имя, 09 Декабря 2010 в 03:48, реферат
Кэш-пмять. структура кэш-памяти. описание иерархической модели кэш-памяти
Кэш-память
Кэш-память представляет собой быстродействующее ЗУ, размещенное на одном кристалле с ЦП или внешнее по отношению к ЦП. Кэш служит высокоскоростным буфером между ЦП и относительно медленной основной памятью. Идея кэш-памяти основана на прогнозировании наиболее вероятных обращений ЦП к оперативной памяти. В основу такого подхода положен принцип временной и пространственной локальности программы.
Если
ЦП обратился к какому-либо объекту
оперативной памяти, с высокой
долей вероятности ЦП вскоре снова
обратится к этому объекту. Примером этой
ситуации может быть код или данные в циклах.
Эта концепция описывается принципом
временной локальности, в соответствии
с которым часто используемые объекты
оперативной памяти должны быть "ближе"
к ЦП (в кэше).
Для согласования содержимого кэш-памяти и оперативной памяти используют три метода записи:
Как правило,
все методы записи, кроме сквозной,
позволяют для увеличения производительности
откладывать и группировать операции
записи в оперативную память.
В структуре кэш-памяти выделяют два типа блоков данных:
Пространство памяти отображения данных в кэше разбивается на строки - блоки фиксированной длины (например, 32, 64 или 128 байт). Каждая строка кэша может содержать непрерывный выровненный блок байт из оперативной памяти. Какой именно блок оперативной памяти отображен на данную строку кэша, определяется тегом строки и алгоритмом отображения. По алгоритмам отображения оперативной памяти в кэш выделяют три типа кэш-памяти:
Для полностью
ассоциативного кэша характерно, что
кэш-контроллер может поместить любой
блок оперативной памяти в любую строку
кэш-памяти (рис. Полностью
ассоциативный кэш 8х8
для 10-битного адреса). В этом случае
физический адрес разбивается на две части:
смещение в блоке (строке кэша) и номер
блока. При помещении блока в кэш номер
блока сохраняется в теге соответствующей
строки. Когда ЦП обращается к кэшу за
необходимым блоком, кэш-промах будет
обнаружен только после сравнения тегов
всех строк с номером блока.
Одно из основных достоинств данного способа отображения - хорошая утилизация оперативной памяти, т.к. нет ограничений на то, какой блок может быть отображен на ту или иную строку кэш-памяти. К недостаткам следует отнести сложную аппаратную реализацию этого способа, требующую большого количества схемотехники (в основном компараторов), что приводит к увеличению времени доступа к такому кэшу и увеличению его стоимости.
Рис.
Полностью ассоциативный
кэш 8х8 для 10-битного
адреса
Альтернативный
способ отображения оперативной
памяти в кэш - это кэш прямого
отображения (или одновходовый ассоциативный
кэш). В этом случае адрес памяти (номер
блока) однозначно определяет строку кэша,
в которую будет помещен данный блок. Физический
адрес разбивается на три части: смещение
в блоке (строке кэша), номер строки кэша
и тег. Тот или иной блок будет всегда помещаться
в строго определенную строку кэша, при
необходимости заменяя собой хранящийся
там другой блок. Когда ЦП обращается к
кэшу за необходимым блоком, для определения
удачного обращения или кэш-промаха достаточно
проверить тег лишь одной строки.
Очевидными
преимуществами данного алгоритма
являются простота и дешевизна реализации.
К недостаткам следует отнести
низкую эффективность такого кэша из-за
вероятных частых перезагрузок строк.
Например, при обращении к каждой 64-й
ячейке памяти в системе на рис.Кэш
прямого отображения 8х8
для 10-битного адреса
кэш-контроллер будет вынужден постоянно
перегружать одну и ту же строку кэш-памяти,
совершенно не задействовав остальные.
Рис.
Кэш прямого отображения 8х8
для 10-битного адреса
Несмотря на очевидные недостатки, данная технология нашла успешное применение, например, в МП Motorola MC68020, для организации кэша инструкций первого уровня (Рис. Схема организации кэш-памяти в МП Motorola MC68020). В данном микропроцессоре реализован кэш прямого отображения из 64 строк по 4 байт. Тег строки, кроме 24 бит, задающих адрес кэшированного блока, содержит бит значимости, определяющий действительность строки (если бит значимости 0, данная строка считается недействительной и не вызовет кэш-попадания). Обращения к данным не кэшируются.
Рис.
Схема организации кэш-памяти
в МП Motorola MC68020
Компромиссным
вариантом между первыми двумя
алгоритмами является множественный
ассоциативный кэш или
Рис. Двухвходовый ассоциативный кэш 8х8 для 10-битного адреса
Данный алгоритм
отображения сочетает достоинства
как полностью ассоциативного кэша (хорошая
утилизация памяти, высокая скорость),
так и кэша прямого доступа (простота и
дешевизна), лишь незначительно уступая
по этим характеристикам исходным алгоритмам.
Именно поэтому множественный ассоциативный
кэш наиболее широко распространен (табл.
Характеристики подсистемы кэш-памяти
у ЦП IA-32).
Таблица .
Характеристики подсистемы
кэш-памяти у ЦП IA-32
Примечания: В Intel-486 используется единый кэш команд и данных первого уровня. В Pentium Pro L1 кэш данных - 8 Кбайт 2-входовый ассоциативный, в остальных моделях P6 - 16 Кбайт 4-входовый ассоциативный. В Pentium 4 вместо L1 кэша команд используется L1 кэш микроопераций (кэш трассы).
Для организации кэш-памяти можно использовать принстонскую архитектуру (смешанный кэш для команд и данных, например, в Intel-486). Это очевидное (и неизбежное для фон-неймановских систем с внешней по отношению к ЦП кэш-памятью) решение не всегда бывает самым эффективным. Разделение кэш-памяти на кэш команд и кэш данных (кэш гарвардской архитектуры) позволяет повысить эффективность работы кэша по следующим соображениям:
Именно поэтому все последние модели IA-32, начиная с Pentium, для организации кэш-памяти первого уровня используют гарвардскую архитектуру.
Критерием
эффективной работы кэша можно считать
уменьшение среднего времени доступа
к памяти по сравнению с системой без кэш-памяти.
В таком случае среднее время доступа
можно оценить следующим образом:
Tср = (Thit x Rhit) + (Tmiss x (1 Rhit))
где Thit - время доступа к кэш-памяти в случае попадания (включает время на идентификацию промаха или попадания), Tmiss - время, необходимое на загрузку блока из основной памяти в строку кэша в случае кэш-промаха и последующую доставку запрошенных данных в процессор, Rhit - частота попаданий.
Очевидно,
что чем ближе значение Rhit к 1,
тем ближе значение Tср к Thit. Частота попаданий
определяется в основном архитектурой
кэш-памяти и ее объемом. Влияние наличия
и отсутствия кэш-памяти и ее объема на
рост производительности ЦП показано
в табл. Размер и эффективность
кэш-памяти
Таблица. Размер и эффективность кэш-памяти
Размер кэш-памяти | Частота попаданий, % | Рост производительности, % |
Нет кэш-памяти, DRAM с 2 TW | - | 0 |
16 Кб | 81 | 35 |
32 Кб | 86 | 38 |
64 Кб | 88 | 39 |
128 Кб | 89 | 39 |
Нет кэш-памяти, SRAM без TW | - | 47 |
Стратегия размещения.
На сложность этого механизма существенное
влияние оказывает
стратегия размещения, определяющая, в
какое место кэш-памяти
следует поместить каждый блок из основной
памяти.
В зависимости от способа размещения данных
основной памяти в кэш-памяти существует
три типа кэш-памяти:
Кэш с прямым отображением (размещением)
является самым
простым типом буфера. Адрес памяти однозначно
определяет строку
кэша, в которую будет помещен блок информации.
При этом предпо-
лагается, что оперативная память разбита
на блоки и каждому та-
кому блоку в буфере отводится всего одна
строка. Это простой и недорогой в реализации
способ отображения. Основной его недостаток
– жесткое закрепление за определенными
блоками ОП одной строки в кэше. Поэтому,
если программа поочередно обращается
к словам из двух различных блоков, отображаемых
на одну и ту же строку кэш-памяти, постоянно
будет происходить обновление данной
строки и вероятность попадания будет
низкой.
Кэш с полностью ассоциативным
отображением
позволяет преодолеть недостаток прямого,
разрешая загрузку любого блока ОП в любую
строку кэш-памяти. Логика управления
выделяет в адресе ОП два поля: поле тега
и поле слова. Поле тега совпадает с адресом
блока ОП. Для проверки наличия копии блока
в кэш-памяти, логика управления кэша должна
одновременно проверить теги всех строк
на совпадение с полем тега адреса. Ассоциативное
отображение обеспечивает гибкость при
выборе строки для вновь записываемого
блока. Принципиальный недостаток этого
способа – в необходимости использования
дорогой ассоциативной памяти.
Множественно-ассоциативный тип или частично-ассоциативный тип отображения – это один из возможных компромиссов, сочетающий достоинства прямого и ассоциативного способов. Кэш-память ( и тегов и данных) разбивается на некоторое количество модулей. Зависимость между модулем и блоками ОП такая же жесткая, как и при прямом отображении. А вот размещение блоков по строкам модуля произвольное и для поиска нужной строки в пределах модуля используется ассоциативный принцип. Этот способ отображения наиболее широко распространен в современных микропроцессорах.