Автор работы: Пользователь скрыл имя, 08 Февраля 2012 в 18:21, реферат
Программное обеспечение для управления всем жизненным циклом данных (от создания до удаления) и доставки данных по запросу с целью оптимизации использования и поддержки эффективного управления на всем предприятии. Сегмент ПО для управления данными включает в себя системы управления реляционными и нереляционными базами данных, инструменты и утилиты управления данными (например, загрузка/выгрузка, архивирование, сокращение, маскирование и т. п.), а также средства защиты (например, мониторинг операций с базой данных). Примеры: Optim Data Growth Solution z/OS, Cloudscape, DB2 Connect Enterprise Edition, IMS Tools, InfoSphere MashupHub.
ВОЕННАЯ АКАДЕМИЯ
ВОЙСКОВОЙ ПРОТИВОВОЗДУШНОЙ ОБОРОНЫ
ВООРУЖЕННЫХ СИЛ РОССИЙСКОЙ ФЕДЕРАЦИИ
им. МАРШАЛА
СОВЕТСКОГО СОЮЗА А. М. ВАСИЛЕВСКОГО
Реферат
на тему:
« Задачи
управления данными»
ЗАДАЧИ УПРАВЛЕНИЯ ДАННЫМИ
Управление данными (англ. data management) — процесс, связанный с накоплением, организацией, запоминанием, обновлением, хранением данных и поиском информации.
Программное
обеспечение для управления всем
жизненным циклом данных (от создания
до удаления) и доставки данных по запросу
с целью оптимизации
Старинный термин «управление данными» в настоящее время всегда понимается как управление файлами.
Файл есть набор данных, хранящийся на периферийном устройстве и доступный по имени. При этом конкретное расположение данных на устройстве не интересует пользователя и полностью передоверяется системе. До изобретения файлов пользователь должен был обращаться к своим данным, указывая их адреса на диске или на магнитной ленте.
Понятие «файловая система» означает стандартизованную совокупность структур данных, алгоритмов и программ, обеспечивающих хранение файлов и выполнение операций с ними. Мощная современная ОС обычно поддерживает возможность использования нескольких разных файловых систем. И наоборот, одна и та же файловая система может поддерживаться различными ОС.
Среди задач, решаемых подсистемой управления данными, можно назвать следующие:
С каждым файлом связан набор атрибутов (характеристик), т.е. набор сведений о файле. Состав атрибутов может сильно различаться для разных файловых систем. Приведем примерный список возможных атрибутов, не привязываясь к какой-либо конкретной системе.
Записи, в которых содержатся атрибуты каждого файла, собраны в каталоги (они же папки, директории). В ранних ОС (и даже в первой версии MS-DOS) на каждом дисковом томе имелся единственный каталог, содержащий полный список всех файлов этого тома. Такое решение было вполне естественным, пока количество файлов не превышало двух – трех десятков. Однако при увеличении объема дисков и, как следствие, числа файлов на них такой одноуровневый каталог становился все менее удобным. В некоторых ОС использовалась двухуровневая организация каталогов. При этом главный каталог содержал список каталогов второго уровня, закрепленных за отдельными пользователями или проектами. Однако позднее стала общепринятой иерархическая структура каталогов, при которой каждый каталог может, помимо файлов, содержать вложенные подкаталоги, причем глубина вложения не ограничивается.
Все хранящиеся в файловой системе служебные данные, описывающие атрибуты и размещение файлов, структуру каталогов, общую структуру дискового тома и т.п., принято называть метаданными, в отличие от «просто данных», хранящихся в файлах.
Область
данных диска, отведенную для хранения
файлов, можно представить как
линейную последовательность адресуемых
блоков (секторов). Размещая файлы в
этой области, ОС должна отвести для
каждого файла необходимое
Рис. 1
Непрерывное размещение имеет два серьезных достоинства.
К сожалению, недостатки непрерывного распределения еще более весомы.
Сегментированное размещение лишено первого из недостатков непрерывного: при создании файла ему обычно вообще не выделяют память, а потом, по мере возрастания размера файла, ему могут быть выделены любые свободные сегменты на диске, независимо от их длины.
Не
так просто с фрагментацией. Конечно,
в отличие от непрерывного размещения,
при сегментированном никакая фрагментация
не помешает системе использовать все
блоки, имеющиеся на диске. Однако последовательное
чтение из сегментированного файла
может выполняться существенно
медленнее за счет необходимости
переходить от сегмента к сегменту.
Замедление особенно заметно, если файл
оказался разбросан маленькими кусочками
по нескольким цилиндрам диска. В
результате, время от времени целесообразно
выполнять дефрагментацию диска, чтобы
повысить скорость доступа к данным.
При сегментированном размещении дефрагментация
означает не только объединение всех
свободных участков диска, но и, главным
образом, объединение сегментов
каждого файла. Эта процедура
выполняется значительно
Недостатком сегментированного размещения является то, что информация о размещении файла в этом случае намного сложнее, чем для непрерывного случая и, что наиболее неприятно, объем этой информации переменный: чем большее число сегментов занимает файл, тем больше нужно информации, ибо надо перечислить все сегменты. Имеется почти столько же способов решения этой проблемы, сколько вообще придумано разных файловых систем.
Чтобы уменьшить влияние сегментации на скорость доступа к данным файла, в ОС, использующих сегментированное размещение, применяются различные алгоритмы выбора места для файла. Их целью является разместить файл по возможности в одном сегменте, и только в крайнем случае разбивать файл на несколько сегментов.
В современных ОС для файловых систем на магнитных дисках практически всегда используют сегментированное размещение. Иное дело файловые системы на дисках, предназначенных только для чтения (например, CD ROM). Нетрудно понять, что в этом случае недостатки непрерывного размещения не имеют никакого значения, а его достоинства сохраняются.
Еще одной важной характеристикой размещения файлов является степень его «дробности». До сих пор мы предполагали, что файл может занимать любое целое число блоков, а под блоком фактически понимали сектор диска. Проблема в том, что для дисков большого объема число блоков может быть слишком большим. Допустим, в некоторой файловой системе размер блока равен 512 байт, а для хранения номеров блоков файла используются 16-разрядные числа. В этом случае размер области данных диска не сможет превысить 512 * 216 = 32 Мб, что нынче смешно. Конечно, можно перейти к использованию 32-разрядных номеров блоков, но тогда суммарный размер информации о размещении всех файлов на диске становится чересчур большим. Обычный выход из этого затруднения заключается в том, что минимальной единицей размещения файлов считают кластер (называемый в некоторых системах блоком или логическим блоком), который принимается равным 2k секторов, т.е., например, 1, 2, 4, 8, 16, 32 сектора, редко больше. Каждому файлу отводится целое число кластеров, и в информации о размещении файла хранятся номера кластеров, а не секторов. Увеличение размера кластеров позволяет сократить количество данных о размещении файлов «и в длину и в ширину»: во-первых, для каждого файла нужно хранить информацию о меньшем числе кластеров, а во-вторых, уменьшается число двоичных разрядов, используемых для задания номера кластера (либо при той же разрядности можно использовать больший диск). Так, при кластере размером 32 сектора и 16-разрядных номерах можно адресовать до 1 Гб дисковой памяти.