Автор работы: Пользователь скрыл имя, 08 Апреля 2011 в 01:27, курсовая работа
Механизм OLAP является одним из популярных методов анализа данных. Термин OLAP - расшифровывается как Online Analytical Processing. То есть примерно можно перевести как “Обработка данных в реальном времени”. Интерактивная аналитическая обработка (OLAP) позволяет получать доступ к статистическим и организованным данным из источников бизнес-данных, например хранилищ данных, в многомерной структуре, именуемой куб.
1. Введение
2. Хранилище данных
2.1 Что такое хранилище данных
2.2 Структура хранилищ даных
2.3 Таблица факторов
2.4 Таблица измерений
3. Основные понятия OLAP
3.1 Что такое OLAP
3.2 Тест FAMSI
3.3 Многомерные кубы
3.3.1 ”Резание” куба
3.3.2 Метки
3.3.3 Иерархии и уровни
4. OLAP на клиенте и на сервере
5. Технические аспекты многомерного хранения
6. Архитектура OLAP приложений
7. Системы оперативной обработки транзакций или оперативные системы – OLTP, сравнительные характеристики
7.1 сравнение OLAP, OLTP, хранилище данных
8. Получение практических навыков.
9. Заключение
гибридный OLAP (hybrid OLAP, HOLAP) — технология, при которой одна часть данных хранится в многомерной базе, а другая часть — в реляционной. При этом инструментальные средства, поддерживающие эту технологию, обеспечивают прозрачность данных для пользователя, который на логическом уровне всегда работает с многомерными данными. [2]
6. Архитектура OLAP- приложений
Все, что говорилось выше про OLAP, по сути, относилось к многомерному представлению данных. То, как данные хранятся, грубо говоря, не волнует ни конечного пользователя, ни разработчиков инструмента, которым клиент пользуется.
Многомерность в OLAP-приложениях может быть разделена на три уровня:
1.Многомерное
представление данных - средства
конечного пользователя, обеспечивающие
многомерную визуализацию и
2.Многомерная обработка - средство (язык) формулирования многомерных запросов (традиционный реляционный язык SQL здесь оказывается непригодным) и процессор, умеющий обработать и выполнить такой запрос.
3.Многомерное
хранение - средства физической
Первые два уровня в обязательном порядке присутствуют во всех OLAP-средствах. Третий уровень, хотя и является широко распространенным, не обязателен, так как данные для многомерного представления могут извлекаться и из обычных реляционных структур; процессор многомерных запросов в этом случае транслирует многомерные запросы в SQL-запросы, которые выполняются реляционной СУБД.
Конкретные OLAP-продукты, как правило, представляют собой либо средство многомерного представления данных, OLAP-клиент, либо многомерную серверную СУБД, OLAP-сервер (например, Oracle Express Server или Microsoft OLAP Services).
Слой многомерной обработки обычно бывает встроен в OLAP-клиент и/или в OLAP-сервер, но может быть выделен в чистом виде, как, например, компонент Pivot Table Service фирмы Microsoft [1, с.50-55]
7. Системы оперативной обработки транзакций или оперативные системы – OLTP, сравнительные характеристики
Компьютерные системы, осуществляющие учет операций и собственно доступ к базам транзакций, принято называть системами оперативной обработки транзакций (OLTP - On-Line Transactional Processing) или учетными системами.
Учетные
системы настраиваются и
используемые в OLTP-приложениях, осложняют создание даже простых отчетов, так как данные чаще всего распределены по множеству таблиц, и для их агрегирования необходимо выполнять сложные операции объединения. Как правило, попытки создания комплексных отчетов требуют больших вычислительных мощностей и приводят к потере производительности.
Набор аналитических функций в учетных системах обычно весьма ограничен. Схемы, используемые в OLTP-приложениях, осложняют создание даже простых отчетов, так как данные чаще всего распределены по множеству таблиц, и для их агрегирования необходимо выполнять сложные операции объединения. Как правило, попытки создания комплексных отчетов требуют больших вычислительных мощностей и приводят к потере производительности. Кроме того, в учетных системах хранятся постоянно изменяющиеся данные. По мере сбора транзакций суммарные значения меняются очень быстро, поэтому два анализа, проведенные с интервалом в несколько минут, могут дать разные результаты. Чаще всего, анализ выполнятся по окончании отчетного периода, иначе картина может оказаться искаженной. Кроме того, необходимые для анализа данные могут храниться в нескольких системах. Этим объясняется интерес к объединению и анализу данных учетной системы с помощью технологии OLAP (On-Line Analytical Processing - оперативная аналитическая обработка). Этот метод позволяет аналитикам, менеджерам и руководителям "проникнуть в суть" накопленных данных за счет быстрого и согласованного доступа к широкому спектру представлений информации. Исходные данные преобразуются таким образом, чтобы наглядно отразить структуру деятельности предприятия.
Как правило, учетные системы работают с реляционными базами данных. Для OLAP-приложений же разработана специальная многомерная модель, которая позволяет более эффективно использовать данные, накопленные в оперативных системах. Технология оперативной аналитической обработки ориентирована на представление данных в виде массивов. Под массивом понимается последовательность элементов, например продажи продукта по рынкам/временным периодам, или доход по времени/региону.
Характеристики систем:
1.OLAP запросы к базам данных чаще всего бывают сложными и требуют много времени. Прямой доступ к OLTP-базе существенно снижает общую производительность оперативной системы.
2.Разнообразные учетные системы неоднородны по типу используемых синтаксических соглашений и концептуальных допущений (единицы измерений, онтологии, наименование, кодирование и т.п.), поэтому их интеграция затруднена.
3.Данные в учетных системах часто "зашумленные", неполные и несогласованные.
Как правило, нет единой модели данных масштаба предприятия. Кроме того, при проектировании баз учетной системы могут использоваться разные модели данных (иерархическая, реляционная, объектно-ориентированная, плоские файлы, "фирменные" модели).
4.В оперативных системах отсутствует метод предоставления данных для конкретных групп пользователей в нужной для них форме.
5.Информация за прошлые периоды теряется при обновлении OLTP- базы (при записи в нее новых, актуальных данных). Это препятствует выполнению анализа временных тенденций, который так важен для многих сфер бизнеса.
6.В OLTP-базе не хранятся данные в агрегированном, ненормализованном, виде, что необходимо для оперативной аналитической обработки. А преобразование данных в процессе выполнения запросов оказывается слишком трудоемким.
Кроме всех перечисленных выше концептуальных различий, существуют еще и технологические проблемы, которые необходимо преодолеть для внедрения аналитических возможностей в учетные системы. Среди них можно назвать следующие сложности: различие в аппаратных платформах (компьютерах, сетях и периферийных устройствах), использование разного программного обеспечения (разнообразных операционных систем, СУБД, языков программирования, протоколов, связующего ПО и т.п.), а также географическое распределение баз данных по всей организации и вне ее.
7.1. сравнение OLAP, OLTP, хранилище данных
Хранилище данных - методология и технология, позволяющая решить проблемы, возникающие при интеграции распределенных и гетерогенных баз учетной системы при внедрении методов OLAP.
Информация в Хранилище является предметно-ориентированной, интегрированной, она хранится долговременно, а ее управление осуществляется независимо от исходных операционных баз данных. В отличие от OLTP-баз, где хранятся детальные данные в виде отдельных записей, в Хранилище содержится сводная и консолидированная информация (часто из нескольких операционных источников), в том числе и историческая.
Объем данных в Хранилище намного больше, чем в базе учетной системы (в тысячи раз). Здесь данные организованы в пре-агрегированной форме в виде многомерных кубов (гиперкубов), удобных для выполнения аналитических операций. Архитектура Хранилища представлена набором компонентов, среди них: источники данных, репозиторий метаданных (здесь описывается, какая информация доступна и где), один или несколько серверов Хранилища или центральный репозиторий (который управляет исходными базами и поддерживает многомерные представления данных), а также интерфейсные средства (например, для создания запросов, отчетов и выполнения анализа). При обновлении все изменения в исходных данных отражаются в Хранилище. За счет оперативных средств обратной связи Хранилище данных позволяет интегрировать процесс поддержки принятия решений с учетными системами и внешними источниками данных.
Средства OLAP часто реализуются в виде набора многопользовательских приложений с Web-поддержкой, дают быстрый доступ к любому элементу базы вне зависимости от объема и сложности данных. Часто это достигается за счет использования OLAP-сервера - мощного многопользовательского инструмента для работы с многомерными структурами данных. Конструкция сервера и структура данных оптимизируются таким образом, чтобы можно было выполнять нерегламентированные запросы, а также быстрые, гибкие вычисления и преобразования исходных данных.
С помощью OLAP сервера может быть организовано физическое хранение обработанной многомерной информации, что позволяет быстро выдавать ответы на запросы пользователя. Кроме того, предусматривается преобразование данных из реляционных и других баз в многомерные структуры в режиме реального времени. [7, с. 48-60], [8]
8. получение практических навыков.
Получение практических навыков заключается в разработке OLAP – куба на базе СУБД Microsoft Access, лабараторная работа № 6, таблица 1. Microsoft Access является не сложной системой для построения таблиц и запросов для непрофессиональных пользователей. Система OLAP позволяет создать таблицу на основе большого количества данных и будет достаточна удобна для использования и просмотра диаграмм.
Лабораторная работа № 6 содержит много таблиц, на основе которых мы должны оперативно получить информацию.
Построение OLAP – куба в MS Excel для анализа данных включает следующие этапы:
Таким
образом мы можем увидеть точные
итоги по годам, названием товаров, названием
поставщика, а так же отсортировать ненужные
данные.
9.заключение
В данной работе мы рассмотрели основные понятия системы OLAP, ее сравнительные характеристики и применение в бизнесе. Исходя из полученных сведений можно сказать, что система OLAP является наиболее удобной для создание прогнозов и моделирования. А так же здесь пользователь применяет привычные для него инструменты для реализации определенных управленческих методик, но при этом данные для обработки и анализа хранятся на OLAP–севере. Построение OLAP – куба на основе базы данных Microsoft Access помогло убедится в этом на примере, где можно увидеть все удобства создания запросов такие как: извлечение только информации необходимой для работы, уменьшение объемом таблиц, анализ полученных данных путем сравнения, вычисления максимума или минимума, извлечение дисперсии. Все эти функции обеспечивают оперативность и правильность выполнения анализа по заданным данным.
Таким образом, можно сделать вывод, грамотно построенная OLAP-система играет в жизни бизнесмена весьма заметную роль. Ведь с ее помощью можно получить доступ к самой свежей информации и оперативно выполнить общие аналитические процедуры. А сложные финансовые функции и необходимые организационные аспекты будут обеспечены специализированными системами, опять же, на основе данных OLAP. Как показывает опыт ведущих компаний, OLAP-технологии экономически выгодны и инвестиции в такие решения окупаются довольно быстро. А это означает, что многие отечественные предприятия и организации имеют хорошую возможность повышения эффективности принятия решений – за счет структурирования управленческой информации и оперативности ее обработки.
Несмотря на то, что стоимость аналитических систем даже сегодня остается достаточно высокой, а методологии и технологии реализации таких систем находятся ещё в стадии их становления, уже сегодня, экономический эффект обеспечиваемый ими существенно превышает эффект от традиционных оперативных систем.
Эффект
от правильной организации, стратегического
и оперативного планирования развития
бизнеса трудно заранее оценить
в цифрах, но очевидно, что он в
десятки и даже сотни раз может
превзойти затраты на реализацию
таких систем. Однако не следует
и заблуждаться. Эффект обеспечивает
не сама система, а люди с ней работающие.
Поэтому не совсем корректны декларации
типа: «система Хранилищ Данных и OLAP-технологий
будет помогать менеджеру принимать правильные
решения». Современные аналитические
системы не являются системами искусственного
интеллекта и они не могут ни помочь, ни
помешать в принятии решения. Их цель своевременно
обеспечить менеджера всей информацией
необходимой для принятия решения в удобном
виде. А какая информация будет запрошена
и какое решение будет принято на её основе,
зависит только от конкретного человека
ее использующего. [2]
Информация о работе Системы OLAP сравнительные характеристики и применение в бизнесе