Системы OLAP сравнительные характеристики и применение в бизнесе

Автор работы: Пользователь скрыл имя, 08 Апреля 2011 в 01:27, курсовая работа

Описание работы

Механизм OLAP является одним из популярных методов анализа данных. Термин OLAP - расшифровывается как Online Analytical Processing. То есть примерно можно перевести как “Обработка данных в реальном времени”. Интерактивная аналитическая обработка (OLAP) позволяет получать доступ к статистическим и организованным данным из источников бизнес-данных, например хранилищ данных, в многомерной структуре, именуемой куб.

Содержание работы

1. Введение
2. Хранилище данных
2.1 Что такое хранилище данных
2.2 Структура хранилищ даных
2.3 Таблица факторов
2.4 Таблица измерений
3. Основные понятия OLAP
3.1 Что такое OLAP
3.2 Тест FAMSI
3.3 Многомерные кубы
3.3.1 ”Резание” куба
3.3.2 Метки
3.3.3 Иерархии и уровни
4. OLAP на клиенте и на сервере
5. Технические аспекты многомерного хранения
6. Архитектура OLAP приложений
7. Системы оперативной обработки транзакций или оперативные системы – OLTP, сравнительные характеристики
7.1 сравнение OLAP, OLTP, хранилище данных
8. Получение практических навыков.
9. Заключение

Файлы: 1 файл

системы OLAP сравнительные характеристики и применение в бизнесе.doc

— 113.00 Кб (Скачать файл)

     Белорусский Государственный Университет 
 
 
 
 
 
 
 
 
 
 

     Курсовой  проект на тему:

     системы OLAP: сравнительные характеристики и  применение в бизнесе 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

                                           Выполнила

                    Студентка 2-ого курса

                    Экономического факультета

                    Отделение «финансы и кредит - 2»

                     Краснова Ольга 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 

     Содержание

  1. Введение
  2. Хранилище данных

     2.1 Что такое хранилище данных

     2.2 Структура хранилищ даных

     2.3 Таблица факторов

     2.4 Таблица измерений

  1. Основные понятия OLAP
    1. Что такое OLAP
    2. Тест FAMSI
    3. Многомерные кубы
      1. ”Резание”  куба
      2. Метки
      3. Иерархии и уровни
  2. OLAP на клиенте и на сервере
  3. Технические аспекты многомерного хранения
  4. Архитектура OLAP приложений
  5. Системы оперативной обработки транзакций или оперативные системы – OLTP, сравнительные характеристики

     7.1 сравнение OLAP, OLTP, хранилище данных

  1. Получение практических навыков.
  2. Заключение
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

     1.Введение 

     Редко встретишь человека, который не знает  или не слышал о понятии база данных и ее применении. На сегодняшний  день анализ данных является основным инструментом развития информационных технологий. Считалось, что руководитель вынужден принимать управленческие решения при недостатке информации. Однако с внедрением компьютерных информационных систем, которые способны хранить большие массивы данных, возникает задача оптимального их использования. Руководители крупных компаний считают, что только при высоком уровни прогнозирования можно достичь результатов в бизнесе, но многие не довольны результатами своих систем прогнозирования и не уверены в их точности и надежности. Иногда руководителям нужны данные о всех сделках конкретного филиала, но при этом необходимо отсортировать ненужные данные: номер телефона клиента, его паспортные данные и т.д.. Основной задачей фирмы является создание структурированной информации, на основе которой принимаются обоснованные решения. За продолжительный интервал времени у фирмы накапливаются данные, которые должны быть учтены в годовых отчетах. Составление традиционного отчета займет больше времени и он лишен «гибкости» - его нельзя «развернуть», «свернуть», чтобы просмотреть результаты. Поэтому используют систему OLAP, которая учитывает все эти недостатки и позволяет оперативно составлять точные отчеты из многих источников одновременно.

     Механизм OLAP является одним из популярных методов анализа данных. Термин OLAP - расшифровывается как Online Analytical Processing. То есть примерно можно перевести как “Обработка данных в реальном времени”. Интерактивная аналитическая обработка (OLAP) позволяет получать доступ к статистическим и организованным данным из источников бизнес-данных, например хранилищ данных, в многомерной структуре, именуемой куб. Технологии OLAP позволяют на основе оперативной базы данных комплекса производить построение многомерных хранилищ данных с целью их экспресс-обработки для принятия управленческих решений. OLAP- системы обеспечивают решение многих аналитических задач: анализ ключевых показателей деятельности, маркетинговой и финансово-экономический анализ, моделирование, прогнозирование. Такие системы не обусловлены особенностями информационной инфраструктуры компании и могут работать со всеми необходимыми данными, независимо от источников. Отметим, что OLAP- функциональность может быть реализована различными способами, начиная с простейших средств анализа данных в офисных приложениях и заканчивая распределенными аналитическими системами, основанными на серверных продуктах[1, с.3-4] 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

     2. Хранилище данных.

     2.1. Что такое хранилище данных

     Информационные  системы масштаба предприятия, как правило, содержат приложения, предназначенные для комплексного многомерного анализа данных, их динамики, тенденций и т.п. Такой анализ в конечном итоге призван содействовать принятию решений. Нередко эти системы так и называются — системы поддержки принятия решений.

     Принять любое управленческое решение невозможно не обладая необходимой для этого информацией, обычно количественной. Для этого необходимо создание хранилищ данных (Data warehouses), то есть процесс сбора, отсеивания и предварительной обработки данных с целью предоставления результирующей информации пользователям для статистического анализа (а нередко и создания аналитических отчетов).

     Ральф Кимбалл, один из авторов концепции  хранилищ данных, описывал хранилище данных как "место, где люди могут получить доступ к своим данным"Он же сформулировал и основные требования к хранилищам данных:

  • поддержка высокой скорости получения данных из хранилища;
  • поддержка внутренней непротиворечивости данных;
  • возможность получения и сравнения так называемых срезов данных
  • наличие удобных утилит просмотра данных в хранилище;
  • полнота и достоверность хранимых данных;
  • поддержка качественного процесса пополнения данных.

     Удовлетворять всем перечисленным требованиям  в рамках одного и того же продукта зачастую не удается. Поэтому для реализации хранилищ данных обычно используется несколько продуктов, одни их которых представляют собой собственно средства хранения данных, другие — средства их извлечения и просмотра, третьи — средства их пополнения и т.д.

     Типичное хранилище данных, как правило, отличается от обычной реляционной базы данных. Во-первых, обычные базы данных предназначены для того, чтобы помочь пользователям выполнять повседневную работу, тогда как хранилища данных предназначены для принятия решений. Например, продажа товара и выписка счета производятся с использованием базы данных, предназначенной для обработки транзакций, а анализ динамики продаж за несколько лет, позволяющий спланировать работу с поставщиками, — с помощью хранилища данных.

     Во-вторых, обычные базы данных подвержены постоянным изменениям в процессе работы пользователей, а хранилище данных относительно стабильно: данные в нем обычно обновляются согласно расписанию (например, еженедельно, ежедневно или ежечасно — в зависимости от потребностей). В идеале процесс пополнения представляет собой просто добавление новых данных за определенный период времени без изменения прежней информации, уже находящейся в хранилище.

     И, в-третьих, обычные базы данных чаще всего являются источником данных, попадающих в хранилище. Кроме того, хранилище может пополняться за счет внешних источников, например статистических отчетов. [1, с.4-6]

     2.2 структура хранилищ данных

     Как мы уже знаем, конечной целью использования OLAP является анализ данных и представление результатов этого анализа в виде, удобном для восприятия и принятия решений. Основная идея OLAP заключается в построении многомерных кубов, которые будут доступны для пользовательских запросов. Однако исходные данные для построения OLAP-кубов обычно хранятся в реляционных базах данных. Нередко это специализированные реляционные базы данных, называемые также хранилищами данных (Data Warehouse). В отличие от так называемых оперативных баз данных, с которыми работают приложения, модифицирующие данные, хранилища данных предназначены исключительно для обработки и анализа информации, поэтому проектируются они таким образом, чтобы время выполнения запросов к ним было минимальным. Обычно данные копируются в хранилище из оперативных баз данных согласно определенному расписанию.

     Типичная  структура хранилища данных существенно  отличается от структуры обычной  реляционной СУБД. Как правило, эта  структура денормализована (это  позволяет повысить скорость выполнения запросов), поэтому может допускать  избыточность данных.

     2.3  Таблица факторов

     Таблица фактов является основной таблицей хранилища  данных. Как правило, она содержит сведения об объектах или событиях, совокупность которых будет в  дальнейшем анализироваться. Обычно говорят о четырех наиболее часто встречающихся типах фактов. К ним относятся:

     1.факты,  связанные с транзакциями. Они  основаны на отдельных событиях

     2.факты,  связанные с «моментальными снимками».  Основаны на состоянии объекта (например, банковского счета) в определенные моменты времени, например на конец дня, или месяца.

     3.факты,  связанные с элементами документа. 

     4.факты,  связанные с событиями или  состоянием объекта. 

     Таблица фактов, как правило, содержит уникальный составной ключ, объединяющий первичные  ключи таблиц измерений. Чаще всего  это целочисленные значения либо значения типа «дата/время» — ведь таблица фактов может содержать сотни тысяч или даже миллионы записей, и хранить в ней повторяющиеся текстовые описания, как правило, невыгодно — лучше поместить их в меньшие по объему таблицы измерений. При этом как ключевые, так и некоторые неключевые поля должны соответствовать будущим измерениям OLAP-куба. Помимо этого таблица фактов содержит одно или несколько числовых полей, на основании которых в дальнейшем будут получены агрегатные данные.

     2.4 Таблица измерений

     Таблицы измерений содержат неизменяемые либо редко изменяемые данные. В подавляющем большинстве случаев эти данные представляют собой по одной записи для каждого члена нижнего уровня иерархии в измерении. Таблицы измерений также содержат как минимум одно описательное поле (обычно с именем члена измерения) и, как правило, целочисленное ключевое поле (обычно это суррогатный ключ) для однозначной идентификации члена измерения. Если будущее измерение, основанное на данной таблице измерений, содержит иерархию, то таблица измерений также может содержать поля, указывающие на «родителя» данного члена в этой иерархии. Нередко (но не всегда) таблица измерений может содержать и поля, указывающие на «прародителей», и иных «предков» в данной иерархии (это обычно характерно для сбалансированных иерархий), а также дополнительные атрибуты членов измерений, содержавшиеся в исходной оперативной базе данных (например, адреса и телефоны клиентов).

     Одно  измерение куба может содержаться  как в одной таблице (в том  числе и при наличии нескольких уровней иерархии), так и в нескольких связанных таблицах, соответствующих различным уровням иерархии в измерении. Если каждое измерение содержится в одной таблице, такая схема хранилища данных носит название «звезда». Если же хотя бы одно измерение содержится в нескольких связанных таблицах, такая схема хранилища данных носит название «снежинка». Однако не все хранилища данных проектируются по двум схемам. Так, довольно часто вместо ключевого поля для измерения, содержащего данные типа «дата», и соответствующей таблицы измерений сама таблица фактов может содержать ключевое поле типа «дата». В этом случае соответствующая таблица измерений просто отсутствует. [3, с.15-40]

Информация о работе Системы OLAP сравнительные характеристики и применение в бизнесе