Автор работы: Пользователь скрыл имя, 05 Ноября 2010 в 16:03, Не определен
В работе представлены теоретические и методологические аспекты предварительного анализа данных, а так же результаты исследования
Второй этап кодирования касается назначения кодовых номеров классов. Например, мужской пол может обозначаться буквой М, а женский – буквой – F. Как альтернативный вариант, эти классы могут обозначаться 1– мужчина и 2 –женщина. Вообще для обозначения классов лучше использовать цифры, а не буквы. На этой стадии также лучше использовать цифры в том виде, как они зафиксировались в форме сбора данных, а не раскладывать их на более мелкие категории.
Когда для анализа данных предполагается использовать компьютер, кодирование необходимо выполнять таким образом, чтобы данные оказывались готовыми для ввода в машину. Вне зависимости от того, как будет обрабатываться ввод, либо с помощью чувствительных к меткам форм, либо непосредственно через клавиатуру терминала, полезно обеспечить наглядность ввода посредством многоколонной записи. Кроме того рекомендуется следовать установившимся традициям кодирования данных:
Завершающий
этап процесса кодирования состоит
в подготовке книги кодов, которая
содержит общие инструкции, указывающие,
каким образом была закодирована
каждая позиция данных. Книга кодов
– это книга, в которой описывается каждая
переменная, даётся ей кодовое имя и идентифицируется
её местоположение в записи [Черчилль,
с. 561]. В ней перечисляются коды каждой
переменной и категории, включенные в
каждый код. Далее в ней указывается, где
в компьютерной записи располагается
переменная и каким образом эта переменная
читается – например с десятичной точкой
или как целое число. Последняя информация
обеспечивается установлением формата.
2.3. Табулирование данных и его формы.
Табулирование - это подсчет количеств событий, которые попадают в различные категории. Табуляция может выполняться целиком от руки, целиком машиной или частично машиной и частично от руки. Какой из подходов наиболее эффективен, зависит и от числа необходимых табуляций, и от количества событий в каждой табуляции. Число табуляций является прямой функцией количества переменных, тогда как количество событий – это прямая функция размера выборки. Чем меньше число табуляций требуется и чем меньше выборка, тем более привлекательными становятся ручные методы. Однако привлекательность любого подхода также в значительной степени зависит от сложности табуляций. Сложность возрастает по мере увеличения числа переменных, получаемых для одновременной обработки в перекрёстной табуляции. Сложность также возрастает с увеличением числа категорий на одну переменную.
Хотя в очень простых исследованиях ручная табуляция может оказаться полезной, особенно если вопросов немного и число возможных ответов ограничено, большинство исследований полагается на компьютерную табуляцию, использующую пакеты программ. Существует громадное количество таких программ. Некоторые из них, в дополнение к отчётности о количестве событий в каждой категории, могут рассчитывать итоговые статистики и графически представлять гистограммы значений. Базисный ввод для такого рода статистических анализов называется массивом данных, в котором перечисляются значения каждой переменной для каждого блока статистической выборки. Каждая переменная занимает особое место в записи для блока выборки, что упрощает доступ к её значениям для всех событий. Местоположений каждой переменной определяется в книге кодов [Черчилль, с. 561].
Табулирование
может принимать форму простой
табуляции или перекрёстной табуляции.
Простая или одномерная табуляция - это
подсчет количества событий, которые попадают
в каждую категорию, когда категории базируются
на одной переменной. Она может повторяться
для каждой из переменных исследования,
но табуляция для каждой переменной не
зависит от табуляции для других переменных.
В перекрёстной табуляции две или более
переменных обрабатываются одновременно.
Одномерная (простая) табуляция в дополнение к организации связи результатов исследования, может использоваться в нескольких других целях:
Первые три направления использования часто определяются как очистка данных. Безответность позиций оказывается существенной проблемой в большинстве исследований. По существу дела, степень безответности позиций зачастую служит полезным индикатором качества исследования. Существует несколько стратегий поведения относительно того, что делать с утраченными данными:
Не существует «правильного» или простого ответа на вопрос о том, каким образом обрабатывать утраченные позиции. Все зависит от целей исследования, обстоятельств утраты информации и методов, которые используются для анализа данных.
Как упоминалось выше, ещё одна цель одномерной табуляции состоит в локализации грубых ошибок. Грубая ошибка – это ошибка, которая возникает при редактировании, кодировании, при переносе информации из формы в базы данных или табулировании данных.
Ещё одно применение одномерной табуляции состоит в локализации посторонних значений. Постороннее значение – это наблюдение, настолько отличающееся по величине от остальных наблюдений, что аналитик предпочитает обрабатывать его как особое событие. Это может означать исключение наблюдения из анализа или определение особых факторов, которые ответственны за это уникальное наблюдение.
Четвёртое направление использования одномерной табуляции частот состоит в определении эмпирического распределения рассматриваемой характеристики. Некоторые аналитики игнорируют распределение переменных и автоматически рассчитывают такие суммарные статистики, как среднее значение. Игнорирование распределения переменных может привести к серьёзной ошибке.
Прежде чем приступать к любому анализу переменной, надо разобраться в смысле ее распределения.
Часто
распределение лучше
Альтернативным способом проникновения в суть эмпирического распределения является построение эмпирической функции накопленных частот. Это функция, которая показывает число событий, имеющих значения меньше или равные специфицированной величине; эта функция генерируется посредством соединения точек, представляющих заданные комбинации Х (значения) и У (накопленных частот), прямыми линиями.
Перекрестная или многомерная табуляция - это подсчет количества событий, которые попадают в каждую из нескольких категорий, когда категории базируются на двух или более переменных, рассматриваемых одновременно. Она является важным механизмом для изучения связей внутри и между переменными. В перекрёстной табуляции выборка делится на подгруппы таким образом, чтобы выявить, каким образом зависимые переменные изменяются от подгруппы к подгруппе. Многие маркетинговые исследования не идут дальше перекрёстной табуляции, и, более того, большинство исследований, использующих преимущества более сложных аналитических методов, тоже включают в себя перекрёстную табуляцию в качестве важной составляющей. Таким образом, и аналитикам, и лицам, которым приходится принимать решения, необходимо понимать, каким образом разрабатываются и интерпретируются перекрёстные табуляции.
Табулированные результаты для коммерческих маркетинговых исследований редко представляются с использованием табуляции и процедуры перекрёстной табуляции. Становится всё более популярным использование баннеров. Баннер – это последовательный ряд перекрестных табуляций между критериями или зависимой переменной и несколькими (зачастую большим числом) факторными переменными, оформленный в виде единой таблицы. Зависимая переменная или какое-то подлежащее объяснению явление обычно определяет название строк таблицы. Она также имеет название стаб. Заранее предсказанные (предикторные) или факторные переменные определяют колонки таблицы, а каждое значение этих переменных называется баннерной точкой.
Баннерные таблицы обладают несколькими преимуществами:
Также у баннерных таблиц есть ряд недостатков:
Глава 3.
Проведение маркетингового исследования
на примере
3.1. Общая характеристика организации ЗАО «Русский хлеб».
Акционерное общество «Русский хлеб» было образовано в 1994 году. Уже в первые годы своей работы «Русский хлеб» освоил принципиально новые технологии хлебопечения, возрождая исконно русские традиции выпечки хлеба, и смог занять достойное место среди многочисленных больших и малых предприятий области.
Качество – вот ключевой элемент стратегии руководства предприятия. Не случайно слоган компании звучит как «Настоящий русский хлеб». Профессионализм сотрудников, высококачественное сырье, строгий контроль на всех уровнях производства, использование самого современного оборудования и технологий – все это направлено на то, чтобы изготавливать действительно настоящий русский хлеб.
Хлебопекарное и кондитерское производство работает круглосуточно. С самого раннего утра продукция с почетной маркой «Русский хлеб» – хлеб и батоны, булочные изделия, кондитерские изделия (печенье, кексы, бисквиты) – поступает в большинство продуктовых магазинов и гастрономов города и области.
В ассортименте более 100 видов хлебобулочных и кондитерских изделий. Как говорится, на любой вкус. Среди них есть и уникальные авторские разработки. Так, предприятие является единственным в области, которое производит продукцию под маркой «Здоровый хлеб» из проросшего зерна. Продукция этой торговой марки внесена в реестр о здоровой пищи, относящейся к категории здоровых продуктов питания, и одобрена Министерством здравоохранения РФ. Булочные мелкоштучные изделия, печенье, кексы, десерты, пряники – ассортимент выпускаемой кондитерской продукции широк.
Продукция предприятия реализуется через собственную фирменную торговую сеть, а также через крупнейшие в Калининграде и области сети магазинов и гастрономов («Вестер», «Виктория», «Седьмой Континент», «Копилка» и других) – всего более 600 заказчиков.
Предприятие
имеет высокотехнологическую