Автор работы: Пользователь скрыл имя, 05 Ноября 2010 в 16:03, Не определен
В работе представлены теоретические и методологические аспекты предварительного анализа данных, а так же результаты исследования
Анализ данных. Статистические методы анализа данных применяются для их уплотнения, выявления взаимосвязей, зависимостей и структур.
Их классификация проводится по следующим критериям:
• количество одновременно анализируемых переменных — простые и многофакторные методы;
• цель анализа — описательные и индуктивные методы;
• уровень шкалирования переменных;
• деление переменных на зависимые и независимые методы анализа зависимостей и методы анализа взаимосвязей.
Описательные однофакторные методы — это:
• распределение частот (представление на графике или в таблице);
• графическое представление распределения переменной (например, с помощью гистограммы);
• статистические показатели — арифметическое среднее, медиана (величина признака, которая находится посередине вариационного ряда и делит ряд пополам), дисперсия (средний квадрат отклонений.) среднее квадратическое отклонение.
Индуктивные
однофакторные методы предназначены
для проверки соответствия характеристик
выборки характеристикам
Двух- и многофакторные методы анализа зависимостей помогают определить, какая связь имеется между снижением цены и сбытом продукта, имеется ли связь между национальностью человека и выбором фасона обуви и др.
Регрессионный анализ — статистический метод анализа данных при определении зависимости одной переменной от одной (простая регрессия) или нескольких (многофакторная регрессия) независимых переменных. Типичная постановка вопроса:
Вариационный анализ предназначен для проверки степени влияния изменения независимых переменных на зависимые. Типичная постановка вопроса:
Дискриминантный анализ позволяет разделить заранее заданные группы объектов с помощью комбинации независимых переменных и тем самым объяснить различия между группами. Метод также дает возможность отнести новый объект к определенной группе на основе его характеристик.
Факторный анализ предназначен для исследования взаимосвязей между переменными с целью сокращения числа факторов, оказывающих влияние, до наиболее существенных.
Кластерный
анализ позволяет разделить
Многомерное шкалирование дает возможность получить пространственное отображение отношений, существующих между объектами.
Традиционный (классический) анализ документов представляет собой неформализованный метод изучения сути материала, выделяя основные мысли и идеи, прослеживая логику связей.
Информативно-целевой анализ представляет собой метод изучения текстовых документов с целью выявления их информативности. Под информативностью понимается, во-первых, способность текста донести основной замысел автора, во-вторых, быть источником некоторых сведений.
Достоинством этого метода является возможность оценить способность автора реализовать коммуникативные намерения. Если в процессе анализа выявляется отсутствие общего замысла, центральной идеи, это будет означать, что автор не определил для себя цель коммуникации или не справился с задачей при создании текста. Недостатками метода можно считать трудоемкость анализа, хотя процесс его осуществления формализован (определен), и область применения ограничена только текстовыми материалами.
Контент-анализ представляет собой формализованный метод качественно-количественного изучения документов, основанный на выделении в содержании материалов определенных смысловых категорий.
Достоинством этого метода является возможность статистической обработки результатов анализа, так как в процессе его проведения определяются такие количественные, характеристики, как общий объем и частота внимания, уделяемые исследуемой категории анализа в каждом источнике. В качестве достоинства метода можно отметить также его высокую объективность, так как влияние личного мнения исследователя на результаты анализа минимальны из-за сильной формализации процедуры его проведения. Значительная формализация позволила использовать специальные компьютерные программы для проведения контент-анализа, поэтому трудоемкость его выполнения может быть очень низкой.
Контент-анализ имеет и ряд недостатков. Во-первых, должно быть задано однозначное правило формализации содержания анализируемых документов. Во-вторых, в процессе контент-анализа невозможно исчерпывающее раскрытие содержания документов; часть информации, не имеющая непосредственного отношения к исследуемой проблеме, может быть упущена в ходе анализа; не вся информация может быть формализована.
Возможность
применения того или иного вида анализа
зависит от уровня шкалирования независимых
и зависимой переменных. Выбор
определенного метода обусловлен не
только характером и направлением связей
между переменными, уровнем шкалирования,
а главным образом решаемой проблемой.
Глава 2 Предварительный анализ данных маркетинговых исследований.
2.1. Особенности редактирования данных.
Основная цель редактирования состоит в установлении некоторых стандартов минимального качества сырых данных. Редактирование включает в себя просмотр и, если необходимо, исправление каждой анкеты или формы регистрации наблюдений. Просмотр и внесение исправлений зачастую выполняются в две стадии:
Полевое редактирование - это предварительное редактирование, проводимое руководителем полевых исследований, которое строится таким образом, чтобы обнаружить наиболее бросающиеся в глаза пропуски и неточности средства сбора данных. Оно также полезно для контроля поведения персонала полевых сил и внесения ясности в любого рода недопонимания этими силами направлений их деятельности, методов, специфических вопросов и т.п.
В
идеальных обстоятельствах
Основные элементы, проверяемые в полевом редактировании:
Централизованное офисное редактирование - это точная всеобъемлющая проверка и коррекция заполненных форм сбора данных, включая принятие решения о том, что с этими данными делать.
За полевым редактированием следует централизованное офисное редактирование, которое заключается в более полной и точной проверке и коррекции собранных ответов. Для этой работы подходит личность, обладающая острым глазом и хорошо знакомая с целями и методами исследования. Чтобы обеспечить логическую последовательность обработки материалов, лучше всего предоставить все носители собранных данных одному человеку.
Если эту работу приходится делить по соображениям её объема и имеющегося времени, подразделы должны определяться по частям анкеты, а не по респондентам. То есть один редактор должен редактировать часть «А» всех анкет, а другой – часть «В».
В отличие от полевого, централизованное офисное редактирование в меньшей степени зависит от последующих процедур, и в большей – от степени полноты данных. Редактор должен решить, каким образом будут обрабатываться носители собранных данных, содержащие неполные ответы, явно неправильные ответы и ответы, которые отражают утрату интереса. Поскольку подобные проблемы более свойственны опросным анкетам, чем формам наблюдений, дальше речь пойдёт именно об анкетах.
Исследования, в которых все вернувшиеся анкеты заполнены целиком, редки. В некоторых окажутся пропущенными целые разделы. Другие будут отражать оставленными без ответа отдельные позиции. Решения редактора о том, каким образом обрабатывать эти неполные анкеты, зависит от серьёзности пропусков. Анкеты, в которых пропущены целые разделы, явно подозрительны. И всё же они не должны отбрасываться автоматически. Если нет никаких позитивных соображений относительно большого количества вопросов, оставшихся без ответов, весь подобный материал будет, вероятно, отброшен что увеличивает долю оставшихся без ответов анкет по исследованию в целом. Анкеты, содержащие только изолированные безответные позиции, должны оставляться, хотя после кодирования они могут быть подвергнуты определённой чистке данных.
Тщательное редактирование анкеты иногда показывает, что ответ на какой-то вопрос наверняка неправилен. Однако редакторы должны быть настороже, если стремятся не пропустить заполненные анкеты, которые неудачны с точки зрения пробуждения интереса респондента. Проницательный редактор может ухитрится разглядеть даже самые трудные указания на отсутствие интереса, такие как отметки, выходящие за пределы предусмотренных для них рамок, помарки, словоизлияния на анкете и т.п. Редактор может не захотеть отбросить такие ответы, но кодировать их необходимо таким образом, чтобы в последующем можно было провести отдельные табуляции для сомнительных носителей собранных данных и явно добротных анкет. Затем эти две группы можно сравнить, чтобы посмотреть, насколько значимо отсутствие интереса сказалось на результатах.
2.2. Особенности кодирования.
Кодирование - это технический прием, с помощью которого данные распределяются по категориям; он связан со спецификацией альтернативных категорий или классов, в которые должны помещаться ответы, а самим классам должны назначаться кодовые номера. Посредством кодирования сырые данные превращаются в символы – обычно цифровые, которые можно табулировать и подсчитывать. Однако это преобразование не должно осуществляться автоматически; оно требует здравого суждения кодировщика.
Первый этап кодирования заключается в специфицировании категорий и классов, к которым будут относится ответы. Не существует какого-то магического числа категорий. Скорее, это число категорий будет зависеть от исследуемой проблемы и специальных позиций анкеты, используемых для генерирования информации. Выбор ответов должен быть взаимоисключающим и исчерпывающим, чтобы каждый ответ логически попадал в одну, и только одну, категорию. По ряду вопросов правомерны и множественные ответы.
Кодирование закрытых вопросов и большинства средств балльной оценки не представляет трудностей, потому что оно устанавливается при конструировании носителя собираемых данных. Затем респонденты кодируют себя своими ответами, или их кодирует тот, кто берёт интервью, регистрируя ответы в предусмотренной для этого контрольной ведомости.
Кодирование открытых вопросов может оказаться весьма затруднительным и зачастую много более дорогим, чем кодирование закрытых вопросов. Кодировщику приходится определять подходящие категории на базе ответов, которые не всегда предсказуемы. Международные исследования могут создавать особые проблемы кодирования, поскольку разные понятия могут означать разные вещи.
Если анкет так много, что необходимо использовать несколько кодировщиков, дополнительной проблемой может стать возникновение несоответствия в самом кодировании. Чтобы удостоверится в логической последовательности обработки данных, эту работу необходимо разделять по задачам, а не в равных долях делить анкеты между кодировщиками. Позволяя кодировщикам сосредотачивать энергию на одном или нескольких вопросах, исследователи могут добиться уверенности в том, что для каждого вопроса будет применяться состоятельный набор стандартов. Такой подход более эффективен ещё и по той причине, что кодировщики могут легко запомнить всего несколько кодов, и поэтому им не придётся сверяться с книгой кодов, приступая к очередному носителю собранных данных. По существу, когда несколько лиц кодируют один и тот же вопрос в различных пачках анкет, важно, чтобы они же кодировали выборку работы других, что даст гарантию использования согласованного набора критериев кодирования.