Маркетинг и менеджмент в России и за рубежом
Скачать 4.67 Mb.
|
4.12.2. Ошибки сбора данных При сборе данных могут иметь место многие погрешности — Другие, нежели ошибки выборки, называемые поэтому невыборочными ошибками. Эти ошибки включают выбор неверных элементов выборки для взятия интервью, неучет мнения тех, кто отказался давать интервью или не оказался дома, ложные оценки, даваемые интервьюируемыми преднамеренно. Возможна фальсификация полученных данных со стороны интервьюера. Ошибки могут совершать и добросовестные интервьюеры при переписывании собранной информации из анкет. В отличие от ошибок выборки невыборочные ошибки не могут быть измерены. Поэтому важным является заранее выяснить возможные причины невыборочных ошибок и предпринять соответствующие меры по их предотвращению. Одним из критериев выбора определенного подхода к сбору данных является величина невыборочной ошибки. Невыборочная ошибка включает в свой состав: 1) все типы ошибок, обусловленные тем, что не все респонденты дали ответы; 2) ошибки сбора данных; 3) ошибки обращения с полученными данными; 4) ошибки анализа собранных данных; 5) ошибки интерпретации полученных результатов. Кроме того, существуют ошибки, обусловленные нечетким выявлением проблем, использованием неоднозначных терминов и т.п. Невыборочные ошибки можно классифицировать на ошибки: лиц, осуществляющих сбор данных, и респондентов. Кроме того, невыборочные ошибки подразделяются на преднамеренные 171 и на непреднамеренные. Преднамеренные ошибки лица, собирающего информацию, имеют место, когда оно сознательно нарушает установленные исследователем требования к сбору данных. Такое нарушение может носить характер обмана (например, сам заполнил анкеты) и стремления склонить респондента к определенному ответу путем использования особых слов, интонации, мимики, жестов, подсказки определенных ответов и т.п. Непреднамеренная ошибка лица, собирающего информацию, главным образом определяется неправильным пониманием со стороны интервьюера отдельных аспектов сбора данных, изложенных в различных инструкциях, хотя ему и кажется, что он все делает правильно. Часто такая ошибка обусловлена существенным разрывом в уровне образования у исследователя и у интервьюера. Кроме того, причиной непреднамеренной ошибки может быть усталость лица, собирающего информацию, особенно когда в течение рабочего дня было опрошено достаточно большое число респондентов. По этой причине может быть ослаблен контроль заполнения анкет; приглашение принять участие в опросе произносится усталым, раздражительным голосом, в результате чего потенциальный респондент откажется принять участие в опросе, и т.п. Существуют два вида преднамеренных ошибок респондентов. Первый вид обусловлен стремлением респондента фальсифицировать свои ответы вследствие определенного замешательства, нежелания отвечать на персональные вопросы (об уровне дохода, о национальности, возрасте, семейном положении и т.п.), из-за подозрения, что интервьюер преследует какие-то свои цели. Второй вид обусловлен отказом респондента отвечать на вопросы из-за своей занятости, нежелания открывать личные аспекты своей жизни, предубежденности к опросам. Непреднамеренная ошибка респондента возникает в случае, когда респондент, думая, что говорит правду, на самом деле дает ошибочный ответ. Это обусловлено плохим пониманием вопросов и/или инструкции по заполнению анкет, использованием предположений вместо точных знаний (вследствие плохого знания предмета исследования, недостаточно хорошей памяти и т.п.). Далее следует выделить недостаток внимания при ответах на вопросы из-за отсутствия мотивации, отвлечения от ответов на вопросы (телефонный звонок, крик ребенка и т.п.), усталости рес- пондента, желания скорее ответить на вопросы. 4.12.3. Контроль качества собираемых данных Контроль за преднамеренными ошибками интервьюеров осуществляется двумя способами: путем надзора за их работой и путем проверки выполненной работы. Надзор осуществляется, например, путем незаметного подключения к телефонной линии, по которой берется интервью. При устном интервьюировании интервьюера может сопровождать проверяющее лицо. Цель проверки проведенного опроса заключается в выявлении случаев обмана и фальсификации со стороны интервьюеров. Для этого можно установить повторный контакт с рядом ранее опрошенных респондентов и узнать, принимали ли они участие в опросе, и проверить выборочно их ответы на вопросы. Кроме того, опытный проверяющий, просматривая заполненные ответы, может обнаружить какие- то несоответствия. Например, очень молодой человек оказался отцом многодетной семьи. Уменьшение непреднамеренной ошибки интервьюеров осуществляется путем проведения ориентационных сессий и путем разыгрывания ролей. В первом случае производится ознакомление интервьюеров с целями обследования, с вопросником, с инструкцией по его заполнению. Разыгрывание ролей предполагает пробное заполнение анкет, когда одни из участников сессии исполняют роли интервьюеров, а другие — респондентов. Контроль за преднамеренными ошибками респондентов направлен на снижение числа случаев лжи и отказа участвовать в обследовании. Для этого прежде всего необходимо сохранять анонимность и конфиденциальность (данные личного характера, останутся известными только респонденту). Далее, используются различные меры стимулирования участия респондентов в обследовании (денежная оплата, подарки, сувениры). Проверка достоверности ответов заключается в поиске ложных ответов путем их просмотра. Например, может быть обнаружено, 172 что выглядящий немолодым респондент называет молодой возраст, потрепанно одетый — укажет высокий заработок. В ряде случаев для преодоления нежелания правдиво отвечать на вопросы последние задаются от третьего лица. Например, мужчине средних лет может быть задан вопрос: «Как вы думаете, будет ли использовать человек вроде вас данное средство от облысения?» Контроль за непреднамеренными ошибками респондентов осуществляется в различных формах. Необходимо тщательно составлять вопросники и инструкции к ним, использовать разнонаправленные шкалы измерений. Для уменьшения числа ответов-предположений в шкалы вводятся такие градации, как «не имею мнения», «не могу вспомнить», «не уверен». Нецелесообразно в шкалах для всех вопросов с одной стороны располагать негативные оценки, а с другой — только положительные. Надо менять полярность вопросов, что повышает внимательность респондентов, заставляет их больше думать над ответами. Наконец, в во- просниках для поддержания внимания респондентов и доведения обследования до конца могут использоваться такие фразы, как «Опрос близится к концу», «Вы ответили на самые трудные вопросы». Можно выделить три типа ошибок, обусловленных нежеланием респондента отвечать на вопросы: из-за отказа вообще принять участие в обследовании, из-за прекращения участия и из-за отказа отвечать на определенные вопросы. Так, респондент может отказаться от участия в опросе из-за отсутствия интереса к данному обследованию или принципиальной отрицательной позиции по отношению к любому обследованию подобного рода, из-за своей занятости, ему может не понравится голос интервьюера, манера задавания вопросов и т.п. Причины прекращения ответов на вопросы также являются весьма различными. Возможно, что ответы потребовали больших затрат времени, чем ожидалось; некоторые вопросы носят чрезмерно личностный характер; пояснения к ответу на ряд вопросов оказались непонятными; ответы прервал телефонный звонок, возвращение из школы ребенка и т.п. Наконец, респондент просто может не ответить только на некоторые вопросы — чрезмерно личностного характера или вызывающие неприятие по тем или иным причинам. Поэтому в шкалу в ряде случаев специально вводят градацию «отказываюсь отвечать». Для уменьшения ошибки, обусловленной отказом отвечать на вопросы, необходимо прежде всего ее измерить. Если величина ошибки является существенной, то надо предпринять меры для ее уменьшения. Для этого используются два метода: взвешенных средних и формирования выборки больших размеров. Первый метод предполагает использование весов для точного представления отдельных подгрупп изучаемой совокупности. Таким путем учитывается разное число «отказников» для разных подгрупп. Взвешенная средняя рассчитывается по следующей формуле: где х — взвешенная средняя оценка для выборки; x a , x b ... — средние оценки для разных подгрупп выборки; W a , W b … — веса отдельных подгрупп, характеризующие долю каждой подгруппы в совокупности. Например, изучается мнение потребителей относительно крема для загара определенной марки. Демографические данные говорят о том, что целевой рынок включает 50% мужчин и 50% женщин. Однако на вопросы почтового опроса ответило 25% мужчин и 75% женщин. В этом случае возможно уточнение полученных данных путем введения весов, характеризующих пропорцию 50:50. На вопрос анкеты: «Сколько бы вы заплатили за флакон крема?» — мужчины в среднем ответили 2 доллара, а женщины — 3 доллара. В этом случае средняя оценка (пропорция 25:75) составит 2,75 доллара. Однако если использовать истинную пропорцию 50:50, то средняя цена составит 2,50 доллара. Второй метод заключается в сознательном формировании выборки больших размеров, чем требуется для анализа. Из этой выборки выбираются подгруппы, по размерам соответствующие представлениям о структуре целевой выборки. Скажем, в нашем примере относительно крема для загара вопросы были посланы 10 000 респондентам, из которых только 2000 дали ответы. При этом имела место некорректная пропорция 25:75. Возможно вместо использования весовых коэффициентов просто не принимать в 173 расчет 1000 ответов женщин, приведя таким образом пропорцию к истинному значению 50:50, т.е. учитывая ответы 500 мужчин и 500 женщин. Хотя, конечно, лучше использовать другие методы уменьшения числа «отказников», рассмотренные выше. Перед тем как табулировать и анализировать данные проведенного обследования, целесообразно провести их предварительную проверку и выявить ошибки респондентов. Для этого прежде всего следует проверить анкеты на полноту и точность их заполнения, выявить возможную ненадежность (разные подходы к ответам на подобные вопросы) и односторонность ответов (например, только «да», «нет», «нет мнения»). Осуществляется это на систематической и несистематической основе. В первом случае анкеты выбираются случайным образом, и осуществляется их проверка на основе выборочных процедур; во втором — анкеты для проверки отбираются произвольным образом. Если такие ошибки являются весьма существенными, то анкеты изымаются из дальнейшего анализа. Если возможно, то производится уточнение ответов. Жестких правил в данной области не существует, и они основаны на традициях, опыте и т.п., т.е. на неформальных подходах к определению, какие анкеты пригодны для последующего анализа, а какие — нет. Поэтому лучше ужесточить контроль сбора данных, уменьшив таким образом проблемы предварительной оценки собранных данных. 4.13. Анализ данных Анализ данных начинается с перевода «сырых» данных в осмысленную информацию и включает их введение в компьютер, проверку на предмет ошибок, кодирование, представление в матричной форме (табулирование). Все это называется преобразованием исходных данных. Далее проводится статистический анализ, т.е. определяются средние величины, частоты, корреляционные и регрессионные соотношения, осуществляется анализ трендов. 4.13.1. Преобразование данных После сбора данных необходимо их преобразовать, т.е. привести к более сжатому виду, удобному для анализа и обладающему достаточной для заказчика информацией. Обычно закодированные исходные данные представляются в виде матрицы (осуществляется табулирование), столбцы которой содержат ответы на различные вопросы анкеты, а ряды — респондентов или изучаемые ситуации. Преобразование данных заключается в описании данных матрицы на языке ограниченного числа мер, характеризующих собранные данные. Табулирование помогает исследователю понять, что означают собранные данные. Одновременный анализ двух и более категорий опрашиваемых называется перекрестной табуляцией. Исследователь, осуществляя преобразование, старается найти зависимости среди собранных данных и в то же время достигнуть наиболее высокого уровня обобщения. Выделяют, по крайней мере, следующие четыре функции преобразования данных: обобщение, определение концепции (концептуализация), перевод результатов статистического анализа на понятный для менеджера язык (коммуникация), определение степени соответствия полученных результатов всей совокупности (экстраполяция). Из-за неспособности человека анализировать большие массивы информации необходимо исходные собранные данные представить в удобном для осмысления виде, т.е. их необходимо обобщить, выразить через ограниченное число понятных параметров. Большинство статистических мер основано на конкретных предположениях, которые определяют базу анализа собранньк данных. Концептуализация направлена на оценку результатов обобщения. Например, слабый разброс оценок определенной марки продукта вырабатывает у исследователя одно суждение (концепцию), сильный — другое (см. ниже про корреляцию). Коммуникация предполагает при интерпретации полученных результатов использование понятных для заказчика категорий. Например, если для него понятна такая статистическая мера, как «мода», то она используется при представлении полученных результатов, если нет, то ре- зультаты описываются на общепринятом языке. Экстраполяция в данном случае предполагает определение, в какой степени данные 174 выборки можно обобщить на всю совокупность (см. ниже). 4.13.2. Виды статистического анализа Выделяют пять основных видов статистического анализа, используемых при проведении маркетинговых исследований: дескриптивный анализ, выводной анализ, анализ различий, анализ связей и предсказательный анализ. Иногда эти виды анализа используются по отдельности, иногда — совместно. В основе дескриптивного анализа лежит использование таких статистических мер, как средняя величина (средняя), мода, среднее квадратическое отклонение, размах или амплитуда вариации. Анализ, в основе которого лежит использование статистических процедур (например, проверка гипотез) с целью обобщения полученных результатов на всю совокупность, называется выводным анализом. Анализ различий используется для сравнения результатов исследования двух групп (двух рыночных сегментов) для определения степени реального отличия в их поведении, в реакции на одну и ту же рекламу и т.п. Анализ связей направлен на определение систематических связей (их направленности и силы) переменных. Например, определение, как увеличение затрат на рекламу влияет на увеличение сбыта. Предсказательный анализ используется в целях прогнозирования развития событий в будущем, например путем анализа временных рядов. Статистические методы прогнозирования рассмотрены в разделе 7. 4.13.2.1. Инструменты дескриптивного анализа Для описания информации, полученной на основе выборочных измерений, широко используется две группы мер. Первая включает меры «центральной тенденции», или меры, которые описывают типичного респондента или типичный ответ. Вторая включает меры вариации, или меры, описывающие степень схожести или несхожести респондентов или ответов с «типичными» респондентами или ответами. Существуют и другие описательные меры, например меры асимметрии (насколько найденные кривые распределения отличаются от нормальных кривых распределения). Однако они используются не столь часто, как вышеупомянутые, и не представляют особого интереса для заказчика. Ниже дается только краткая характеристика указанных мер. Более подробную информацию можно получить из книг по математической статистике, например [9], [10]. К числу мер центральной тенденции относятся мода, медиана и средняя. Мода характеризует величину признака, появляющуюся наиболее часто по сравнению с другими величинами данного признака. Мода носит относительный характер, и необязательно, чтобы большинство респондентов указало именно эту величину признака. Медиана характеризует значение признака, занимающее срединное место в упорядоченном ряду значений данного признака. Третьей мерой центральной тенденции является средняя величина, которая чаще всего рассчитывается как средняя арифметическая величина. При ее вычислении общий объем признака поровну распределяется между всеми единицами совокупности. Видно, что степень информативности средней величины больше, чем медианы, а медианы — моды. Однако рассмотренные меры не характеризуют вариацию ответов на какой-то вопрос или, говоря другими словами, несходство, различие респондентов или измеренных характеристик. Очевидно, что помимо знания величин мер центральной тенденции важно установить, насколько близко к этим величинам расположены остальные полученные оценки. Обычно используют три меры вариации: распределение частот, размах вариации и среднее квадратическое отклонение. Распределение частот представляет в табличной или графической форме число случаев 175 появления каждого значения измеренной характеристики (признака) в каждом выбранном диапазоне ее значений. Распределение частот позволяет быстро сделать выводы о степени подробности результатов измерений. Размах вариации определяет абсолютную разность между максимальным и минимальным значениями измеренного признака. Говоря другими словами, это разница между конечными точками в распределении упорядоченных величин измеренного признака. Данная мера определяет интервал распределения значений признака. Среднее квадратическое отклонение является обобщающей статистической характеристикой вариации значений признака. Если эта мера мала, то кривая распределения имеет узкую, сжатую форму (результаты измерений обладают высокой степенью схожести); если мера велика, то кривая распределения имеет широкий, растянутый вид (велика степень различия оценок). Ранее было отмечено, что выбор шкалы измерений, а следовательно, типа вопросов в опросном листе предопределяют количество получаемой информации. Подобным образом, количество информации, получаемой при использовании рассмотренных выше мер, является различным. Общим правилом является то, что статистические меры дают возможность получить больше информации при применении наиболее информативных шкал измерений. Выбор шкалы измерений предопределяет выбор статистических мер. Например, один из вопросов демографиче- ского исследования, при проведении которого использовалась шкала наименований, касался национальности. Русским был присвоен код 1, украинцам — 2, татарам — 3 и т.д. В данном случае, конечно, можно вычислить среднее значение. Но как интерпретировать среднюю нацио- нальность, равную, скажем, 5,67? Для вычисления средних надо использовать интервальную шкалу или шкалу отношений. Однако в нашем примере можно использовать моду. Что касается мер вариации, то при использовании номинальной шкалы применяется распределение частот, при использовании шкалы порядков — кумулятивное распределение частот, а при использовании интервальной шкалы и шкалы отношений — среднее квадратическое отклонение. |