Архив рубрики ‘Качество данных’

Статистические нормы.

Суббота, 4 октября 2008 |

Несоблюдение статистических норм проявится в том, что окажутся вместе поселки с нефтяниками и безработными, данные будут искажены и, несмотря на солидный объем выборки, не будет основания считать её представительной.

Выше говорилось о представительности выборки, как об уровне близости её статистических мер к мерам статистического ансамбля.
В маркетинговых исследованиях упоминают репрезентативность. Смысл этого термина может быть связан с математической моделью, т.е. дифференцируемыми функциями и N → ∞.

Выбор алгоритма комплектования выборки для сложных объектов исследования, является задачей со многими неизвестными. Факторы, определяющие представительность планируемой выборки, неизвестны априорно, так что необходимы исходные данные, обычно специальный эксперимент, чтобы их ранжировать. Люди являются наиболее сложными объектами исследования. Выбор единиц совокупности должен быть особенно корректным, так что всяческие упрощения будут совсем некстати.

Единственным критерием оценки правил составления выборки является сходимость выборок, определяемая апостериорно по итогам статистического анализа нескольких эмпирических распределений. Термин “сходимость” маркетологами практически не используется. Речь идет о свойстве выборок сохранять свои статистические меры по мере уменьшения объема. Очевидно, алгоритм формирования выборки тем корректнее, чем меньше меняются статистические меры при сокращении объема.

При необходимости корректировки состава выборки применяют один из 3 способов:

– выборка с большим объемом;

– замена респондента на следующего по списку;

– повторная выборка.

Контур выборки.

Вторник, 30 сентября 2008 |

Контуром выборки является телефонный справочник. Не ответил абонент, надо звонить следующему по списку. Рассылка почтой планируется, исходя из “нормы” – 5% присылающих ответы, поэтому надо посылать в 20 раз больше анкет, чем требуется для обработки данных. Повторную выборку комплектуют, когда слишком много отказов отвечать.

Методика исследований корректируется по мере проявления факторов, определяющих достоверность оценок. Однако эта коррекция осуществляется без обратной связи. Рассмотренная задача напоминает выбор колера для окрашивания стен. У хороших красок (статистических ансамблей) цвет не зависит от объема, так что можно смешать в баночке пигменты и связующее (выборку) будучи в уверенности, что полученный при пробном окрашивании цвет точно повторится на стенах (представительность). В реальности нередки “сюрпризы”, неучтенные факторы могут быть доминирующими и цвета “уплывают”.

Тяжело учиться? - Закажи диплом о высшем экономическом образовании! И сразу в бой!

Обоснование объема выборки.

Вторник, 30 сентября 2008 |

Объем выборки вносит основной вклад в затраты времени и средств на маркетинговые исследования и поэтому является темой сложных дискуссий между заказчиками и исполнителями.

Стремление минимизировать объемы выборок сопровождается требованиями всемерно повышать их представительность. Особое внимание уделяется условиям сбора и обработки данных.

Однако встречаются ситуации, в которых объемы выборок явно избыточны. Причинами тому являются традиции или реклама.
Избыточность объема не всегда повышает представительность, многие По-грешности проявляются при любом объеме.

Маркетологи применяют несколько методик выбора объема выборки:

1. Правило 'большого пальца'. Принимается, к примеру, объем, составляющий 5% от совокупности, просто потому, что “5” ассоциируется с “отлично”.

2. Ссылки на публикации. Учитывается опыт аналогичных исследований, проведенных раньше. Регулярные исследования оптимизируют объем, например на уровне 3000 человек.

3. Расчет, исходя из выделенных на исследования ресурсов.

Расчетное обоснование объема базируется на достоверности оценок и рисков принятых решений в качестве исходных данных.

Предполагается взаимопонимание между заказчиками и исполнителями.
Вариация – понятие, применяемое маркетологами для оценок 'схожести' и 'несхожести' ответов в анкетах. В качестве меры для разноголосицы респондентов принято среднее квадратическое отклонение (СКО). Часто используются архаичные термины, типа 'кривых распределения', подразумевающие функции распределения плотностей вероятности, которые аксиоматически непрерывны. Сужение понятия в конкретной задаче нуждается в предварительном согласовании.

Доверительный интервал.

Вторник, 30 сентября 2008 |

Доверительный интервал – воспринимается всеми, как область, содержащая известную долю реализаций (единиц) внутри заданных границ. Маркетологи применяют всего два типа границ – на уровнях доверительных вероятностей 0,95 и 0,99. Им соответствует расчетное число Z – 1,96 и 2,56.

Для понимания полученных результатов предлагается вообразить 100 выборок, данные которых разместились в заданных интервалах и только 5 или 1 из них стали ' нарушителями'. В исследованиях есть всего одна выборка. “Экономия” на выборках вносит ошибку. Рассчитывается среднее квадратическое отклонение этой ошибки, зависящее в основном, от объема выборки.

'Сюрпризы' изучаемых совокупностей могут быть учтены исключительно по функциональным оценкам, по доверительным интервалам для эмпирических распределений. Однако для “плотных” оценок, при планировании исследований, приемлемы ориентировочные формулы – для представительных выборок из совокупностей с нормальным распределением.

Обоснование методики сбора данных

Вторник, 30 сентября 2008 |

Алгоритм сбора и обработки данных определяет степень представительности выборки и поэтому нуждается в согласовании, наряду с объемом.
Данные могут быть собраны исследователем или специально организованной группой. Могут быть привлечены коммерческие фирмы, принимающие заказы на сбор данных.

Если собирают данные сотрудники предприятия, например, маркетинговой службы, то их состав ограничен. Возможности предприятия не выходят за границы региона. С другой стороны, сведения о самом предприятии могут быть исчерпывающими.

Специальные группы комплектуются из лиц, неограниченных по составу, нА-пример, студентов. Группы могут быть эффективны для телефонного или персонального опроса.

Однако им часто не достает квалификации и, к сожалению, заинтересованности в объективной информации. Велик соблазн 'помочь' респондентам. Необходим контроль собираемых данных c диагностическими опросами, а также тренировоч-ные занятия.

У профессиональных фирм обычно есть опыт маркетинговых исследований, есть кадры с достаточным уровнем подготовки, возможности исследований без географических ограничений с относительно высокой скоростью.
Стоимость услуг таких компаний в три-пять раз превышает затраты на маркетинговую “самодеятельность”.

Методические погрешности при сборе данных

Вторник, 30 сентября 2008 |

Ошибки интервьюеров при сборе данных обычно называют 'не выборочными'. Подразумеваются ошибки систематические, которые, наряду со случайными, сопровождают все измерения, включая анкетирование. В состав этих ошибок входят:

1. Выбор единиц совокупности, которые не должны входить в выборку;

2. Отсутствие единиц совокупности, которые должны входить в выборку;

3. Наличие элементов, которые не относятся к изучаемой совокупности, но введены в учет при обработке данных;

4. Исключение из выборки тех, кто отказался отвечать или не ответил по телефону;

5. Оценки ложные, вместо респондента;

6. Ошибки при записи и обработке данных.

Ошибки классифицируют на преднамеренные и непреднамеренные, сделанные респондентами или интервьюерами, адресованные на этапы сбора данных, обработки или интерпретации.
Преднамеренные ошибки интервьюера могут быть обманом (сам заполнил Банкету) или давлением на респондента (мимика, подсказки, жесты).
Непреднамеренные ошибки вызваны, в основном, незнанием всех аспектов методики сбора данных, а также утомлением интервьюеров.
Ошибки респондентов обусловлены нежеланием отвечать на часть вопросов (о доходах, возрасте и т.п.) или недоверием к интервьюеру, а также занятостью, предубеждением к опросам.
Внимание к ответам может быть недостаточным из-за отсутствия мотивации, неясности вопросов или концентрации мыслей на других темах.

Контроль качества данных

Вторник, 30 сентября 2008 |

Контроль работы интервьюеров производится выборочно, путем надзора за их работой или проверки результатов работы. Проверяющий может незаметно подключаться к телефонной линии, либо присутствовать при опросах… Иногда ищут опрошенных респондентов и повторно их опрашивают.
Обучение интервьюеров проводятся на семинарах с разыгрыванием ролей и пробным заполнением анкет. Для респондентов применяют стимулирование, типа подарков или лотерей. Пробуждают интерес респондентов к вопросам, устраняют фрагменты анкет, негативно воспринимаемые. Во многих случаях вводят в анкету градацию 'отказываюсь отвечать'.

Поиск :

Rambler's Top100