О сайте | Правила | Форум | Тексты | Полезные ссылки | Местные люди | ЧаВо | "Табакерка" | Вакансии и объявления
Авторизация
e-mail
пароль
автологин
забыли пароль?
регистрация
Опрос

   результаты опросов

Поиск

расширенный поиск
Последние 20 реплик:
Re: Re: Re: Re: Сontinuous tracking study, DAR
Помогите,пожалуйста,СРОЧНО НАДО!!!, nasss
Re: Re: Re: Сontinuous tracking study, coffee
Re: Re: Сontinuous tracking study, DAR
Рекрутирование респондентов для фокус-групп и глубинных интервью, Advertising agency
Re: Сontinuous tracking study, coffee
Сontinuous tracking study, DAR
Re: Мягкие квоты, Andrey_Matveev
Re: Re: Re: Re: Re: Очередной вопрос по spss, psychologist
Re: Re: Re: Re: Очередной вопрос по spss, psychologist
Re: Re: Re: Re: Re: Re: Re: Re: Очередной вопрос по spss, Lyceer
Re: Re: Re: Re: Re: Re: Re: Очередной вопрос по spss, Lexa
Re: Re: Re: Re: Re: Re: Очередной вопрос по spss, psychologist
Re: Re: Re: Re: Re: Очередной вопрос по spss, KO
Мягкие квоты, VaSa
Re: Re: Re: Re: Очередной вопрос по spss, psychologist
Проблема установления целевых показателей медиаплана, pkaref
Re: Re: Re: Очередной вопрос по spss, KO
Re: Re: Очередной вопрос по spss, psychologist
Re: 20-я версия, psychologist
Форум


Отсутствие репрезентативности выборки - Zapata (2012/02/07 15:29)
Здравствуйте, уважаемые участники форума. Подскажите, пожалуйста, насколько обоснованно с точки зрения статистики использовать веса случаев, когда реально собранные анкеты не соответствуют первоначально предполагаемым квотам? Лучше ли взвешивать случаи или уменьшить выборку таким образом, чтобы она начала соответствовать квотам?

Re: Отсутствие репрезентативности выборки - Helga (2012/02/08 22:12)
Добрый день!

Какой вариант будет более оптимальным - присвоение весов либо уменьшение выборки до соответствия ее реальным квотам - зависит от ситуации.

В случае с весами нужно смотреть какие квоты - связанные или простые, и на какие вопросы квоты стоят. Допустим, если на пол и возраст - это одна ситуация, а вот если квота на вопрос, предполагающий множественный выбор, то перевзвешивание довольно проблематично.


В случае с уменьшением выборки, нужно смотреть каков объем изначальной выборки, какая методика исследования, по каким срезам предполагается проводить дальнейший анализ данных, и естественно помнить об ошибке выборки - чем меньше объем, тем выше погрешность результатов.

А вообще, на сколько критичен перекос квот? В случае 5-10% вроде терпимо, опять таки зависит от постановки задач и условий проведения исследования.

взвешивать лучше, если сможете. - Kostya_Aizenberg (2012/02/09 12:31)
немного чуть-чуть странный вопрос

весы делают то же самое, что и обрезание выборки,
но при этом база для расчетов, в отличие от обрезания, не сокращается

Re: взвешивать лучше, если сможете. - Zapata (2012/02/10 12:11)
Спасибо большое за ответы. Согласен - вопрос "чуть-чуть странный" На него нужен был такой простой ответ как вы дали :)

Re: взвешивать лучше, если сможете. - Zapata (2012/02/10 16:01)
Еще один вопрос, если можно - а что происходит с ошибкой выборки при взешивании случаев?

Re: Re: взвешивать лучше, если сможете. - Kostya_Aizenberg (2012/02/12 16:13)
она остается той же, что была до взвешивания,
но SPPS (версия 15 точно) будет думать, что выборка изменилась,
поэтому погрешности и значимости различий надо считать на невзвешенной базе

может, в новых версиях SPSS научилась считать ошибку по исходной базе

см. подробнейший текст Stas,
только имейте в виду, что репликация, по сути - то же взвешивание

Re: Отсутствие репрезентативности выборки - ulloi (2012/02/09 20:26)
а по какому принципу будут выкидываться "лишние" анкеты при обрезании выборки? так что взвешивание разумнее, имхо.

Re: Отсутствие репрезентативности выборки - Stas' (2012/02/11 13:46)
1. Есть еще упущенный Вами способ ремонта выборки - репликация. Т.е. увеличение численности тех анкет, которых "не хватает".
2. Результат всех трех способов будет примерно одинаков только для долей признаков. Любые более "тонкие" параметры, даже среднее арифметическое, не говоря уже о корреляциях, могут (но, конечно, не обязательно будут) существенно различаться от способа к способу.
3. Каковы преимущества и недостатки разных способов?
Взвешивание вычислительно более сложная процедура, не имея опыта, в ней легче запутаться. В дальнейшем, если Вам нужно будет посчитать корреляцию, а не только доли, могут возникнуть проблемы. Довольно сложно оценивается доверительный интервал взвешенной выборки. Взвешивание требует и большего объема информации. Например, если Вы хотите производить взвешивание сразу по нескольким параметрам, то необходимо знать их совместное распределение. К преимуществам можно отнести сохранение информации, которая частично может быть потеряна при исключении кейсов, сохранение объема выборки таким, какой он реально был получен, более высокую гибкость в "тонкой настройке" параметров (при условии наличия соответствующей информации).
Преимущества исключения состоят в том, что оно дает Вам выборку, с которой можно работать как с обычной выборкой, только немного меньшего объема. Существенных вычислительных сложностей нет, дополнительная информация тоже не особо нужна, т.к. совместное распределение признаков можно обоснованно предположить воспроизводящимся в выборке. Минус - некоторая потеря информации, которая могла содержаться в выброшенных анкетах.
Преимущества репликации - тоже относительно простые вычисления, нет потери информации. К недостаткам нужно отнести то, что оценка доверительного интервала должна производиться не так, как для обычной выборки (т.к. объем у нас "дутый"), лучше всего его осуществлять так, как если бы выборка была урезана.
При прочих равных условиях, я бы пользовалась сокращением выборки, если оно ведет к уменьшению объема не более, чем на 20%, репликацией в противном случае и присвоением весов при наличии каких-то специальных соображений.
4. Если Вы выберете сокращение или репликацию, возникает, конечно, вопрос, о том, как отбирать сокращаемые и реплицируемые анкеты. Это можно делать, как минимум, двумя путями. Наиболее корректный - случайным образом из тех страт, которые необходимо скорректировать. Наиболее эффективный в некоторых случаях - производить отбор так, чтобы оптимизировать некоторый параметр выборки. Например, Вы знаете среднюю зарплату в ГС, а корректируете пол и возраст. Можно корректировать их так, чтобы средняя зарплата оказывалась как можно ближе к генеральному значению.
5. Возникает вопрос оценки доверительного интервала. Если подходить незамысловато, то во всех трех случаях логично будет брать доверительный интервал так, как будто у Вас обрезанная по объему выборка. При репликации и взвешивании можно хитрить и кое-что выиграть, но выигрыш это будет формальный. Оценивать доверительный интервал, конечно, имеет смысл в том случае, когда у Вас первоначальная выборка была с элементами случайности. Если же это была, например, квотная выборка (т.е. интервьюер искал людей, подходящих под квоты), то возможные смещения делают расчет доверительного интервала (ошибки выборки) довольно бессмысленными.
6. Ну и последняя рекомендация - не ограничиваться советами с форума, а изучить вопрос по имеющейся литературе. Начать можно с двух статей Крыштановского, перепечатанных в приложении к его книге "Анализ социологических данных".

Re: Re: Отсутствие репрезентативности выборки - Zapata (2012/02/13 12:41)
Огромное спасибо, за обстоятельный ответ! Обязательно, буду разбираться.

Re: Отсутствие репрезентативности выборки - Yegor (2012/02/13 11:03)
перевзвесить так, чтобы выборка уменьшилась до соответствия квотам



Форум
  Сopyright (©) Администрация сайта Forum.GfK.ru, 2001—2007
О сайте
Находится в каталоге Апорт Rambler's Top100