![]() |
|
Отсутствие репрезентативности выборки - Zapata
(2012/02/07 15:29)
Здравствуйте, уважаемые участники форума. Подскажите, пожалуйста, насколько обоснованно с точки зрения статистики использовать веса случаев, когда реально собранные анкеты не соответствуют первоначально предполагаемым квотам? Лучше ли взвешивать случаи или уменьшить выборку таким образом, чтобы она начала соответствовать квотам?
Re: Отсутствие репрезентативности выборки - Helga
(2012/02/08 22:12)
Добрый день!Какой вариант будет более оптимальным - присвоение весов либо уменьшение выборки до соответствия ее реальным квотам - зависит от ситуации. В случае с весами нужно смотреть какие квоты - связанные или простые, и на какие вопросы квоты стоят. Допустим, если на пол и возраст - это одна ситуация, а вот если квота на вопрос, предполагающий множественный выбор, то перевзвешивание довольно проблематично. В случае с уменьшением выборки, нужно смотреть каков объем изначальной выборки, какая методика исследования, по каким срезам предполагается проводить дальнейший анализ данных, и естественно помнить об ошибке выборки - чем меньше объем, тем выше погрешность результатов. А вообще, на сколько критичен перекос квот? В случае 5-10% вроде терпимо, опять таки зависит от постановки задач и условий проведения исследования.
взвешивать лучше, если сможете. - Kostya_Aizenberg
(2012/02/09 12:31)
немного чуть-чуть странный вопросвесы делают то же самое, что и обрезание выборки, но при этом база для расчетов, в отличие от обрезания, не сокращается
Re: взвешивать лучше, если сможете. - Zapata
(2012/02/10 12:11)
Спасибо большое за ответы. Согласен - вопрос "чуть-чуть странный" На него нужен был такой простой ответ как вы дали :)
Re: взвешивать лучше, если сможете. - Zapata
(2012/02/10 16:01)
Еще один вопрос, если можно - а что происходит с ошибкой выборки при взешивании случаев?
Re: Re: взвешивать лучше, если сможете. - Kostya_Aizenberg
(2012/02/12 16:13)
она остается той же, что была до взвешивания,но SPPS (версия 15 точно) будет думать, что выборка изменилась, поэтому погрешности и значимости различий надо считать на невзвешенной базе может, в новых версиях SPSS научилась считать ошибку по исходной базе см. подробнейший текст Stas, только имейте в виду, что репликация, по сути - то же взвешивание
Re: Отсутствие репрезентативности выборки - ulloi
(2012/02/09 20:26)
а по какому принципу будут выкидываться "лишние" анкеты при обрезании выборки? так что взвешивание разумнее, имхо.
Re: Отсутствие репрезентативности выборки - Stas'
(2012/02/11 13:46)
1. Есть еще упущенный Вами способ ремонта выборки - репликация. Т.е. увеличение численности тех анкет, которых "не хватает".2. Результат всех трех способов будет примерно одинаков только для долей признаков. Любые более "тонкие" параметры, даже среднее арифметическое, не говоря уже о корреляциях, могут (но, конечно, не обязательно будут) существенно различаться от способа к способу. 3. Каковы преимущества и недостатки разных способов? Взвешивание вычислительно более сложная процедура, не имея опыта, в ней легче запутаться. В дальнейшем, если Вам нужно будет посчитать корреляцию, а не только доли, могут возникнуть проблемы. Довольно сложно оценивается доверительный интервал взвешенной выборки. Взвешивание требует и большего объема информации. Например, если Вы хотите производить взвешивание сразу по нескольким параметрам, то необходимо знать их совместное распределение. К преимуществам можно отнести сохранение информации, которая частично может быть потеряна при исключении кейсов, сохранение объема выборки таким, какой он реально был получен, более высокую гибкость в "тонкой настройке" параметров (при условии наличия соответствующей информации). Преимущества исключения состоят в том, что оно дает Вам выборку, с которой можно работать как с обычной выборкой, только немного меньшего объема. Существенных вычислительных сложностей нет, дополнительная информация тоже не особо нужна, т.к. совместное распределение признаков можно обоснованно предположить воспроизводящимся в выборке. Минус - некоторая потеря информации, которая могла содержаться в выброшенных анкетах. Преимущества репликации - тоже относительно простые вычисления, нет потери информации. К недостаткам нужно отнести то, что оценка доверительного интервала должна производиться не так, как для обычной выборки (т.к. объем у нас "дутый"), лучше всего его осуществлять так, как если бы выборка была урезана. При прочих равных условиях, я бы пользовалась сокращением выборки, если оно ведет к уменьшению объема не более, чем на 20%, репликацией в противном случае и присвоением весов при наличии каких-то специальных соображений. 4. Если Вы выберете сокращение или репликацию, возникает, конечно, вопрос, о том, как отбирать сокращаемые и реплицируемые анкеты. Это можно делать, как минимум, двумя путями. Наиболее корректный - случайным образом из тех страт, которые необходимо скорректировать. Наиболее эффективный в некоторых случаях - производить отбор так, чтобы оптимизировать некоторый параметр выборки. Например, Вы знаете среднюю зарплату в ГС, а корректируете пол и возраст. Можно корректировать их так, чтобы средняя зарплата оказывалась как можно ближе к генеральному значению. 5. Возникает вопрос оценки доверительного интервала. Если подходить незамысловато, то во всех трех случаях логично будет брать доверительный интервал так, как будто у Вас обрезанная по объему выборка. При репликации и взвешивании можно хитрить и кое-что выиграть, но выигрыш это будет формальный. Оценивать доверительный интервал, конечно, имеет смысл в том случае, когда у Вас первоначальная выборка была с элементами случайности. Если же это была, например, квотная выборка (т.е. интервьюер искал людей, подходящих под квоты), то возможные смещения делают расчет доверительного интервала (ошибки выборки) довольно бессмысленными. 6. Ну и последняя рекомендация - не ограничиваться советами с форума, а изучить вопрос по имеющейся литературе. Начать можно с двух статей Крыштановского, перепечатанных в приложении к его книге "Анализ социологических данных".
Re: Re: Отсутствие репрезентативности выборки - Zapata
(2012/02/13 12:41)
Огромное спасибо, за обстоятельный ответ! Обязательно, буду разбираться.
Re: Отсутствие репрезентативности выборки - Yegor
(2012/02/13 11:03)
перевзвесить так, чтобы выборка уменьшилась до соответствия квотам
|
|||||
О сайте |