- →
- →
Калькулятор ошибки выборки
Рассчитать статистическую ошибку и размер выборки
Введены некорректные данные
Доля признака
Ожидаемая доля признака, для которого рассчитывается ошибка. В случае, если данные о доле признака отсутствуют, необходимо использовать значение равное 50, при котором достигается максимальная ошибка.
Объем выборки
Количество людей, которых опросили для оценки доли.
Уровень значимости
Вероятность того, что реальная доля признака лежит в границах полученного доверительного интервала. Уровень значимости выбирает сам исследователь, исходя из требований к надежности результатов исследования. В маркетинговых исследованиях обычно 95%.
125315, г. Москва, Ленинградский проспект 68, стр. 2, 3 этаж
+7 (495) 648 78 20
client@tiburon-research.ru
Генеральная совокупность
Суммарная численность объектов наблюдения (люди, домохозяйства, предприятия, населенные пункты и т.д.), обладающих определенным набором признаков (пол, возраст, доход, численность, оборот и т.д.), ограниченная в пространстве и времени. Примеры генеральных совокупностей:- Все жители Москвы (10,6 млн. человек по данным переписи 2002 года)- Мужчины-Москвичи (4,9 млн. человек по данным переписи 2002 года)- Юридические лица России (2,2 млн. на начало 2005 года)- Розничные торговые точки, осуществляющие продажу продуктов питания (20 тысяч на начало 2008 года) и т.д.
Выборка (Выборочная совокупность)
Часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение обо всей генеральной совокупности. Для того чтобы заключение, полученное путем изучения выборки, можно было распространить на всю генеральную совокупность, выборка должна обладать свойством репрезентативности.
Репрезентативность выборки
Свойство выборки корректно отражать генеральную совокупность. Одна и та же выборка может быть репрезентативной и нерепрезентативной для разных генеральных совокупностей.Пример:- Выборка, целиком состоящая из москвичей, владеющих автомобилем, не репрезентирует все население Москвы. — Выборка из российских предприятий численностью до 100 человек не репрезентирует все предприятия России.- Выборка из москвичей, совершающих покупки на рынке, не репрезентирует покупательское поведение всех москвичей.В то же время, указанные выборки (при соблюдении прочих условий) могут отлично репрезентировать москвичей-автовладельцев, небольшие и средние российские предприятия и покупателей, совершающих покупки на рынках соответственно.Важно понимать, что репрезентативность выборки и ошибка выборки – разные явления. Репрезентативность, в отличие от ошибки никак не зависит от размера выборки.Пример:Как бы мы не увеличивали количество опрошенных москвичей-автовладельцев, мы не сможем репрезентировать этой выборкой всех москвичей.
Ошибка выборки (доверительный интервал)
Отклонение результатов, полученных с помощью выборочного наблюдения от истинных данных генеральной совокупности.Ошибка выборки бывает двух видов – статистическая и систематическая. Статистическая ошибка зависит от размера выборки. Чем больше размер выборки, тем она ниже.Пример:Для простой случайной выборки размером 400 единиц максимальная статистическая ошибка (с 95% доверительной вероятностью) составляет 5%, для выборки в 600 единиц – 4%, для выборки в 1100 единиц – 3% Обычно, когда говорят об ошибке выборки, подразумевают именно статистическую ошибку.Систематическая ошибка зависит от различных факторов, оказывающих постоянное воздействие на исследование и смещающих результаты исследования в определенную сторону.Пример:- Использование любых вероятностных выборок занижает долю людей с высоким доходом, ведущих активный образ жизни. Происходит это в силу того, что таких людей гораздо сложней застать в каком-либо определенном месте (например, дома).- Проблема респондентов, отказывающихся отвечать на вопросы анкеты (доля «отказников» в Москве, для разных опросов, колеблется от 50% до 80%)В некоторых случаях, когда известны истинные распределения, систематическую ошибку можно нивелировать введением квот или перевзвешиванием данных, но в большинстве реальных исследований даже оценить ее бывает достаточно проблематично.
Типы выборок
Выборки делятся на два типа:
— вероятностные
— невероятностные
1. Вероятностные выборки
1.1 Случайная выборка (простой случайный отбор)
Такая выборка предполагает однородность генеральной совокупности, одинаковую вероятность доступности всех элементов, наличие полного списка всех элементов. При отборе элементов, как правило, используется таблица случайных чисел.
1.2 Механическая (систематическая) выборка
Разновидность случайной выборки, упорядоченная по какому-либо признаку (алфавитный порядок, номер телефона, дата рождения и т.д.). Первый элемент отбирается случайно, затем, с шагом ‘n’ отбирается каждый ‘k’-ый элемент. Размер генеральной совокупности, при этом – N=n*k
1.3 Стратифицированная (районированная)
Применяется в случае неоднородности генеральной совокупности. Генеральная совокупность разбивается на группы (страты). В каждой страте отбор осуществляется случайным или механическим образом.
1.4 Серийная (гнездовая или кластерная) выборка
При серийной выборке единицами отбора выступают не сами объекты, а группы (кластеры или гнёзда). Группы отбираются случайным образом. Объекты внутри групп обследуются сплошняком.
2.Невероятностные выборки
Отбор в такой выборке осуществляется не по принципам случайности, а по субъективным критериям – доступности, типичности, равного представительства и т.д..
2.1. Квотная выборка
Изначально выделяется некоторое количество групп объектов (например, мужчины в возрасте 20-30 лет, 31-45 лет и 46-60 лет; лица с доходом до 30 тысяч рублей, с доходом от 30 до 60 тысяч рублей и с доходом свыше 60 тысяч рублей) Для каждой группы задается количество объектов, которые должны быть обследованы. Количество объектов, которые должны попасть в каждую из групп, задается, чаще всего, либо пропорционально заранее известной доле группы в генеральной совокупности, либо одинаковым для каждой группы. Внутри групп объекты отбираются произвольно. Квотные выборки используются в маркетинговых исследованиях достаточно часто.
2.2. Метод снежного кома
Выборка строится следующим образом. У каждого респондента, начиная с первого, просятся контакты его друзей, коллег, знакомых, которые подходили бы под условия отбора и могли бы принять участие в исследовании. Таким образом, за исключением первого шага, выборка формируется с участием самих объектов исследования. Метод часто применяется, когда необходимо найти и опросить труднодоступные группы респондентов (например, респондентов, имеющих высокий доход, респондентов, принадлежащих к одной профессиональной группе, респондентов, имеющих какие-либо схожие хобби/увлечения и т.д.)
2.3 Стихийная выборка
Опрашиваются наиболее доступные респонденты. Типичные примеры стихийных выборок – опросы в газетах/журналах, анкеты, отданные респондентам на самозаполнение, большинство интернет-опросов. Размер и состав стихийных выборок заранее не известен, и определяется только одним параметром – активностью респондентов.
2.4 Выборка типичных случаев
Отбираются единицы генеральной совокупности, обладающие средним (типичным) значением признака. При этом возникает проблема выбора признака и определения его типичного значения.
Выборочная совокупность (выборка)
При проведении исследования в подавляющем большинстве случаев не представляется возможным опросить
генеральную совокупность, т.е. общую численность объектов наблюдения (например, всех жителей
столицы). Чтобы решить данную проблему и иметь возможность дать заключение обо всей генеральной
совокупности, используется отбор выборочной совокупности.
Выборочная совокупность – часть объектов генеральной совокупности, характеристики которой корректно
отражают характеристики генеральной совокупности (репрезентируют ее).
Приведем пример:
Выборка, состоящая из студентов московских вузов, не репрезентирует всю московскую молодежь (т.к.
как минимум не включает неучащуюся молодежь) и тем более не репрезентирует население Москвы.
Как бы мы ни увеличивали число опрошенных студентов московских вузов, данная выборка не будет
отражать характеристики населения города Москвы. В этом случае понимание того, что «мы опросили
МНОГО», не имеет никакой ценности. Важно знать, КАК отобрать корректную выборку.
Типы выборок
В зависимости от целей исследования используются различные типы выборок:
- вероятностные
- невероятностные
1. Использование вероятностной выборки предполагает, что все члены генеральной совокупности имеют
равные шансы попасть в выборку.
1.1. Простая случайная выборка
Основной вид вероятностной выборки. Респонденты выбираются СЛУЧАЙНЫМ ОБРАЗОМ из ПОЛНОГО списка
единиц генеральной совокупности. На практике сформировать данный список достаточно трудно. Например,
список всех мобильных телефонов не включает жителей, которые его не имеют, и т.д. Случайный отбор
осуществляет компьютер (генератор случайных чисел), или используется таблица случайных чисел.
Только для данного типа выборки возможно использование:
1.1.1. Калькулятор размера выборки
Доверительная вероятность
«Точность» – вероятность того, что случайный ответ попадет в доверительный интервал.
90%
95%
99%
Наиболее
распространенный
Ошибка выборки или доверительный интервал
«Погрешность» – отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности
5%
Наиболее
распространенный
Размер генеральной совокупности
человек
1.1.2. Калькулятор ошибки выборки
1.2. Случайная систематическая выборка
Генеральная совокупность упорядочивается (например, по алфавитному порядку, по номеру телефона и
т.д.), случайным образом выбирается первый элемент выборки, каждый последующий выбирается с равным
шагом (например, каждый 5-й, 20-й, 100-й респондент).
1.3. Стратифицированная случайная выборка
Генеральная совокупность разделяется на группы (страты). Внутри каждой страты совершается простой
случайный или систематический отбор. При этом выборка должна отражать структуру генеральной
совокупности, т.е. в выборке должны быть сохранены пропорции.
1.4. Кластерная выборка
Используется тогда, когда единицами отбора выступают кластеры (группы). Например, при исследовании
сотрудников медицинских учреждений целесообразно отобрать сначала сами учреждения. Внутри кластера
производится сплошной опрос (опрашиваются все его представители).
2. Использование невероятностных выборок обусловлено невозможностью случайного отбора. Отбор
происходит по субъективным критериям – доступности, типичности и т.д.
2.1. Квотная выборка
Генеральная структура в данном случае воспроизводится за счет квот (пропорций), которые обычно
отражают социально-демографические критерии. Например, заранее известно только число женщин и мужчин
в генеральной совокупности. В этом случае в той же пропорции они отбираются и для выборочной
совокупности. Внутри групп единицы отбора выбираются произвольно.
2.2. Метод «снежного» кома
Используется в том случае, если опросу принадлежат «труднодоступные» респонденты (например, люди с
очень высоким доходом). У всех респондентов (начиная с первого) спрашивают контакты их знакомых,
родственников, друзей, которые подходят для опроса.
2.3. Стихийная выборка
Выборка так называемого «первого встречного». Ее размер и состав достоверно не известен, он
определяется лишь активностью самих респондентов. Используется, например, в телеопросах.
2.4. Выборка типичных случаев
Выбирается типичный признак, на основании которого отбираются и другие участники исследования. Выбор
признака и его типичное значение производятся исследователем самостоятельно.
Новости отдела
АСИ агентство | АСИ СПб | Агентство Социальной Информации | АСИ агентство стратегических инициатив | АСИ Санкт-Петербург | сайт Агентства Социальной Информации | Агентство Социальной Информации официальный сайт | Агентство Стратегических Инициатив АСИ сайт | asinfo | АСИ агентство стратегических инициатив официальный сайт | АСИ агентство социальной информации | АСИ Санкт-Петербург официальный сайт | Агентство Социальной Информации Санкт-Петербург
Персональные данные посетителей данного сайта обрабатываются в целях его функционирования в соответствии с ФЗ №152 «О персональных данных».
В случае несогласия с этим посетитель должен незамедлительно покинуть сайт. В противном случае это является согласием на обработку его персональных данных.
Калькулятор ошибки выборки
Уровень значимости
Доля признака | % |
Объём выборки | чел. |
Ошибка выборки | ± % |
Калькулятор значимых различий (z-тест)
Уровень значимости
Доля | % | % |
База | чел. | чел. |
Различия значимы
Различия незначимы
Калькулятор значимых различий NPS
Уровень значимости
Промоутеры (Доля) |
% | % |
Критики (Доля) |
% | % |
База | чел. | чел. |
Различия значимы
Различия незначимы
Сумма промотеров и критиков не может быть более 100%