Что представляет собой конкретная ошибка выборки

  1. Конкретная ошибка выборки, распределение конкретных ошибок выборки

  • Ошибка
    выборочного наблюдения – представляет
    собой разность между величиной параметра
    в генеральной совокупности и его
    величиной, вычисленной по результатам
    выборочного наблюдения.

  • Конкретная
    ошибка – это ошибка проведенной выборки.

  • Если
    из генеральной совокупности повторить
    выборку многократно, то каждый раз
    будем получать новую величину конкретной
    ошибки. Некоторые из этих новых величин
    конкретных ошибок будут совпадать друг
    с другом по величине и по знаку, т.е.
    имеет место распределение ошибок; часть
    из этих новых величин будет равно 0,т.е.
    наблюдается совпадение оценки и
    параметра генеральной совокупности.

  1. Средняя ошибка выборки для выборочной средней и выборочной доли

Средняя
ошибка

– это средняя квадратическая из всех
возможных конкретных ошибок оценки.

  • Средняя
    ошибка показывает насколько в среднем
    мы можем ошибиться, если на основе
    оценки сделаем выводы о параметре
    генеральной совокупности.

  • Расчет средней
    ошибки повторной простой случайной
    выборки производится следующим
    образом:

  • cредняя
    ошибка для средней

  • cредняя
    ошибка для доли

41
– 50 отсутствуют

50

Условие: Если значение ошибки (чаще
всего предельной) заранее задано.

Вопрос: Какова должна быть min
численность выборки, чтобы ошибка с
принятым доверительным уровнем
вероятности не выходила за заданные
границы.

Алгоритм решения данной задачи вытекает
из формулы расчета предельной ошибки

Из этого равенства вытекает

Необходимая численность выборки
определяется округленно в большую
сторону до целых единиц.

Возникает проблема с

(дисперсия),
так как выборка не проводилась, а величина
ее дисперсии уже известна. Поэтому, если
исследованная ген. Совокупность
подвергалась ранее выборочному
наблюдению, то можно воспользоваться
значением дисперсии по данным предыдущей
выборки, если выборочного наблюдения
не было, то можно провести экспресс
выборку.

Интервалы предельной ошибки задаются
в % от оценки (выборочной средней). Формула
для расчета min численности
выборки


,

-квадрат
выборочного коэф. вар-ии,

— квадрат ошибки в %

51

Условие: При установленных границах
ошибки имеет место ограничение в
численности выборки.

Вопрос: Какова гарантия (вероятность),
что при заданной численности выборки
ошибка не выйдет за установленные
границы.

Если вероятность окажется 0,90 и более –
эта выборка с высокой степенью надежности
гарантирует, что ошибка не превысит
установленную величину

Если вер-ть ниже 0,90, то следует либо
примириться с большей ошибкой, либо
найти возможность увеличения численности
выборки.

Коэф t связан с уровнем
вероятности. Исходя из

Получаем

Находим искомый уровень вероятности
по табл. «Значение интеграла нормального
распределения вероятностей» или
«Критические точки t
распределения Стьюдента»

52

При случайном отборе каждой единице
ген.совокупности присваивается метка
, которая не должна быть связана с
изучаемым признаком. Далее используются
различные приемы, обеспечивающие
случайность отбора (таблица случайных
чисел, лототрон), осуществляющие отбор
меток, как заменителей единиц.

Случайный отбор делится на: повторный
и бесповторный.

Повторный отбор – единицы ген.совокупности,
после фиксации значения признака,
возвращаются обратно в генеральную
совокупность. Поэтому численность
ген.совокупности остается постоянной,
и вероятность попадания каждой единицы
в выборку не изменяется. Из этого способа
формирования выборочной совокупности
исходя алгоритмы расчета средней и
предельной ошибок.

Бесповторный отбор – единицы, попавшие
в выборку в ген.совокупность не
возвращаются. Численность ген.совокупности
уменьшается, вероятность попадания
единиц в выборку возрастает

При этом отборе делается поправка на
конечность ген.совокупности для расчета
средней и предельной ошибок

При больших значениях N,
единицей в знаменателе можно пренебречь

Следовательно, алгоритмы (средняя,
предельная) будут такими:


<
1, средняя и предельная ошибки всегда
меньше, чем при повторном отборе.

С введением
,
меняются формулы для расчета других
ошибок (не всех)

53

Механический отбор используется в том
случае, если единицы генеральной
совокупности располагаются в каком-либо
порядке во времени или пространстве,
или есть возможность это сделать. Порядок
не должен быть связан с изучаемым
явлением.

Пример: социологические обследования
– люди в алфавитном прорядке.

1)Находится шаг или интервал отбора :

2)Осуществляется отбор из совокупности,
упорядоченной, с указанным шагом

3)Случайная и предельная ошибки находятся
по формулам случайного бесповторного
отбора, так как механический осуществляется
как бесповторный.

54

Типический отбор используют, если в
ген.совокупности имеются своеобразные
группы единиц (партии сена с разными
сроками заготовки, группы животных на
откорме разного возраста), или же можно
выделить такие группы (коровы с разными
месяцами лактации).

После определения качественно отличных
частей, определяется представительство
из каждой части в выборке

Ni
-численность i-той
группы в ген.совокупности, представительство
которой в выборке надо определить; N-
общая численность генеральной
совокупности, n – общая
численность выборки, ni
– единицы из i-той группы,
которые должны быть взяты в выборку.

Следовательно

Иногда представительство групп в выборке
определяют пропорционально средним
квадратическим отклонениям изучаемого
признака в выделенных группах
ген.совокупности, дисперсиям или объемам
вариации.

Затем производится случайный бесповторный
или механический отборы из групп.

При расчете средней и предельной ошибок
учитывается колеблемость признака
только внутри групп,

Так как остаточная дисперсия является
частью общей, типический отбор обеспечиваем
min ошибку при прочих равных
условиях.

55

Представительство групп в выборке
устанавливается пропорционально их
численности

Ni
-численность i-той
группы в ген.совокупности, представительство
которой в выборке надо определить; N-
общая численность генеральной
совокупности, n – общая
численность выборки, ni
– единицы из i-той группы,
которые должны быть взяты в выборку.

Следовательно

Иногда представительство групп в выборке
определяют пропорционально средним
квадратическим отклонениям изучаемого
признака в выделенных группах
ген.совокупности, дисперсиям или объемам
вариации.

56

Серийный отбор/гнездовой отбор

Выборка формируется из серий/гнезд,
состоящих из нескольких единиц. Отбор
гнезд проводится механически.

При расчете ошибок учитываются только
межсерийные различия. Формулы для
расчента средней и предельной ошибок
для выборочной средней

и

соответственно средняя и предельная
ошибки выборочной средней, ni
и Ni
число серий (гнезд) соответственно
в выборочной и ген.совокупностях,

— межсерийная дисперсия.

57

Под статистической гипотезой понимается
некоторое предположение о ген.совокупности,
которое может быть проверено на основе
выборки. Так как предположение может
касаться распределения численностей
или количественной статистической
характеристики ген.совокупности, эти
гипотезы получили название статистических.

Большинство научных гипотез требуют
экспериментальной проверки, а так как
данные любого эксперимента являются
выборкой, то результаты любого эксперимента
подлежат статистической обработке в
режиме проверки гипотез. Подобная
обработка нужна, чтобы не повторяя до
бесконечности эксперимент (не доводя
до ген.совокупности) иметь основание
на основе единственного эксперимента
(одной выборки) формулировать выводы.

58

Формулировка двух гипотез: Нулевая
(рабочая) Ho, альтернативная
Ha.

Выбор Ho определяется с
одной стороны практическими соображениями,
а с другой — законом распределения, так
называемого критерия. Практическая
сторона – в качестве Ho
рекомендуется выдвигать предположение
противоположное тому, во что изначально
верит исследователь. Из теории проверки
гипотез следует, что если Ho
была принята, то она – единственно
верная. Если была принята Ha,
то вывод – однозначный. Ну а так как
исследователь заинтересован в
однозначности вывода, то свое предположение
он относит к Ha. Ha-выдвигается
в противоположность Ho.

59

Ошибка первого рода – Ho
верна, но отвергается, т.к. критерий
находится в критической области. Ошибка
второго рода – Ho не верна,
но мы принимаем ее, т.к значение критерия
случайно оказалось в области согласия

Уровень значимости – вероятность
допущения ошибки первого рода. Также
это совокупная вероятность появления
таких значений критерия, при которых
отвергается Ho. Иногда
уровень значимости трактуется упрощенно,
как вероятность ошибки окончательного
вывода относительно выдвинутых гипотез.
Уровень значимости устанавливается
самим исследователем не выше значения
α=0,10, стандартными уровнями значимости
являются значения равные 0,05 и 0,01.

Соотношение между областью согласия и
критической областью регулируется
уровнем значимости.

Область согласия – круг значений, при
котором принимается Ho.
Критическая область – Ho
отвергается.

При статистической обработке результатов
ошибкам первого и второго, которые
влекут бОльшие материальные потери
должно отдаваться предпочтение, т.е.
они должны минимизироваться. Ошибки
первого рода минимизируются уменьшением
уровня значимости, второго рода –
увеличением до допустимых (0,10) значений.

60

Статистический критерий – инструмент
проверки выдвинутых гипотез. Это некая
случайная величина, имеющая алгоритм
расчета и закон распределения. Его
значение может быть рассчитано по
выборке – фактическое значение Qфакт
. Так как критерий имеет закон
распределения, то можно определить
вероятность появления тех или иных
значений критерия.

Выбор критерия зависит от

  1. содержание гипотезы (распределение
    численности, средняя генеральная,
    дисперсия в ген.совокупности)

  2. численность выборки

Критерии подразделяются на: параметрические
и непараметрические

Параметрические – выдвигают по отношению
к выборке некие предварительные условия
(о законе распределения). На основе этого
вида критерия делаются более надежные
выводы, и параметрическим критериям
отдается предпочтение

Непараметрические- условий не выдвигают.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Ошибка выборки — определение, типы, контроль и уменьшение ошибок

Опубликовано 2023-02-11 19:54 пользователем

Ошибки выборки

Что такое ошибка выборки?

Ошибка выборки возникает, когда выборка, используемая в исследовании, не является репрезентативной для всей популяции. Ошибки выборки случаются часто, поэтому исследователи всегда рассчитывают предел ошибки при получении окончательных результатов в качестве статистической практики. Предел погрешности — это величина погрешности, допустимая при неправильном расчете, представляющая собой разницу между выборкой и реальной популяцией.

Выберите своих респондентов

Каковы наиболее распространенные ошибки выборки в маркетинговых исследованиях?

Вот четыре основные ошибки маркетинговых исследований при составлении выборки:

  • Ошибка спецификации популяции: Ошибка спецификации популяции возникает, когда исследователи не знают, кого именно нужно опросить. Например, представьте себе исследование, посвященное детской одежде. Кого нужно опросить? Это могут быть оба родителя, только мать или ребенок. Родители принимают решение о покупке, но дети могут повлиять на их выбор.
  • Ошибка выборочной совокупности: Ошибки выборочной совокупности возникают, когда исследователи неправильно ориентируются на субпопуляцию при отборе выборки. Например, выборка из телефонного справочника может иметь ошибочные включения, поскольку люди меняют свои города. Ошибочные исключения происходят, когда люди предпочитают не указывать свои номера. Богатые домохозяйства могут иметь более одного подключения, что приводит к многократным включениям.
  • Ошибка отбора: Ошибка отбора происходит, когда респонденты сами выбирают себя для участия в исследовании. Отвечают только те, кто заинтересован. Ошибки отбора можно контролировать, если сделать дополнительный шаг и запросить ответы у всей выборки. Планирование перед опросом, последующие действия и аккуратный и чистый дизайн опроса повысят процент участия респондентов. Кроме того, попробуйте такие методы, как CATI-опросы и личные интервью, чтобы максимизировать количество ответов.
  • Ошибки выборки: Ошибки выборки возникают из-за неравномерной репрезентативности респондентов. В основном это происходит, когда исследователь не планирует тщательно свою выборку. Эти ошибки выборки можно контролировать и устранять, создавая тщательный план выборки, имея достаточно большую выборку, отражающую все население, или используя для сбора ответов онлайн-выборку или аудиторию опроса.

Контроль ошибки выборки

Статистические теории помогают исследователям измерить вероятность ошибки выборки в зависимости от размера выборки и населения. Размер выборки, рассматриваемой из совокупности, в первую очередь определяет размер ошибки выборки. При больших размерах выборки вероятность ошибки ниже. Для понимания и оценки погрешности исследователи используют метрику, известную как предел погрешности. Обычно желаемым уровнем достоверности считается уровень достоверности в 95%.

Про совет: Если вам нужна помощь в расчете собственного предела погрешности, вы можете воспользоваться нашим калькулятором предела погрешности.

Каковы шаги по сокращению ошибок выборки?

Ошибки выборки легко выявить. Вот несколько простых шагов по уменьшению ошибки выборки:

  1. Увеличение размера выборки: Больший размер выборки дает более точный результат, поскольку исследование приближается к реальному размеру популяции.
  2. Разделение популяции на группы: Тестируйте группы в соответствии с их размером в популяции вместо случайной выборки. Например, если люди определенной демографической группы составляют 20% населения, убедитесь, что ваше исследование состоит из этой переменной, чтобы уменьшить смещение выборки.
  3. Знать свое население: Изучите свое население и поймите его демографический состав. Знайте, какие демографические группы используют ваш продукт и услугу, и убедитесь, что вы нацелены только на ту выборку, которая имеет значение.

Мы также создали инструмент, который поможет вам легко определить вашу выборку: Калькулятор размера выборки.

Ошибка выборки поддается измерению, и исследователи могут использовать ее в своих интересах, чтобы оценить точность своих выводов и оценить дисперсию.

Рубрика: 

  • Бизнес

Ключевые слова: 

  • аудитория

Автор: 

  • Dan Fleetwood

Источник: 

  • questionpro

Перевод: 

  • Дмитрий Л

What Is a Sampling Error?

A sampling error is a statistical error that occurs when an analyst does not select a sample that represents the entire population of data. As a result, the results found in the sample do not represent the results that would be obtained from the entire population.

Sampling is an analysis performed by selecting a number of observations from a larger population. The method of selection can produce both sampling errors and non-sampling errors.

Key Takeaways

  • A sampling error occurs when the sample used in the study is not representative of the whole population. 
  • Sampling is an analysis performed by selecting a number of observations from a larger population.
  • Even randomized samples will have some degree of sampling error because a sample is only an approximation of the population from which it is drawn.
  • The prevalence of sampling errors can be reduced by increasing the sample size.
  • In general, sampling errors can be placed into four categories: population-specific error, selection error, sample frame error, or non-response error.

Understanding Sampling Errors

A sampling error is a deviation in the sampled value versus the true population value. Sampling errors occur because the sample is not representative of the population or is biased in some way. Even randomized samples will have some degree of sampling error because a sample is only an approximation of the population from which it is drawn.

Calculating Sampling Error

The sampling error formula is used to calculate the overall sampling error in statistical analysis. The sampling error is calculated by dividing the standard deviation of the population by the square root of the size of the sample, and then multiplying the resultant with the Z-score value, which is based on the confidence interval.

Sampling Error

=

Z

×

σ

n

where:

Z

=

Z

 score value based on the

 confidence interval (approx

=

1.96

)

σ

=

Population standard deviation

n

=

Size of the sample

begin{aligned}&text{Sampling Error}=Ztimesfrac{sigma}{sqrt{n}}\&textbf{where:}\&Z=Ztext{ score value based on the}\&qquad text{confidence interval (approx}=1.96)\&sigma=text{Population standard deviation}\&n=text{Size of the sample}end{aligned}

Sampling Error=Z×nσwhere:Z=Z score value based on the confidence interval (approx=1.96)σ=Population standard deviationn=Size of the sample

Types of Sampling Errors

There are different categories of sampling errors.

Population-Specific Error

A population-specific error occurs when a researcher doesn’t understand who to survey.

Selection Error

Selection error occurs when the survey is self-selected, or when only those participants who are interested in the survey respond to the questions. Researchers can attempt to overcome selection error by finding ways to encourage participation.

Sample Frame Error

A sample frame error occurs when a sample is selected from the wrong population data.

Non-response Error

A non-response error occurs when a useful response is not obtained from the surveys because researchers were unable to contact potential respondents (or potential respondents refused to respond).

Eliminating Sampling Errors

The prevalence of sampling errors can be reduced by increasing the sample size. As the sample size increases, the sample gets closer to the actual population, which decreases the potential for deviations from the actual population. Consider that the average of a sample of 10 varies more than the average of a sample of 100. Steps can also be taken to ensure that the sample adequately represents the entire population.

Researchers might attempt to reduce sampling errors by replicating their study. This could be accomplished by taking the same measurements repeatedly, using more than one subject or multiple groups, or by undertaking multiple studies.

Random sampling is an additional way to minimize the occurrence of sampling errors. Random sampling establishes a systematic approach to selecting a sample. For example, rather than choosing participants to be interviewed haphazardly, a researcher might choose those whose names appear first, 10th, 20th, 30th, 40th, and so on, on the list.

Examples of Sampling Errors

Assume that XYZ Company provides a subscription-based service that allows consumers to pay a monthly fee to stream videos and other types of programming via an Internet connection.

The firm wants to survey homeowners who watch at least 10 hours of programming via the Internet per week and that pay for an existing video streaming service. XYZ wants to determine what percentage of the population is interested in a lower-priced subscription service. If XYZ does not think carefully about the sampling process, several types of sampling errors may occur.

A population specification error would occur if XYZ Company does not understand the specific types of consumers who should be included in the sample. For example, if XYZ creates a population of people between the ages of 15 and 25 years old, many of those consumers do not make the purchasing decision about a video streaming service because they may not work full-time. On the other hand, if XYZ put together a sample of working adults who make purchase decisions, the consumers in this group may not watch 10 hours of video programming each week.

Selection error also causes distortions in the results of a sample. A common example is a survey that only relies on a small portion of people who immediately respond. If XYZ makes an effort to follow up with consumers who don’t initially respond, the results of the survey may change. Furthermore, if XYZ excludes consumers who don’t respond right away, the sample results may not reflect the preferences of the entire population.

Sampling Error vs. Non-sampling Error

There are different types of errors that can occur when gathering statistical data. Sampling errors are the seemingly random differences between the characteristics of a sample population and those of the general population. Sampling errors arise because sample sizes are inevitably limited. (It is impossible to sample an entire population in a survey or a census.)

A sampling error can result even when no mistakes of any kind are made; sampling errors occur because no sample will ever perfectly match the data in the universe from which the sample is taken. 

Company XYZ will also want to avoid non-sampling errors. Non-sampling errors are errors that result during data collection and cause the data to differ from the true values. Non-sampling errors are caused by human error, such as a mistake made in the survey process.

If one group of consumers only watches five hours of video programming a week and is included in the survey, that decision is a non-sampling error. Asking questions that are biased is another type of error.

What Is Sampling Error vs. Sampling Bias?

In statistics, sampling means selecting the group that you will actually collect data from in your research.

Sampling bias is the expectation, which is known in advance, that a sample won’t be representative of the true population. For instance, if the sample ends up having proportionally more women or young people than the overall population.

Sampling errors are statistical errors that arise when a sample does not represent the whole population once analyses have been undertaken.

Why Is Sampling Error Important?

Being aware of the presence of sampling errors is important because it can be an indicator of the level of confidence that can be placed in the results. Sampling error is also important in the context of a discussion about how much research results can vary.

How Do You Find the Sampling Error?

In survey research, sampling errors occur because all samples are representative samples: a smaller group that stands in for the whole of your research population. It’s impossible to survey the entire group of people you’d like to reach.

It’s not usually possible to quantify the degree of sampling error in a study since it’s impossible to collect the relevant data from the entire population you are studying. This is why researchers collect representative samples (and representative samples are the reason why there are sampling errors).

What Is Sampling Error vs. Standard Error?

Sampling error is derived from the standard error (SE) by multiplying it by a Z-score value to produce a confidence interval.

The standard error is computed by dividing the standard deviation by the square root of the sample size.

The Bottom Line

Sampling error occurs when a sample drawn from a population deviates somewhat from that true population. Large sampling errors can lead to incorrect estimates or inferences made about the population based on statistical analysis of that sample.

In general, sampling errors can be placed into four categories: population-specific error, selection error, sample frame error, or non-response error. A population-specific error occurs when the researcher does not understand who they should survey. A selection error occurs when respondents self-select their participation in the study. (This results in only those that are interested in responding, which skews the results.) A sample frame error occurs when the wrong sub-population is used to select a sample. Finally, a non-response error occurs when potential respondents are not successfully contacted or refuse to respond.

Понравилась статья? Поделить с друзьями:
  • Что предполагает речевая ошибка
  • Что понимают под коррекцией ошибок
  • Что показывают стандартные ошибки коэффициентов регрессии
  • Что показывает стандартная ошибка среднего арифметического
  • Что показывает стандартная ошибка модели