Формула статистической ошибки

Что такое Стандартная формула ошибки?

Стандартная ошибка — это ошибка, которая возникает в распределении выборки при выполнении статистического анализа. Это вариант стандартного отклонения, так как оба понятия соответствуют мерам спреда. Высокая стандартная ошибка соответствует более высокому разбросу данных для взятой выборки. Вычисление формулы стандартной ошибки выполняется для выборки. В то же время стандартное отклонение определяет генеральную совокупность.

Оглавление

  • Что такое Стандартная формула ошибки?
    • Объяснение
    • Пример формулы стандартной ошибки
    • Калькулятор стандартной ошибки
    • Актуальность и использование
    • Стандартная формула ошибки в Excel
    • Рекомендуемые статьи

Следовательно, стандартная ошибка среднего значения будет выражаться и определяться в соответствии с соотношением, описанным следующим образом:

σ͞x = σ/√n

Стандартная формула ошибки

Здесь,

  • Стандартная ошибка, выраженная как σ͞x.
  • Стандартное отклонение совокупности выражается как σ.
  • Количество переменных в выборке, выраженное как n.

В статистическом анализе среднее значение, медиана и мода являются центральной тенденцией. Центральная тенденция Центральная тенденция — это статистическая мера, которая отображает центральную точку всего распределения данных, и вы можете найти ее с помощью 3 различных мер, т. е. среднего, медианы и моды.Подробнее меры. Стандартное отклонение, дисперсия и стандартная ошибка среднего классифицируются как меры изменчивости. Стандартная ошибка среднего для выборочных данных напрямую связана со стандартным отклонением большей совокупности и обратно пропорциональна или связана с квадратным корнем. число. Чтобы использовать эту функцию, введите термин =SQRT и нажмите клавишу табуляции, которая вызовет функцию SQRT. Более того, эта функция принимает один аргумент из нескольких переменных, используемых для создания выборки. Следовательно, если размер выборки Размер выборкиФормула размера выборки отображает соответствующий диапазон генеральной совокупности, в которой проводится эксперимент или опрос. Он измеряется с использованием размера генеральной совокупности, критического значения нормального распределения при требуемом доверительном уровне, доли выборки и предела погрешности. Если больше, то может быть равная вероятность того, что стандартная ошибка также будет большой.

Объяснение

Можно объяснить формулу для стандартной ошибки среднего, используя следующие шаги:

  1. Определите и организуйте выборку и определите количество переменных.
  2. Затем среднее значение выборки соответствует количеству переменных, присутствующих в выборке.
  3. Затем определите стандартное отклонение выборки.
  4. Затем определите квадратный корень из числа переменных, включенных в выборку.
  5. Теперь разделите стандартное отклонение, вычисленное на шаге 3, на полученное значение на шаге 4, чтобы получить стандартную ошибку.

Пример формулы стандартной ошибки

Ниже приведены примеры формул для расчета стандартной ошибки.

.free_excel_div{фон:#d9d9d9;размер шрифта:16px;радиус границы:7px;позиция:относительная;margin:30px;padding:25px 25px 25px 45px}.free_excel_div:before{content:»»;фон:url(центр центр без повтора #207245;ширина:70px;высота:70px;позиция:абсолютная;верх:50%;margin-top:-35px;слева:-35px;граница:5px сплошная #fff;граница-радиус:50%} Вы можете скачать этот шаблон стандартной формулы ошибки Excel здесь — Стандартная формула ошибки Шаблон Excel

Пример №1

Возьмем в качестве примера акции ABC. В течение 30 лет акции приносили средний долларовый доход в размере 45 долларов. Кроме того, было замечено, что акции приносят прибыль со стандартным отклонением в 2 доллара. Помогите инвестору рассчитать общую стандартную ошибку средней доходности, предлагаемой акцией ABC.

Решение:

  • Стандартное отклонение (σ) = $2
  • Количество лет (n) = 30
  • Средняя доходность в долларах = 45 долларов.

Расчет стандартной ошибки выглядит следующим образом:

Стандартная формула ошибки — пример 1.2

  • σ͞x = σ/√n
  • = 2 доллара США/√30
  • = 2 доллара США / 5,4773

Стандартная ошибка,

Стандартная формула ошибки — пример 1.3

  • σx = 0,3651 доллара США

Таким образом, инвестиция предлагает инвестору стандартную долларовую ошибку в среднем 0,36515 доллара при удерживании позиции ABC в течение 30 лет. Однако, если бы акции сохранялись для более высокого инвестиционного горизонта, то стандартная ошибка среднего значения в долларах значительно уменьшилась бы.

Пример #2

Возьмем в качестве примера инвестора, который получил следующую доходность акций XYZ:

Год инвестиций Предлагаемая доходность120%225%35%410%

Помогите инвестору рассчитать общую стандартную ошибку средней доходности акций XYZ.

Решение:

Сначала определите среднее значение доходности, как показано ниже: –

Стандартная формула ошибки — пример 2.2

  • ͞X = (x1+x2+x3+x4)/количество лет
  • = (20+25+5+10)/4
  • =15%

Теперь определите стандартное отклонение доходности, как показано ниже: –

Стандартная формула ошибки — пример 2.3

  • σ = √ ((x1-͞X)2 + (x2-͞X)2 + (x3-͞X)2 + (x4-͞X)2) / √ (количество лет -1)
  • = √ ((20-15) 2 + (25-15) 2 + (5-15) 2 + (10-15) 2) / √ (4-1)
  • = (√ (5) 2 + (10) 2 + (-10) 2 + (-5) 2 ) / √ (3)
  • = (√25+100+100+25)/ √ (3)
  • =√250/√3
  • =√83,3333
  • «=» 9,1287%

Теперь вычисление стандартной ошибки выглядит следующим образом:

Стандартная формула ошибки — пример 2.4

  • σ͞x = σ/√n
  • = 9,128709/√4
  • = 9,128709/2

Стандартная ошибка,

Стандартная формула ошибки — пример 2.5

  • σx = 4,56%

Таким образом, инвестиции предлагают инвестору стандартную ошибку в долларах в среднем 4,56% при удержании позиции XYZ в течение 4 лет.

Калькулятор стандартной ошибки

Вы можете использовать следующий калькулятор.

.cal-tbl td{ верхняя граница: 0 !важно; }.cal-tbl tr{ высота строки: 0.5em; } Только экран @media и (минимальная ширина устройства: 320 пикселей) и (максимальная ширина устройства: 480 пикселей) { .cal-tbl tr{ line-height: 1em !important; } } σnСтандартная формула ошибки

Формула стандартной ошибки =σ =√n 0 = 0√0

Актуальность и использование

Стандартная ошибка имеет тенденцию быть высокой, если размер выборки для анализа мал. Следовательно, выборка всегда берется из большей совокупности, которая включает больший размер переменных. Это всегда помогает статистику определить достоверность среднего значения выборки относительно среднего значения генеральной совокупности.

Большая стандартная ошибка говорит статистику, что выборка неоднородна в отношении среднего значения генеральной совокупности. Относительно населения наблюдается большой разброс в выборке. Точно так же небольшая стандартная ошибка говорит статистику, что выборка однородна относительно среднего значения генеральной совокупности. Отсутствуют или незначительные различия в выборке относительно населения.

Не следует смешивать его со стандартным отклонением. Вместо этого следует рассчитать стандартное отклонение для всей совокупности. Стандартная ошибкаСтандартная ошибкаСтандартная ошибка (SE) — это метрика, которая измеряет точность выборочного распределения, обозначающего совокупность, с использованием стандартного отклонения. Другими словами, это мера дисперсии среднего значения выборки, связанная со средним значением генеральной совокупности, а не стандартное отклонение. С другой стороны, оно определяется для среднего значения выборки.

Стандартная формула ошибки в Excel

Теперь давайте возьмем пример Excel, чтобы проиллюстрировать концепцию стандартной формулы ошибки в шаблоне Excel ниже. Предположим, администрация школы хочет определить стандартную ошибку среднего значения роста футболистов.

Выборка состоит из следующих значений: –

Пример 3.1

Помогите администрации оценить стандартную ошибку среднего значения.

Шаг 1: Определите среднее значение, как показано ниже: –

Пример 3.2

Шаг 2: Определите стандартное отклонение, как показано ниже: –

Пример 3.3

Шаг 3: Определите стандартную ошибку среднего значения, как показано ниже: –

Пример 3.4

Следовательно, стандартная ошибка среднего значения для футболистов составляет 1,846 дюйма. Руководство должно заметить, что оно значительно велико. Таким образом, выборочные данные, взятые для анализа, неоднородны и имеют большую дисперсию.

Руководству следует либо исключить более мелких игроков, либо добавить игроков значительно выше, чтобы сбалансировать средний рост футбольной команды, заменив их людьми с меньшим ростом по сравнению с их сверстниками.

Рекомендуемые статьи

Эта статья была руководством по формуле стандартной ошибки. Здесь мы обсуждаем формулу для расчета среднего значения, стандартную ошибку, примеры и загружаемый лист Excel. Вы можете узнать больше из следующих статей: –

  • Формула рентабельности EBITDA
  • Формула валовой прибыли
  • Формула относительного стандартного отклонения
  • Формула погрешности

Среднее арифметическое, как известно, используется для получения обобщающей характеристики некоторого набора данных. Если данные более-менее однородны и в них нет аномальных наблюдений (выбросов), то среднее хорошо обобщает данные, сведя к минимуму влияние случайных факторов (они взаимопогашаются при сложении).

Когда анализируемые данные представляют собой выборку (которая состоит из случайных значений), то среднее арифметическое часто (но не всегда) выступает в роли приближенной оценки математического ожидания. Почему приближенной? Потому что среднее арифметическое – это величина, которая зависит от набора случайных чисел, и, следовательно, сама является случайной величиной. При повторных экспериментах (даже в одних и тех же условиях) средние будут отличаться друг от друга.

Для того, чтобы на основе статистического анализа данных делать корректные выводы, необходимо оценить возможный разброс полученного результата. Для этого рассчитываются различные показатели вариации. Но то исходные данные. И как мы только что установили, среднее арифметическое также обладает разбросом, который необходимо оценить и учитывать в дальнейшем (в выводах, в выборе метода анализа и т.д.).

Интуитивно понятно, что разброс средней должен быть как-то связан с разбросом исходных данных. Основной характеристикой разброса средней выступает та же дисперсия.

Дисперсия выборочных данных – это средний квадрат отклонения от средней, и рассчитать ее по исходным данным не составляет труда, например, в Excel предусмотрены специальные функции. Однако, как же рассчитать дисперсию средней, если в распоряжении есть только одна выборка и одно среднее арифметическое?

Расчет дисперсии и стандартной ошибки средней арифметической

Чтобы получить дисперсию средней арифметической нет необходимости проводить множество экспериментов, достаточно иметь только одну выборку. Это легко доказать. Для начала вспомним, что средняя арифметическая (простая) рассчитывается по формуле:

формула средней арифметической

где xi – значения переменной,
n – количество значений.

Теперь учтем два свойства дисперсии, согласно которым, 1) — постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат и 2) — дисперсия суммы независимых случайных величин равняется сумме соответствующих дисперсий. Предполагается, что каждое случайное значение xi обладает одинаковым разбросом, поэтому несложно вывести формулу дисперсии средней арифметической:

Формула дисперсии средней арифметической

Используя более привычные обозначения, формулу записывают как:

Дисперсия средней арифметической

где σ2 – это дисперсия, случайной величины, причем генеральная.

На практике же, генеральная дисперсия известна далеко не всегда, точнее совсем редко, поэтому в качестве оной используют выборочную дисперсию:

Дисперсия средней арифметической по выборке

Стандартное отклонение средней арифметической называется стандартной ошибкой средней и рассчитывается, как квадратный корень из дисперсии.

Формула стандартной ошибки средней при использовании генеральной дисперсии

Стандартная ошибка средней

Формула стандартной ошибки средней при использовании выборочной дисперсии

Стандартная ошибка средней по выборке

Последняя формула на практике используется чаще всего, т.к. генеральная дисперсия обычно не известна. Чтобы не вводить новые обозначения, стандартную ошибку средней обычно записывают в виде соотношения стандартного отклонения выборки и корня объема выборки.

Назначение и свойство стандартной ошибки средней арифметической

Стандартная ошибка средней много, где используется. И очень полезно понимать ее свойства. Посмотрим еще раз на формулу стандартной ошибки средней:

Стандартная ошибка выборочной средней

Числитель – это стандартное отклонение выборки и здесь все понятно. Чем больше разброс данных, тем больше стандартная ошибка средней – прямо пропорциональная зависимость.

Посмотрим на знаменатель. Здесь находится квадратный корень из объема выборки. Соответственно, чем больше объем выборки, тем меньше стандартная ошибка средней. Для наглядности изобразим на одной диаграмме график нормально распределенной переменной со средней равной 10, сигмой – 3, и второй график – распределение средней арифметической этой же переменной, полученной по 16-ти наблюдениям (которое также будет нормальным).

Зависимость стандартной ошибки средней от объем выборки

Судя по формуле, разброс стандартной ошибки средней должен быть в 4 раза (корень из 16) меньше, чем разброс исходных данных, что и видно на рисунке выше. Чем больше наблюдений, тем меньше разброс средней.

Казалось бы, что для получения наиболее точной средней достаточно использовать максимально большую выборку и тогда стандартная ошибка средней будет стремиться к нулю, а сама средняя, соответственно, к математическому ожиданию. Однако квадратный корень объема выборки в знаменателе говорит о том, что связь между точностью выборочной средней и размером выборки не является линейной. Например, увеличение выборки с 20-ти до 50-ти наблюдений, то есть на 30 значений или в 2,5 раза, уменьшает стандартную ошибку средней только на 36%, а со 100-а до 130-ти наблюдений (на те же 30 значений), снижает разброс данных лишь на 12%.

Лучше всего изобразить эту мысль в виде графика зависимости стандартной ошибки средней от размера выборки. Пусть стандартное отклонение равно 10 (на форму графика это не влияет).

Распределение исходных данных и средней

Видно, что примерно после 50-ти значений, уменьшение стандартной ошибки средней резко замедляется, после 100-а – наклон постепенно становится почти нулевым.

Таким образом, при достижении некоторого размера выборки ее дальнейшее увеличение уже почти не сказывается на точности средней. Этот факт имеет далеко идущие последствия. Например, при проведении выборочного обследования населения (опроса) чрезмерное увеличение выборки ведет к неоправданным затратам, т.к. точность почти не меняется. Именно поэтому количество опрошенных редко превышает 1,5 тысячи человек. Точность при таком размере выборки часто является достаточной, а дальнейшее увеличение выборки – нецелесообразным.

Подведем итог. Расчет дисперсии и стандартной ошибки средней имеет довольно простую формулу и обладает полезным свойством, связанным с тем, что относительно хорошая точность средней достигается уже при 100 наблюдениях (в этом случае стандартная ошибка средней становится в 10 раз меньше, чем стандартное отклонение выборки). Больше, конечно, лучше, но бесконечно увеличивать объем выборки не имеет практического смысла. Хотя, все зависит от поставленных задач и цены ошибки. В некоторых опросах участие принимают десятки тысяч людей.

Дисперсия и стандартная ошибка средней имеют большое практическое значение. Они используются в проверке гипотез и расчете доверительных интервалов.

Поделиться в социальных сетях:

What Is the Standard Error?

The standard error (SE) of a statistic is the approximate standard deviation of a statistical sample population.

The standard error is a statistical term that measures the accuracy with which a sample distribution represents a population by using standard deviation. In statistics, a sample mean deviates from the actual mean of a population; this deviation is the standard error of the mean.

Key Takeaways

  • The standard error (SE) is the approximate standard deviation of a statistical sample population.
  • The standard error describes the variation between the calculated mean of the population and one which is considered known, or accepted as accurate.
  • The more data points involved in the calculations of the mean, the smaller the standard error tends to be.

Standard Error

Understanding Standard Error

The term «standard error» is used to refer to the standard deviation of various sample statistics, such as the mean or median. For example, the «standard error of the mean» refers to the standard deviation of the distribution of sample means taken from a population. The smaller the standard error, the more representative the sample will be of the overall population.

The relationship between the standard error and the standard deviation is such that, for a given sample size, the standard error equals the standard deviation divided by the square root of the sample size. The standard error is also inversely proportional to the sample size; the larger the sample size, the smaller the standard error because the statistic will approach the actual value.

The standard error is considered part of inferential statistics. It represents the standard deviation of the mean within a dataset. This serves as a measure of variation for random variables, providing a measurement for the spread. The smaller the spread, the more accurate the dataset.

Standard error and standard deviation are measures of variability, while central tendency measures include mean, median, etc.

Formula and Calculation of Standard Error

The standard error of an estimate can be calculated as the standard deviation divided by the square root of the sample size:

SE = σ / √n

where

  • σ = the population standard deviation
  • n = the square root of the sample size

If the population standard deviation is not known, you can substitute the sample standard deviation, s, in the numerator to approximate the standard error.

Requirements for Standard Error 

When a population is sampled, the mean, or average, is generally calculated. The standard error can include the variation between the calculated mean of the population and one which is considered known, or accepted as accurate. This helps compensate for any incidental inaccuracies related to the gathering of the sample.

In cases where multiple samples are collected, the mean of each sample may vary slightly from the others, creating a spread among the variables. This spread is most often measured as the standard error, accounting for the differences between the means across the datasets.

The more data points involved in the calculations of the mean, the smaller the standard error tends to be. When the standard error is small, the data is said to be more representative of the true mean. In cases where the standard error is large, the data may have some notable irregularities.

The standard deviation is a representation of the spread of each of the data points. The standard deviation is used to help determine the validity of the data based on the number of data points displayed at each level of standard deviation. Standard errors function more as a way to determine the accuracy of the sample or the accuracy of multiple samples by analyzing deviation within the means.

Standard Error vs. Standard Deviation

The standard error normalizes the standard deviation relative to the sample size used in an analysis. Standard deviation measures the amount of variance or dispersion of the data spread around the mean. The standard error can be thought of as the dispersion of the sample mean estimations around the true population mean. As the sample size becomes larger, the standard error will become smaller, indicating that the estimated sample mean value better approximates the population mean.

Example of Standard Error

Say that an analyst has looked at a random sample of 50 companies in the S&P 500 to understand the association between a stock’s P/E ratio and subsequent 12-month performance in the market. Assume that the resulting estimate is -0.20, indicating that for every 1.0 point in the P/E ratio, stocks return 0.2% poorer relative performance. In the sample of 50, the standard deviation was found to be 1.0.

The standard error is thus:

SE = 1.0/50 = 1/7.07 = 0.141

Therefore, we would report the estimate as -0.20% ± 0.14, giving us a confidence interval of (-0.34 — -0.06). The true mean value of the association of the P/E on returns of the S&P 500 would therefore fall within that range with a high degree of probability.

Say now that we increase the sample of stocks to 100 and find that the estimate changes slightly from -0.20 to -0.25, and the standard deviation falls to 0.90. The new standard error would thus be:

SE = 0.90/100 = 0.90/10 = 0.09.

The resulting confidence interval becomes -0.25 ± 0.09 = (-0.34 — -0.16), which is a tighter range of values.

What Is Meant by Standard Error?

Standard error is intuitively the standard deviation of the sampling distribution. In other words, it depicts how much disparity there is likely to be in a point estimate obtained from a sample relative to the true population mean.

What Is a Good Standard Error?

Standard error measures the amount of discrepancy that can be expected in a sample estimate compared to the true value in the population. Therefore, the smaller the standard error the better. In fact, a standard error of zero (or close to it) would indicate that the estimated value is exactly the true value.

How Do You Find the Standard Error?

The standard error takes the standard deviation and divides it by the square root of the sample size. Many statistical software packages automatically compute standard errors.

The Bottom Line

The standard error (SE) measures the dispersion of estimated values obtained from a sample around the true value to be found in the population. Statistical analysis and inference often involves drawing samples and running statistical tests to determine associations and correlations between variables. The standard error thus tells us with what degree of confidence we can expect the estimated value to approximate the population value.

Цель занятия:Освоить практическое
применение статистических методик
оценки достоверности результатов
научных медицинских исследований.

План занятия:

  1. Освоить теоретические основы, основные
    понятия, использующиеся при оценке
    достоверности результатов научных
    медицинских исследований.

  2. Изучить показания и практические
    методики расчета и оценки:

    1. средней ошибки относительного
      показателя;

    2. ошибки средней величины;

    3. доверительных границ показателя и
      средней величины;

    4. средней ошибки показателя, равного 0
      или 100%;

    5. достоверности различий показателей
      и средних величин;

    6. достоверности различий показателей
      и средних величин при малом числе
      наблюдений;

    7. достоверности различий сравниваемых
      средних величин при независимых друг
      от друга наблюдениях;

    8. достоверности различия выборочного
      результата и стандарта;

    9. достоверности средних квадратических
      отклонений;

    10. показателя точности.

Основные понятия и определения по теме

Достоверность результатов
медико-статистических исследований
зависит от ряда условий: от правильности
построения исследования, надежности
исходных документов, точности ручной
и компьютерной обработки.

При проведении любого исследования
встречаются две категории ошибок:

    1. Ошибки, которые нельзя учесть
      математическими методами
      , но при
      хорошей организации исследования их
      можно избежать или свести к минимуму:

а) ошибки методические(неправильная
методика сбора и обработки материала);

б) ошибки точности(неточность
приборов, недостаточная точность
расчетов, неточность первичной регистрации
фактов);

в) ошибки внимания(описки, просчеты,
опечатки);

г) ошибки типичности(отбор группы
объектов, нетипичных для всей генеральной
совокупности, тенденциозный подбор
первичных данных).

Для уменьшения размеров ошибок необходимо
соблюдать объективность отбора единиц
наблюдения, использовать контроль за
качеством материала на каждом этапе
работы. При расчете средних и относительных
величин следует применять надежную
вычислительную технику, а при оценке
качества медико-статистической информации
наряду с логическим контролем состояния
форм использовать более точные методы
текущего (по ходу работы) и конечного
(после завершения выкопировки и изучения
возможности получения сведений о тех
или иных вопросах программы) контроля.

    1. Ошибки, учитываемые математическими
      методами
      – ошибки выборки или
      репрезентативности
      .

Определение ошибки показателя и
средней величины

Ошибки репрезентативности сводятся к
тому, что те или иные числовые характеристики
(относительные коэффициенты, средние
квадратические отклонения и др.),
вычисленные на основании наблюдения
выборочной совокупности, переносятся
на генеральную совокупность. Это
неизбежные ошибки, вытекающие из самой
сущности выборочного исследования. Вся
генеральная совокупность может быть
охарактеризована только по одной ее
части с некоторой ошибкой, то есть с
определенной погрешностью.

Величина ошибки репрезентативности
определяется как объемом выборки, так
и разнообразием признака. Чем больше
число наблюдений, тем меньше ошибка;
чем более изменчив признак, тем больше
величина статистической ошибки.

Рассмотрим вычисление средних ошибок
относительного показателя и средней
величины.

1. Средняя ошибка показателя вычисляется
по формуле:
,
где m – средняя ошибка; p – статистический
коэффициент (относительная величина);
q – величина, обратная p (альтернативный
показатель), и выражена как (1–p), (100–p),
(1000–p) и т.д. в зависимости от основания,
на которое рассчитан коэффициент; n –
число наблюдений в выборочной совокупности.

Если число наблюдений недостаточно
велико (менее 30), в формулу вводится
правка:

Пример:Рассчитать среднюю ошибку
показателя летальности в лечебном
учреждении, если известно: всего выбыло
из стационара 317 больных, из них умерло
13.

Летальность составит:

p=4,1 q=100-4,1=95,9 n=317

Таким образом, показатель летальности
равен: 4,1±1,11%

2. Расчет ошибки средней величины
производится по формуле:
и,
если n≤30, где m – средняя ошибка; σ –
среднее квадратическое отклонение; n –
число наблюдений.

Пример:В результате измерения веса
2000 новорожденных были получены следующие
данные: средний вес новорожденного (М)
составил 3350 граммов; среднее квадратическое
отклонение (σ) – 120 г. Определить ошибку
веса новорожденных.

г М=3350±2,7г.

Определение доверительных границ

Определение величины ошибки
репрезентативности необходимо для
нахождения возможных значений генеральных
параметров. Оценка генеральных параметров
проводится в виде двух значений –
минимального и максимального. Эти
крайние значения возможных отклонений,
в пределах которых может колебаться
искомая величина генерального параметра,
называются доверительными границами.

Теорией вероятности установлено, что
с достоверностью 99,7% можно утверждать,
что эти крайние значения будут отличаться
от полученного ранее показателя не
более чем на величину утроенной средней
ошибки.

С достоверностью 95,5% можно полагать,
что эти отклонения будут не больше
величины удвоенной средней ошибки.

Так, например, если при применении нового
лечебного препарата был достигнут
положительный эффект (Р), равный
80%(m=±2%), то с надежностью 99,7%, можно
утверждать, что при повторных сходных
наблюдениях этот эффект будет колебаться
от 74 до 86% (Р±3m) и с вероятностью в 95,5% –
от 76 до 84% (Р±2m).

Оценка показателя проводится на основе
вычисленной ошибки. Оценка доверительных
границ зависит от степени точности,
которую необходимо придать показателю,
и проводится самим исследователем.

Например, показатель распространенности
пневмокониоза у рабочих угольных
комбайнов равен 15 случаев на 100 работающих
(Р = 15,0%); уторенная ошибка (±3m) – 10,0. В
данном случае доверительные границы
показателя будут колебаться от 5,0 до
25,0. Величина показателя 15% не будет
внушать доверие исследователю из-за
больших его колебаний.

При малой выборке величину доверительного
коэффициента необходимо определять
каждый раз по специальной таблице в
зависимости от числа наблюдений (табл.
1).

Пример:Показатель частоты
недостаточности кровообращения (Р)
равен 55,5%; m=±9,5%; n=27.

              1. Определяем число степеней свободы:
                n’=n-1=27-1=26:

              2. По таблице определяем значения t:
                при вероятности ошибки не более 5%
                и n’=26 значение t равно 2,06;

              3. С достоверностью 95% можно утверждать,
                что величина показателя будет
                колебаться: 55,5%±2,06*9,5%, т.е. от 36 до
                75%.

Таблица 1

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Стандартное отклонение и стандартная ошибка: в чем разница?

  • Редакция Кодкампа

17 авг. 2022 г.
читать 2 мин


В статистике студенты часто путают два термина: стандартное отклонение и стандартная ошибка .

Стандартное отклонение измеряет, насколько разбросаны значения в наборе данных.

Стандартная ошибка — это стандартное отклонение среднего значения в повторных выборках из совокупности.

Давайте рассмотрим пример, чтобы ясно проиллюстрировать эту идею.

Пример: стандартное отклонение против стандартной ошибки

Предположим, мы измеряем вес 10 разных черепах.

Для этой выборки из 10 черепах мы можем вычислить среднее значение выборки и стандартное отклонение выборки:

Предположим, что стандартное отклонение оказалось равным 8,68. Это дает нам представление о том, насколько распределен вес этих черепах.

Но предположим, что мы собираем еще одну простую случайную выборку из 10 черепах и также проводим их измерения. Более чем вероятно, что эта выборка из 10 черепах будет иметь немного другое среднее значение и стандартное отклонение, даже если они взяты из одной и той же популяции:

Теперь, если мы представим, что мы берем повторные выборки из одной и той же совокупности и записываем выборочное среднее и выборочное стандартное отклонение для каждой выборки:

Теперь представьте, что мы наносим каждое среднее значение выборки на одну и ту же строку:

Стандартное отклонение этих средних значений известно как стандартная ошибка.

Формула для фактического расчета стандартной ошибки:

Стандартная ошибка = s/ √n

куда:

  • s: стандартное отклонение выборки
  • n: размер выборки

Какой смысл использовать стандартную ошибку?

Когда мы вычисляем среднее значение данной выборки, нас на самом деле интересует не среднее значение этой конкретной выборки, а скорее среднее значение большей совокупности, из которой взята выборка.

Однако мы используем выборки, потому что для них гораздо проще собирать данные, чем для всего населения. И, конечно же, среднее значение выборки будет варьироваться от выборки к выборке, поэтому мы используем стандартную ошибку среднего значения как способ измерить, насколько точна наша оценка среднего значения.

Вы заметите из формулы для расчета стандартной ошибки, что по мере увеличения размера выборки (n) стандартная ошибка уменьшается:

Стандартная ошибка = s/ √n

Это должно иметь смысл, поскольку большие размеры выборки уменьшают изменчивость и увеличивают вероятность того, что среднее значение нашей выборки ближе к фактическому среднему значению генеральной совокупности.

Когда использовать стандартное отклонение против стандартной ошибки

Если мы просто заинтересованы в измерении того, насколько разбросаны значения в наборе данных, мы можем использовать стандартное отклонение .

Однако, если мы заинтересованы в количественной оценке неопределенности оценки среднего значения, мы можем использовать стандартную ошибку среднего значения .

В зависимости от вашего конкретного сценария и того, чего вы пытаетесь достичь, вы можете использовать либо стандартное отклонение, либо стандартную ошибку.

Понравилась статья? Поделить с друзьями:
  • Формула стандартной ошибки аппроксимации
  • Формула ставка ошибка число
  • Формула средней ошибки средней арифметической величины
  • Формула средней ошибки малой выборки
  • Формула средней ошибки выборки статистика