Закон распределения ошибок гаусса

Распределение ошибок Гаусса

Карл Гаусс в начале XIX века вывел закон распределения ошибок величины, получаемой в эксперименте. При этом он принял как постулаты следующие допущения:

1) Равные по модулю ошибки равновероятны.

2) Чем больше ошибка, тем меньше её вероятность.

3) При увеличении ошибки вероятность её стремится к нулю.

4) «Постулат Гаусса»: из серии проведённых измерений наиболее точным является среднее значение.

Этот закон записывается следующей формулой:

varphi ( varepsilon ) = {{h} over {sqrt {pi}}} e^{-h^{2} varepsilon^{2}}

Здесь φ — вероятность, ε — величина ошибки, h — мера точности (h = {{1} over {sigma sqrt {2}}}, где σ — стандартное отклонение).

Содержание:

Нормальный закон распределения:

Нормальный закон распределения имеет плотность вероятности

Нормальный закон распределения - определение и вычисление с примерами решения

где Нормальный закон распределения - определение и вычисление с примерами решения

График функции плотности вероятности (2.9.1) имеет максимум в точке Нормальный закон распределения - определение и вычисление с примерами решения а точки перегиба отстоят от точки Нормальный закон распределения - определение и вычисление с примерами решения на расстояние Нормальный закон распределения - определение и вычисление с примерами решения При Нормальный закон распределения - определение и вычисление с примерами решения функция (2.9.1) асимптотически приближается к нулю (ее график изображен на рис. 2.9.1).

Нормальный закон распределения - определение и вычисление с примерами решения

Помимо геометрического смысла, параметры нормального закона распределения имеют и вероятностный смысл. Параметр Нормальный закон распределения - определение и вычисление с примерами решения равен математическому ожиданию нормально распределенной случайной величины, а дисперсия Нормальный закон распределения - определение и вычисление с примерами решения Если Нормальный закон распределения - определение и вычисление с примерами решения т.е. X имеет нормальный закон распределения с параметрами Нормальный закон распределения - определение и вычисление с примерами решения и Нормальный закон распределения - определение и вычисление с примерами решения то Нормальный закон распределения - определение и вычисление с примерами решения

где Нормальный закон распределения - определение и вычисление с примерами решения– функция Лапласа

Значения функции Нормальный закон распределения - определение и вычисление с примерами решения можно найти по таблице (см. прил., табл. П2). Функция Лапласа нечетна, т.е. Нормальный закон распределения - определение и вычисление с примерами решения Поэтому ее таблица дана только для неотрицательныхНормальный закон распределения - определение и вычисление с примерами решения График функции Лапласа изображен на рис. 2.9.2. При значениях Нормальный закон распределения - определение и вычисление с примерами решения она практически остается постоянной. Поэтому в таблице даны значения функции только для Нормальный закон распределения - определение и вычисление с примерами решения При значениях Нормальный закон распределения - определение и вычисление с примерами решения можно считать, что Нормальный закон распределения - определение и вычисление с примерами решения

Нормальный закон распределения - определение и вычисление с примерами решения

Если Нормальный закон распределения - определение и вычисление с примерами решения то

Нормальный закон распределения - определение и вычисление с примерами решения

Пример:

Случайная величина X имеет нормальный закон распределения Нормальный закон распределения - определение и вычисление с примерами решения Известно, что Нормальный закон распределения - определение и вычисление с примерами решения а Нормальный закон распределения - определение и вычисление с примерами решенияНормальный закон распределения - определение и вычисление с примерами решения Найти значения параметров Нормальный закон распределения - определение и вычисление с примерами решения и Нормальный закон распределения - определение и вычисление с примерами решения

Решение. Воспользуемся формулой (2.9.2): Нормальный закон распределения - определение и вычисление с примерами решения

Так как Нормальный закон распределения - определение и вычисление с примерами решения По таблице функции Лапласа (см. прил., табл. П2) находим, что Нормальный закон распределения - определение и вычисление с примерами решения Нормальный закон распределения - определение и вычисление с примерами решения Поэтому Нормальный закон распределения - определение и вычисление с примерами решения или Нормальный закон распределения - определение и вычисление с примерами решения

Аналогично Нормальный закон распределения - определение и вычисление с примерами решения Так как Нормальный закон распределения - определение и вычисление с примерами решения то Нормальный закон распределения - определение и вычисление с примерами решения По таблице функции Лапласа (см. прил., табл. П2) находим, что Нормальный закон распределения - определение и вычисление с примерами решения Поэтому Нормальный закон распределения - определение и вычисление с примерами решения или Нормальный закон распределения - определение и вычисление с примерами решения Из системы двух уравнений Нормальный закон распределения - определение и вычисление с примерами решения и Нормальный закон распределения - определение и вычисление с примерами решения находим, что Нормальный закон распределения - определение и вычисление с примерами решения а  Нормальный закон распределения - определение и вычисление с примерами решения т.е. Нормальный закон распределения - определение и вычисление с примерами решения Итак, случайная величина X имеет нормальный закон распределения N(3;4).

График функции плотности вероятности этого закона распределения изображен на рис. 2.9.3.

Нормальный закон распределения - определение и вычисление с примерами решения

Ответ. Нормальный закон распределения - определение и вычисление с примерами решения

Пример:

Ошибка измерения X имеет нормальный закон распределения, причем систематическая ошибка равна 1 мк, а дисперсия ошибки равна 4 мк2. Какова вероятность того, что в трех независимых измерениях ошибка ни разу не превзойдет по модулю 2 мк?

Решение. По условиям задачи Нормальный закон распределения - определение и вычисление с примерами решения Вычислим сначала вероятность того, что в одном измерении ошибка не превзойдет 2 мк. По формуле (2.9.2)Нормальный закон распределения - определение и вычисление с примерами решения

Вычисленная вероятность численно равна заштрихованной площади на рис. 2.9.4.

Нормальный закон распределения - определение и вычисление с примерами решения

Каждое измерение можно рассматривать как независимый опыт. Поэтому по формуле Бернулли (2.6.1) вероятность того, что в трех независимых измерениях ошибка ни разу не превзойдет 2 мк, равна Нормальный закон распределения - определение и вычисление с примерами решенияНормальный закон распределения - определение и вычисление с примерами решения

Ответ. Нормальный закон распределения - определение и вычисление с примерами решения

Пример:

Функция плотности вероятности случайной величины X имеет вид Нормальный закон распределения - определение и вычисление с примерами решения

Требуется определить коэффициент Нормальный закон распределения - определение и вычисление с примерами решения найти Нормальный закон распределения - определение и вычисление с примерами решения и Нормальный закон распределения - определение и вычисление с примерами решения определить тип закона распределения, нарисовать график функции Нормальный закон распределения - определение и вычисление с примерами решения вычислить вероятность Нормальный закон распределения - определение и вычисление с примерами решения

Замечание. Если каждый закон распределения из некоторого семейства законов распределения имеет функцию распределения , Нормальный закон распределения - определение и вычисление с примерами решения где Нормальный закон распределения - определение и вычисление с примерами решения– фиксированная функция распределения, a Нормальный закон распределения - определение и вычисление с примерами решения Нормальный закон распределения - определение и вычисление с примерами решения то говорят, что эти законы распределения принадлежат к одному виду или типу распределений. Параметр Нормальный закон распределения - определение и вычисление с примерами решения называют параметром сдвига, Нормальный закон распределения - определение и вычисление с примерами решения – параметром масштаба.

Решение. Так как (2.9.4) функция плотности вероятности, то интеграл от нее по всей числовой оси должен быть равен единице: Нормальный закон распределения - определение и вычисление с примерами решения

Преобразуем выражение в показателе степени, выделяя полный квадрат: Нормальный закон распределения - определение и вычисление с примерами решения

Тогда (2.9.5) можно записать в виде Нормальный закон распределения - определение и вычисление с примерами решения

Сделаем замену переменных так, чтобы Нормальный закон распределения - определение и вычисление с примерами решения т.е. Нормальный закон распределения - определение и вычисление с примерами решения Пределы интегрирования при этом останутся прежними. Тогда (2.9.6) преобразуется к виду

Нормальный закон распределения - определение и вычисление с примерами решения

Умножим и разделим левую часть равенства на Нормальный закон распределения - определение и вычисление с примерами решения Получим равенство Нормальный закон распределения - определение и вычисление с примерами решения

Так как Нормальный закон распределения - определение и вычисление с примерами решения  как интеграл по всей числовой оси от функции плотности вероятности стандартного нормального закона распределения N(0,1), то приходим к выводу, что

Нормальный закон распределения - определение и вычисление с примерами решения

Поэтому

Нормальный закон распределения - определение и вычисление с примерами решения

Последняя запись означает, что случайная величина имеет нормальный закон распределения с параметрами Нормальный закон распределения - определение и вычисление с примерами решения и Нормальный закон распределения - определение и вычисление с примерами решения График функции плотности вероятности этого закона изображен на рис. 2.9.5. Распределение случайной величины X принадлежит к семейству нормальных законов распределения. По формуле (2.9.2)

Нормальный закон распределения - определение и вычисление с примерами решения

Ответ. Нормальный закон распределения - определение и вычисление с примерами решения

Пример:

Цех на заводе выпускает транзисторы с емкостью коллекторного перехода Нормальный закон распределения - определение и вычисление с примерами решения Сколько транзисторов попадет в группу Нормальный закон распределения - определение и вычисление с примерами решения если в нее попадают транзисторы с емкостью коллекторного перехода от 1,80 до 2,00 пФ. Цех выпустил партию в 1000 штук.

Решение.

Статистическими исследованиями в цеху установлено, что Нормальный закон распределения - определение и вычисление с примерами решения можно трактовать как случайную величину, подчиняющуюся нормальному закону.

Чтобы вычислить количество транзисторов, попадающих в группу Нормальный закон распределения - определение и вычисление с примерами решения необходимо учитывать, что вся партия транзисторов имеет разброс параметров, накрывающий всю (условно говоря) числовую ось. То есть кривая Гаусса охватывает всю числовую ось, центр ее совпадает с Нормальный закон распределения - определение и вычисление с примерами решения (т. к. все установки в цеху настроены на выпуск транзисторов именно с этой емкостью). Вероятность попадания отклонений параметров всех транзисторов на всю числовую ось равна 1. Поэтому нам необходимо фактически определить вероятность попадания случайной величины Нормальный закон распределения - определение и вычисление с примерами решения в интервал Нормальный закон распределения - определение и вычисление с примерами решения а затем пересчитать количество пропорциональной вероятности.

Для расчета этой вероятности надо построить математическую модель. Экспериментальные данные говорят о том, что нормальное распределение можно принять в качестве математической модели. Эмпирическая оценка (установлена статистическими исследованиями в цеху) среднего значения Нормальный закон распределения - определение и вычисление с примерами решения

дает Нормальный закон распределения - определение и вычисление с примерами решения оценка среднего квадратического отклонения Нормальный закон распределения - определение и вычисление с примерами решения

Обозначая Нормальный закон распределения - определение и вычисление с примерами решения подставим приведенные значения в (6.3):
Нормальный закон распределения - определение и вычисление с примерами решения

Тогда количество транзисторов Нормальный закон распределения - определение и вычисление с примерами решения попавших в интервал [1,8; 2,0] пФ, можно найти так: Нормальный закон распределения - определение и вычисление с примерами решения Таким образом можно планировать и рассчитывать количество транзисторов, попадающих в ту или иную группу.

Нормальное распределение и его свойства

Если выйти на улицу любого города и случайным образом выбранных прохожих спросить о том, какой у них рост, вес, возраст, доход, и т.п., а потом построить график любой из этих величин, например, роста… Но не будем спешить, сначала посмотрим, как можно построить такой график.

Сначала, мы просто запишем результаты своего исследования. Потом, мы отсортируем всех людей по группам, так чтобы каждый попал в свой диапазон роста, например, «от 180 до 181 включительно».

После этого мы должны посчитать количество людей в каждой подгруппе-диапазоне, это будет частота попадания роста жителей города в данный диапазон. Обычно эту часть удобно оформить в виде таблички. Если затем эти частоты построить по оси у, а диапазоны отложить по оси х, можно получить так называемую гистограмму, упорядоченный набор столбиков, ширина которых равна, в данном случае, одному сантиметру, а длина будет равна той частоте, которая соответствует каждому диапазону роста. Если

Вам попалось достаточно много жителей, то Ваша схема будет выглядеть примерно так:

Нормальный закон распределения - определение и вычисление с примерами решения

Дальше можно уточнить задачу. Каждый диапазон разбить на десять, жителей рассортировать по росту с точностью до миллиметра. Диаграмма станет глаже, но уменьшится по высоте, «оплывет» вниз, т.к. в каждом маленьком диапазоне количество жителей уменьшается. Чтобы избежать этого, просто увеличим масштаб по вертикальной оси в 10 раз. Если гипотетически повторить эту процедуру несколько раз, будет вырисовываться та знаменитая колоколообразная фигура, которая характерна для нормального (или Гауссова) распределения. В результате, относительная частота встречаемости каждого конкретного диапазона роста может быть посчитана как отношение площади «ломтика» кривой, приходящегося на этот диапазон к площади подо всей кривой. Стандартизированные кривые нормального распределения, значения функций которых приводятся в таблицах книг по статистике, всегда имеют суммарную площадь под кривой равную единице. Это связано с тем, что, как Вы помните из курса теории вероятности, вероятность достоверного события всегда равна 100% (или единице), а для любого человека иметь хоть какое-то значение роста — достоверное событие. А вот вероятность того, что рост произвольного человека попадет в определенный выбранный нами диапазон, будет зависеть от трех факторов.

Во-первых, от величины такого диапазона — чем точнее наши требования, тем меньше вероятности, что нам повезет.

Во-вторых, от того, насколько «популярен» выбранный нами рост. Напомним, что мода — самое часто встречающееся значение роста. Кстати для нормального распределения мода, медиана и среднее значение совпадают. Кривая нормального распределения симметрична относительно среднего значения.

И, в-третьих, вероятность попадания роста в определенный диапазон зависит от характеристики рассеивания случайной величины. Отчасти это связано с единицами измерения (представьте, что мы бы измеряли людей в дюймах, а не в миллиметрах, но сами люди и их рост были бы теми же). Но дело не только в этом. Просто некоторые процессы кучнее группируются возле среднего значения, в то время как другие более разбросаны.

Например, рост собак и рост домашних кошек имеют разный разброс значений, их кривые нормального распределения будут выглядеть по-разному (напомним еще раз, что площадь под обеими кривыми будет единичной).

Так, кривая для роста кошек будет более узкой и высокой, а для роста собак кривая будет ниже и шире. Для характеристики разброса конечного ряда данных в прошлом разделе мы использовали величину среднего квадратического отклонения. Аналогичная величина используется для характеристики кривой нормального распределения. Она обозначается буквой s и называется в этом случае стандартным отклонением. Это очень важная величина для кривой нормального распределения. Кривая нормального распределения полностью задана, если известно среднее значение Нормальный закон распределения - определение и вычисление с примерами решения и отклонение s. Кроме того, любой житель города с вероятностью 68% попадет в диапазон роста Нормальный закон распределения - определение и вычисление с примерами решения с вероятностью 95% — в диапазон Нормальный закон распределения - определение и вычисление с примерами решенияНормальный закон распределения - определение и вычисление с примерами решения и с вероятностью 99,7% — в диапазон Нормальный закон распределения - определение и вычисление с примерами решения

Нормальный закон распределения - определение и вычисление с примерами решения

Для вычисления других значений вероятности, которые могут Вам понадобиться, можно воспользоваться приведенной таблицей:

Таблица вероятности попадания случайной величины в отмеченный (заштрихованный) диапазон

Нормальный закон распределения - определение и вычисление с примерами решения

Нормальный закон распределения

Нормальный закон распределения случайных величин, который иногда называют законом Гаусса или законом ошибок, занимает особое положение в теории вероятностей, так как 95 % изученных случайных величин подчиняются этому закону. Природа этих случайных величин такова, что их значение в проводимом эксперименте связано с проявлением огромного числа взаимно независимых случайных факторов, действие каждого из которых составляет малую долю их совокупного действия. Например, длина детали, изготавливаемой на станке с программным управлением, зависит от случайных колебаний резца в момент отрезания, от веса и толщины детали, ее формы и температуры, а также от других случайных факторов. По нормальному закону распределения изменяются рост и вес мужчин и женщин, дальность выстрела из орудия, ошибки различных измерений и другие случайные величины.

Определение: Случайная величина X называется нормальной, если она подчиняется нормальному закону распределения, т.е. ее плотность распределения задается формулойНормальный закон распределения - определение и вычисление с примерами решения — средне-квадратичное отклонение, a m = М[Х] — математическое ожидание.

Приведенная дифференциальная функция распределения удовлетворяет всем свойствам плотности вероятности, проверим, например, свойство 4.:

Нормальный закон распределения - определение и вычисление с примерами решения

Выясним геометрический смысл параметров Нормальный закон распределения - определение и вычисление с примерами решения Зафиксируем параметр Нормальный закон распределения - определение и вычисление с примерами решения и будем изменять параметр m. Построим графики соответствующих кривых (Рис. 8). Нормальный закон распределения - определение и вычисление с примерами решения

Рис. 8. Изменение графика плотности вероятности в зависимости от изменения математического ожидания при фиксированном значении средне-квадратичного отклонения. Из рисунка видно, кривая Нормальный закон распределения - определение и вычисление с примерами решения получается путем смещения кривой Нормальный закон распределения - определение и вычисление с примерами решения вдоль оси абсцисс на величину m, поэтому параметр m определяет центр тяжести данного распределения. Кроме того, из рисунка видно, что функция Нормальный закон распределения - определение и вычисление с примерами решения достигает своего максимального значения в точке Нормальный закон распределения - определение и вычисление с примерами решения Из этой формулы видно, что при уменьшении параметра Нормальный закон распределения - определение и вычисление с примерами решения значение максимума возрастает. Так как площадь под кривой плотности распределения всегда равна 1, то с уменьшением параметра Нормальный закон распределения - определение и вычисление с примерами решения кривая вытягивается вдоль оси ординат, а с увеличением параметра Нормальный закон распределения - определение и вычисление с примерами решения кривая прижимается к оси абсцисс. Построим график нормальной плотности распределения при m = 0 и разных значениях параметра Нормальный закон распределения - определение и вычисление с примерами решения (Рис. 9): Нормальный закон распределения - определение и вычисление с примерами решения

Рис. 9. Изменение графика плотности вероятности в зависимости от изменения средне-квадратичного отклонения при фиксированном значении математического ожидания.

Интегральная функция нормального распределения имеет вид: Нормальный закон распределения - определение и вычисление с примерами решения

График функции распределения имеет вид (Рис. 10): Нормальный закон распределения - определение и вычисление с примерами решения

Рис. 10. Графика интегральной функции распределения нормальной случайной величины.

Вероятность попадания нормальной случайной величины в заданный интервал

Пусть требуется определить вероятность того, что нормальная случайная величина попадает в интервал Нормальный закон распределения - определение и вычисление с примерами решения Согласно определениюНормальный закон распределения - определение и вычисление с примерами решения пересчитаем пределы интегрирования Нормальный закон распределения - определение и вычисление с примерами решения Нормальный закон распределения - определение и вычисление с примерами решения Следовательно,Нормальный закон распределения - определение и вычисление с примерами решения

Рассмотрим основные свойства функции Лапласа Ф(х):

  1. Ф(0) = 0 — график функции Лапласа проходит через начало координат.
  2. Ф (-х) = — Ф(х) — функция Лапласа является нечетной функцией, поэтому
  3. таблицы для функции Лапласа приведены только для неотрицательных значений аргумента.
  4. Нормальный закон распределения - определение и вычисление с примерами решения — график функции Лапласа имеет горизонтальные асимптотыНормальный закон распределения - определение и вычисление с примерами решения

Следовательно, график функции Лапласа имеет вид (Рис. 11): Нормальный закон распределения - определение и вычисление с примерами решения

Рис. 11. График функции Лапласа.

Пример №1

Закон распределения нормальной случайной величины X имеет вид: Нормальный закон распределения - определение и вычисление с примерами решения Определить вероятность попадания случайной величины X в интервал (-1;8).

Решение:

Согласно условиям задачи Нормальный закон распределения - определение и вычисление с примерами решения Поэтому искомая вероятность равна: Нормальный закон распределения - определение и вычисление с примерами решения 0,4772 + 0,3413 = 0,8185.

Вычисление вероятности заданного отклонения

Вычисление вероятности заданного отклонения. Правило Нормальный закон распределения - определение и вычисление с примерами решения.

Если интервал, в который попадает нормальная случайная величина X, симметричен относительно математического ожидания Нормальный закон распределения - определение и вычисление с примерами решения то, используя свойство нечетности функции Лапласа, получим

Нормальный закон распределения - определение и вычисление с примерами решения

Данная формула показывает, что отклонение случайной величины Х от ее математического ожидания на заданную величину l равна удвоенному значению функции Лапласа от отношения / к среднему квадратичному отклонению. Если положить Нормальный закон распределения - определение и вычисление с примерами решенияслучаях нормальная случайная величина X отличается от своего математического ожидания на величину равную среднему квадратичному отклонению. Если Нормальный закон распределения - определение и вычисление с примерами решения то вероятность отклонения равна Нормальный закон распределения - определение и вычисление с примерами решения Наконец, в случае Нормальный закон распределения - определение и вычисление с примерами решения то вероятность отклонения равна Нормальный закон распределения - определение и вычисление с примерами решения

Нормальный закон распределения - определение и вычисление с примерами решения Из последнего равенства видно, что только приблизительно в 0.3 % случаях отклонение нормальной случайной величины X от своего математического ожидания превышает Нормальный закон распределения - определение и вычисление с примерами решения Это свойство нормальной случайной величины X называется правилом “трех сигм”. На практике это правило применяется следующим образом: если отклонение случайной величины X от своего математического ожидания не превышает Нормальный закон распределения - определение и вычисление с примерами решения то эта случайная величина распределена по нормальному закону.

Показательный закон распределения

Определение: Закон распределения, определяемый фу нкцией распределения:

Нормальный закон распределения - определение и вычисление с примерами решения называется экспоненциальным или показательным.

График экспоненциального закона распределения имеет вид (Рис. 12): Нормальный закон распределения - определение и вычисление с примерами решения

Рис. 12. График функции распределения для случая экспоненциального закона.

Дифференциальная функция распределения (плотность вероятности) имеет вид: Нормальный закон распределения - определение и вычисление с примерами решения а ее график показан на (Рис. 13): Нормальный закон распределения - определение и вычисление с примерами решения

Рис. 13. График плотности вероятности для случая экспоненциального закона.

Пример №2

Случайная величина X подчиняется дифференциальной функции распределения Нормальный закон распределения - определение и вычисление с примерами решения Найти вероятность того, что случайная величина X попадет в интервал (2; 4), математическое ожидание M[Х], дисперсию D[X] и среднее квадратичное отклонение Нормальный закон распределения - определение и вычисление с примерами решения Проверить выполнение правила “трех сигм” для показательного распределения.

Решение:

Интегральная функция распределения Нормальный закон распределения - определение и вычисление с примерами решения следовательно, вероятность того, что случайная величина X попадет в интервал (2; 4), равна: Нормальный закон распределения - определение и вычисление с примерами решения Математическое ожидание Нормальный закон распределения - определение и вычисление с примерами решения Вычислим значение величины МНормальный закон распределения - определение и вычисление с примерами решения тогда дисперсия случайной величины X равна Нормальный закон распределения - определение и вычисление с примерами решения а средне-квадратичное

отклонение Нормальный закон распределения - определение и вычисление с примерами решения Для проверки правила “трех сигм” вычислим вероятность заданного отклонения:

Нормальный закон распределения - определение и вычисление с примерами решения

  • Основные законы распределения вероятностей
  • Асимптотика схемы независимых испытаний
  • Функции случайных величин
  • Центральная предельная теорема
  • Повторные независимые испытания
  • Простейший (пуассоновский) поток событий
  • Случайные величины
  • Числовые характеристики случайных величин

Итак, предположив,
что в модели наблюдений

ошибки
независимые случайные величины,
имеющие одинаковое распределение
(i.
i. d
), мы должны сделать и
предположение о том,каким именноявляется это распределение.

Классические
методы статистического анализа линейных
моделей наблюдений предполагают, что
таковым является распределение
Гаусса
(Gaussian distribution),
функция плотности которого имеет вид

График указанной
функции плотности имеет колоколообразную
форму

Параметр
характеризует степень рассредоточения
распределения вдоль оси абсцисс. На
диаграмме представлены графики функций
плотности гауссовского распределения
при трех различных значениях параметра.
Из трех представленных функций наибольшее
значение в нуле имеет функция плотности
с,
наименьшее — функция плотности с,
а промежуточное между ними — функция
плотности с.
Эти значения равны, соответственно,

Гауссовское
распределение симметрично относительно
нуля
, и это предполагает, чтоположительные ошибки столь же вероятны,
как и отрицательные
; при этом, малые
ошибки встречаются чаще, чем большие
.
Если случайная ошибка имеет гауссовское
распределение с параметром,
тос вероятностью ее значение будет заключено в пределах
от

до
.
Соответственно, для трех рассмотренных
случаев получаем: с вероятностьюзначение случайной ошибки заключено в
интервале

—при
,
при,
при.

Хотя гауссовское
распределение довольно часто вполне
приемлемо для описания случайных ошибок
в моделях наблюдений, оно вовсе не
является универсальным. Такое распределение
характерно для ситуаций, когда
результирующая ошибка является следствием
сложения большого количества независимых
случайных ошибок, каждая из которых
достаточно мала.

Мы будем далее в
этом параграфе предполагать, что процесс
порождения данных
(ППД,
или DGP- data generating process)устроен
следующим образом. Значенияизвестны точнои рассматриваются
какзаданные, а значенияполучаютсяналожениемна значенияслучайных ошибок.

В этом контексте,
рассматриваются как некоторыепостоянные(хотя ине известныенаблюдателю).
Напротив, значенияносятслучайныйхарактер, определяемый
случайным характером значений.
Собственно,отличается от случайной величинылишьсдвигом на постоянную ,
и потому также является случайной
величиной
. Мы будем обозначать ее в
этом качестве как случайную величину.
Функция распределения этой случайной
величины имеет вид

где
— функция распределения случайной
величины(одинаковаядля всех).
Соответственно, функция плотности
распределения случайной величиныимеет вид

где
— функция плотности распределения
случайной величины.

Таким образом,
случайные величины
хотя и являются взаимно независимыми
(в силу предполагаемой взаимной
независимости случайных величин),
но имеютразные распределения,отличающиеся сдвигом. На следующем
рисунке представлены графики функции
плотностираспределения(гауссовское распределение с параметром)
и функции плотностираспределения случайной величиныпри значении.

Заметим, что если
случайная ошибка
имеетгауссовское распределение с
плотностью

то отличающаяся
от нее сдвигом случайная величина
имеет функцию плотности

Эта функция
плотности принадлежит двухпараметрическому
семейству функций плотности вида

Функции
плотности такого вида называются
нормальными плотностями, а
определяемые ими распределения
вероятностей называютсянормальными
распределениями вероятностей
. Если
некоторая случайная величинаимеет плотность распределения, заданную
последним соотношением, то говорят, чтослучайная величина Y имеет нормальное
распределение с параметрами

и
2.
Распределение такой случайной величины
симметрично относительно своегосреднего
значения.
Максимальное значение функции плотности
этой случайной величины достигается
при.

Таким образом,
строго говоря, гауссовское распределение
— это нормальное распределение с нулевым
средним значением.
Однако, в современной
научной литературе терминынормальное
распределение
игауссовское
распределение
используются как
синонимы
:нормальное распределение
с параметрами

и
называют
такжегауссовским распределением
с параметрами

и
2.

Важнейшая роль
предположения о нормальном (гауссовском)
распределении ошибок в линейной модели
наблюдений

определяется тем
обстоятельством, что при добавлении
такого предположения к стандартному
предположению
о том, что ошибкинезависимые случайные величины,
имеющие одинаковое распределение
,
можно легко найти точный вид распределения
оценок наименьших квадратов для
неизвестных значений параметров модели.

Вспомним, в этой
связи, полученное ранее выражение

Обозначая

мы можем записать
выражение для
в виде

где

Таким образом,

где
фиксированные величины, анаблюдаемые значения случайных
величин
.
Поэтомувычисленноепо последней
формуле значениеявляетсянаблюдаемым значением
случайной величины

которая является
линейной комбинацией случайных величини имеет некоторое распределение
вероятностей, зависящее от распределения
последних.

В общем случае,
аналитическое описание распределения
как случайной величины довольно
затруднительно. Более просто эта задача
решается в ситуации, когдаимеетгауссовскоераспределение.
Если ошибкинезависимые случайные величины,
имеющие одинаковое нормальное
распределение с нулевым средним
, то
тогда оценка наименьших квадратовпараметратакже имеет нормальное распределение.
Чтобы указать параметры этого нормального
распределения и иметь возможность
проводить статистический анализ
подобранной модели линейной связи между
переменными факторами, нам придется
уделить внимание некоторым важным
числовым характеристикам случайных
величин и их свойствам.

НОРМА́ЛЬНОЕ РАСПРЕДЕЛЕ́НИЕ (рас­пре­де­ле­ние Га­ус­са), од­но из важ­ней­ших рас­пре­де­ле­ний ве­ро­ят­но­стей. Рас­пре­деле­ние ве­ро­ят­но­стей дей­ст­ви­тель­ной слу­чай­ной ве­ли­чи­ны $X $ на­зы­ва­ет­ся нор­маль­ным, ес­ли оно име­ет плот­ность ве­ро­ят­но­сти$$p(x; a, sigma)=frac{1}{sqrt {2pi sigma}}e^{-(x-a)^2/(2sigma^2)}$$ $$-infty(*)где $a$ – дей­ст­ви­тель­ное чис­ло и $σ>0$, т. е. Н. р. се­мей­ст­ва (*) за­ви­сят от двух па­ра­мет­ров – $a$ и $σ$ . Ма­те­ма­ти­че­ское ожи­да­ние X сов­па­да­ет с $a$, дис­пер­сия X рав­на $σ^2$, а ха­рак­те­ри­сти­че­ская функ­ция име­ет вид$$f(t)=e^{iat-sigma^2t^2/2}.$$

Гра­фик плот­но­сти (рис.) Н. р. $p (x; a, σ$) сим­мет­ри­чен от­но­си­тель­но пря­мой $x=a$, и при $x=a$  эта плот­ность име­ет един­ствен­ный мак­си­мум, рав­ный $1/sqrt{2 pi sigma}$. С умень­ше­ни­ем $σ$ гра­фик Н. р. ста­но­вит­ся всё бо­лее ост­ро­вер­шин­ным. Из­ме­не­ние $a$ при по­сто­ян­ном σ не ме­ня­ет фор­му гра­фи­ка, а вы­зы­ва­ет лишь его сме­ще­ние по оси абс­цисс. Пло­щадь, за­клю­чён­ная ме­ж­ду гра­фи­ком Н. р. и осью абс­цисс, все­гда рав­на еди­ни­це. При $a=0$ и $σ=1$ Н. р. на­зы­ва­ет­ся стан­дарт­ным нор­маль­ным, со­от­вет­ст­вую­щая функ­ция рас­пре­де­ле­ния есть $$Ф(x)=frac{1}{sqrt{2 pi}} int_{-infty} ^{x} e^{-u^2/2} du, — infty $$

В об­щем слу­чае функ­ция рас­пре­де­ле­ния Н. р. $F(x; a, σ)$ мо­жет быть вы­чис­ле­на по фор­му­ле $F(x; a, σ)=Φ((x-a)/σ)$. Для функ­ции $Φ (x)$ и не­сколь­ких её про­из­вод­ных со­став­ле­ны об­шир­ные таб­ли­цы. Для Н. р. ве­ро­ят­ность не­ра­вен­ст­ва $|X-a|>kσ$, рав­ная $1-Φ(k)+Φ(-k)$, с рос­том $k $ убы­ва­ет весь­ма бы­ст­ро.

k        ве­ро­ят­ность
1 0,31731
2 0,45500·10–1
3 0,26998·10–2
4 0,63342·10–4

Во мно­гих прак­тич. во­про­сах при рас­смот­ре­нии Н. р. пре­неб­ре­га­ют воз­мож­но­стью от­кло­не­ний $X $ от $a$, пре­вы­шаю­щих $3σ$ , – т. н. пра­ви­ло трёх сиг­ма (со­от­вет­ст­вую­щая ве­ро­ят­ность мень­ше 0,003). Сумма независимых случайных величин $X_1, X_2,…, X_n$, имеющих Н. р. с параметрами $ mathbf EXi=ai, DXi=, i=1,…, n,$ нормально распределена с параметрами $a=a_1+a_2+dots +a_n и sigma^2=sigma^2_{1}+dots+sigma^2_{n}.$

Спра­вед­ли­во и об­рат­ное: ес­ли сум­ма $n$ не­за­ви­си­мых слу­чай­ных ве­ли­чин нор­мально распределена, то и ка­ж­дая из них име­ет Н. р., а па­ра­мет­ры этих Н. р. свя­за­ны ука­зан­ны­ми ра­вен­ст­ва­ми; это сле­ду­ет из од­ной тео­ре­мы, до­ка­зан­ной $Х$Кра­ме­ром.

Н. р. встре­ча­ет­ся в боль­шом чис­ле при­ло­же­ний. Тео­ре­тич. обос­но­ва­ние ис­клю­чит. ро­ли Н. р. дают пре­дель­ные тео­ре­мы тео­рии ве­ро­ят­но­стей, в ча­ст­но­сти цен­траль­ная пре­дель­ная тео­ре­ма. Ка­че­ст­вен­но это мо­жет быть объ­яс­не­но сле­дую­щим об­ра­зом: Н. р. слу­жит хо­ро­шим при­бли­же­ни­ем ка­ж­дый раз, ко­гда рас­смат­ри­вае­мая слу­чай­ная ве­ли­чи­на пред­став­ля­ет со­бой сум­му боль­шо­го чис­ла не­за­ви­си­мых слу­чай­ных ве­ли­чин, мак­си­маль­ная из ко­то­рых ма­ла по срав­не­нию со всей сум­мой.

Н. р. может так­же по­яв­лять­ся как точ­ное ре­ше­ние не­ко­то­рых за­дач (в рам­ках при­ня­той ма­те­ма­тич. мо­де­ли яв­ле­ния). Так об­сто­ит де­ло в тео­рии слу­чай­ных про­цес­сов (в од­ной из осн. мо­де­лей бро­унов­ско­го дви­же­ния). Клас­сич. при­ме­ры воз­ник­но­ве­ния Н. р. как точ­но­го при­над­ле­жат К. Га­ус­су (за­кон рас­пре­де­ле­ния оши­бок на­блю­де­ния) и Дж. К. Макс­вел­лу (за­кон рас­пре­де­ле­ния ско­ро­стей мо­ле­кул).

Со­вме­ст­ное рас­пре­де­ле­ние не­сколь­ких слу­чай­ных ве­ли­чин $X_1, X_2, …, X_s$ на­зы­ва­ет­ся мно­го­мер­ным нор­маль­ным, ес­ли при лю­бых дей­ст­ви­тель­ных $t_1, t_2, …, t_s $ слу­чай­ная ве­ли­чи­на $t_1X_1+t_2X_2+ …+t_sX_s $ име­ет Н. р. или рав­на по­сто­ян­ной. Ес­ли она ни при ка­ких $t_1, t_2, …, t_s$ не рав­на по­сто­ян­ной, то со­вме­ст­ное рас­пре­де­ле­ние $X_1, X_2, …, X_s $ име­ет плот­ность ви­да$$p(x_1, x_2, dots, x_s)=Cquad exp big(-sum_{k,l=1}^sq_{k,l}(x_k-a_k)(x_1-a_1)big), $$

где сум­ма яв­ля­ет­ся по­ло­жи­тель­но оп­реде­лён­ной квад­ра­тич­ной фор­мой, $a_1, a_2, …, a_s$ рав­ны ма­те­ма­тич. ожи­да­ни­ям $X_1, X_2, …, X_s$ со­от­вет­ст­вен­но, ко­эф­фи­ци­ен­ты $C$ и $q_{kl}=q_{lk}$ мо­гут быть вы­ра­же­ны че­рез дис­пер­сии $X_1, X_2, …, X_s$ и ко­эф­фи­ци­ен­ты кор­ре­ля­ции $ρ_{kl}$ ме­ж­ду $X_k$ и $X_l$. Напр., дву­мер­ное Н. р. име­ет плот­ность $$p(x,y)=Сquad exp big(-frac{1}{2(1-p^2)}times big[-frac{(x-a_1)^2}{sigma_1^2}+frac{(y-a_2)^2}{sigma_2^2}-frac{2p(x-a_1)(y-a_2)}{sigma_1 sigma_2}big] big),$$где$$C=big(2 pi sigma_1 sigma_2 sqrt {1-p^2}big)^{-1},$$$a_1, a_2$ и $sigma^2_1, sigma^2_2$ – ма­те­ма­тич. ожи­да­ния и дис­пер­сии ве­ли­чин $X$ и $Y, ρ$ – ко­эф. кор­ре­ля­ции ме­ж­ду $X$ и $Y$:$$p[=frac{Ἕ[(X-a_1)(Y-a_2)]}{sigma_1 sigma_2}$$

Об­щее ко­ли­че­ст­во па­ра­мет­ров, за­даю­щих мно­го­мер­ное Н. р., рав­но $frac{(s+1)(s+2)}{2}-1$

и бы­ст­ро рас­тёт с уве­ли­че­ни­ем $s$ (рав­но 20 при $s=5 $ и 65 при $s=10$). Мно­го­мер­ное Н. р. слу­жит осн. мо­де­лью мно­го­мер­но­го ста­ти­стич. ана­ли­за. Оно ис­поль­зу­ет­ся так­же в тео­рии слу­чай­ных про­цес­сов (где рас­смат­ри­ва­ют так­же Н. р. в бес­ко­неч­но­мер­ных про­стран­ст­вах).

О во­про­сах, свя­зан­ных с оцен­кой па­ра­мет­ров Н. р. по ре­зуль­та­там на­блю­де­ний, см. в ст. Не­сме­щён­ная оцен­ка. Тер­мин «Н. р.» при­над­ле­жит К. Пир­со­ну.

Предлагаю вашему вниманию адаптированный перевод главы книги OnlineStatBook посвященной нормальным распределениям.

Вводный раздел определяет, что значит для распределения быть нормальным и представляет некоторые важные свойства нормального распределения. Интересная история открытия нормального распределения описана во втором разделе. Методы вычисления вероятностей, основанные на нормальном распределении, описаны в разделе «Области нормального распределения». «Разновидности нормального распределения» позволяет вам вводить значения среднего и стандартного отклонения нормального распределения и строить графики получившегося распределения. Часто используемое нормальное распределение, называемое стандартным нормальным распределением, описывается в одноименном разделе. Биномиальное распределение может быть аппроксимировано нормальным. Раздел «Нормальное приближение к биномиальному распределению» показывает это приближение. Демонстрация аппроксимации нормальным распределением позволяет вам исследовать точность этого приближения.

Введение

Нормальное распределение является наиболее важным и широко используемым распределением в статистике. Его иногда называют «колоколообразной кривой», хотя музыкальные качества такого колокола были бы не так приятны. Также его называют «распределением Гаусса» в честь математика Карла Фридриха Гаусса. Как вы увидите в разделе об истории нормального распределения, хотя Гаусс играл в ней важную роль, впервые обнаружил нормальное распределение Абрахам де Муавр.

Строго говоря, некорректно говорить о «нормальном распределении» поскольку существует много нормальных распределений. Нормальные распределения могут отличаться своими средними и стандартными отклонениями. На рис. 1 три нормальных распределения. У зеленого (самого левого) среднее равно -3, а стандартное отклонение 0.5, у красного распределения (посередине) среднее равно 0, а стандартное отклонение 1, и у черного распределение (справа) среднее равно 2 а стандартное отклонение 3. Эти, как и все другие нормальные распределения являются симметричными с относительно большими значениями в центре распределения и меньшими значениями в хвостах.

Рисунок 1. Нормальные распределения отличаются средним и стандартным отклонением

Плотность нормального распределения (высота для данного значения на оси x) показана ниже. Нормальное распределение определяется параметрами (mu) и (sigma) являющимися средним и стандартным отклонением соответственно. Символ (e) это основание натурального логарифма, а (pi) это константа пи.

$$
frac{1}{sqrt{2pisigma^2}} e^{frac{-(x-mu)^2}{2sigma^2}}
$$

Поскольку мы не будем углубляться в математическую трактовку статистики, не беспокойтесь, если это выражение вас смущает. Мы не будем возвращаться к нему в следующих разделах.

Семь свойств нормального распределения указаны ниже. Эти свойства будут более подробно проиллюстрированы в следующих разделах этой главы.

  1. Нормальные распределения симметричны относительно своих средних.
  2. Среднее значение, мода и медиана нормального распределения совпадают.
  3. Площадь под нормальным распределением равна 1.
  4. Нормальные распределения плотнее в центре и менее плотны в хвостах.
  5. Нормальные распределения определяются двумя параметрами: среднее (m) и стандартное отклонение (s).
  6. 68% площади нормального распределения находится в пределах одного стандартного отклонения от среднего.
  7. Примерно 95% площади нормального распределения находится в пределах двух стандартных отклонений от среднего.

История нормального распределения

В главе посвященной вероятности мы увидели, что биномиальное распределение можно использовать для таких проблем, как: «Если подбросить честную монету 100 раз, какова вероятность выпадения 60 и более орлов?» Вероятность выпадения ровно x орлов за N подбрасываний рассчитывается по формуле:

$$
P(X) = frac{N!}{x!(N-x!)}p^x(1-p)^{N-x}
$$

Где (x) это число орлов (60), (N) – количество подбрасываний монеты (100), а (p) это вероятность выпадения орла (0.5). Таким образом, чтобы решить эту проблему вам нужно вычислить вероятность 60 орлов, затем вероятность 61 орла, 62 и т.д. и сложить эти вероятности. Представьте, сколько времени потребовалось бы для вычисления биномиальных вероятностей до появления калькуляторов и компьютеров.

Абрахам де Муавр, статистик 18-го века и консультант азартных игроков, часто привлекался к проведению этих длительных вычислений. Де Муавр заметил, что, когда число событий (подбрасываний монет) увеличивается, форма биномиального распределения приближается к очень плавной кривой. Биномиальное распределение для 2, 4 и 12 подбрасываний показаны на рис. 2.

Рисунок 2. Примеры биномиальных распределений. Высоты синих столбцов являются вероятностями

Де Муавр рассуждал, что, если бы он мог найти математическое выражение для этой кривой, он мог бы гораздо легче решать такие проблемы, как нахождение вероятности 60 и более орлов из 100 бросков монет. В точности это он и сделал, и кривая, которую он открыл, теперь называется «нормальной кривой».

Рисунок 3. Нормальное приближение биномиального распределения для 12 бросков монет. Гладкая кривая – это нормальное распределение. Обратите внимание, насколько хорошо она аппроксимирует биномиальные вероятности представленные высотой синих линий.

Важность нормальной кривой обусловлена тем, что распределения многих природных явлений, по крайней мере приблизительно, нормально распределены. Одно из первых применений нормального распределения было к анализу ошибок измерений, сделанных при астрономических наблюдениях, ошибок произошедших из-за несовершенства инструментов и наблюдателей. Галилео в 17 веке отметил, что эти ошибки были симметричными и что небольшие ошибки возникали чаще, чем большие. Это привело к нескольким гипотезам о распределении ошибок, но только в начале 19-го века было установлено, что эти ошибки соответствуют нормальному распределению. Независимо друг от друга математики Адрейн в 1808 г. и Гаусс в 1809 г. разработали формулу для нормального распределения и показали, что ошибки хорошо соответствуют этому распределению.

Это же распределение было обнаружено Лапласом в 1778 г., когда он вывел чрезвычайно важную центральную предельную теорему, тему одного из следующих разделов. Лаплас показал, что даже если распределение не является нормальным, средние повторяющихся выборок из распределения будут распределены почти нормально, и чем больше размер выборки, тем ближе к нормальному будет распределение средних.

Большинство статистических процедур для проверки между средними значениями предполагают нормальное распределение. Поскольку распределение средних близко к нормальному, эти тесты работают хорошо даже если само распределение только приблизительно нормально. Кетле был первым, кто применил нормальное распределение к человеческим характеристикам. Он отметил, что такие характеристики, как рост, вес и сила были нормально распределены.

Площади нормального распределения

Площади под кусками нормального распределения могут быть вычислены с использованием математического анализа. Поскольку это нематематический подход к статистике, мы будем полагаться на компьютерные программы и таблицы для определения этих областей. На рис. 4 показано нормальное распределение со средним значением 50 и стандартным отклонением 10. Затененная область между 40 и 60 содержит 68% распределения.

Рисунок 4. Нормальное распределение со средним значением 50 и стандартным отклонением 10. 68% площади находится в пределах одного стандартного отклонения (10) от среднего (50).

На рис. 5 изображено нормальное распределение со средним равным 100 и стандартным отклонением 20. Как и на рис. 4, 68% распределения лежит в пределах одного стандартного отклонения от среднего.

Рисунок 5. Нормальное распределение со средним значением 100 и стандартным отклонением 20. 68% площади находится в пределах одного стандартного отклонения (20) от среднего (100).

Нормальные распределения показанные на рис. 4 и 5 это частные случаи общего правила о том, что 68% площади любого стандартного распределения находится в пределах одного стандартного отклонения от среднего.

На рис. 6 изображено нормальное распределение со средним 75 и стандартным отклонением 10. Закрашенная область содержит 95% площади и находится между 55.4 и 94.6. Для всех нормальных распределений 95% площади находится в пределах 1.96 стандартного отклонения. Для быстрых приближений иногда полезно округлять и использовать 2 вместо 1.96, в качестве числа стандартных отклонений, на которые вам нужно отступить от среднего, чтобы охватить 95% площади.

Рис. 6. Нормальное распределение со средним 75 и стандартным отклонением 10. 95% площади находятся в пределах 1.96 нормального распределения.

Для вычисления площадей под нормальным распределением может быть использован следующий нормальный калькулятор. Например, вы можете использовать его, чтобы найти пропорцию части нормального распределения со средним 90 и стандартным отклонением 12, которая больше 100. Установите среднее равным 90, стандартное отклонение – 12. Затем введите 110 в ячейку справа от кнопки «Above». Внизу экрана вы увидите, что закрашенная область равна 0.0478. Посмотрите сможете ли вы использовать калькулятор, чтобы узнать, что площадь между 115 и 120 равна 0.0124.

Рисунок 7. Изображение калькулятора показывающего площадь над 110.

Скажем, вы хотите найти оценку, соответствующую 75-му перцентилю нормального распределения со средним значением 90 и стандартным отклонением 12. Используя обратный нормальный калькулятор, введите параметры, как показано на рис. 8, и обнаружьте, что площадь ниже 98.09 равна 0.75.

Рисунок 8. Изображение калькулятора показывающего, что 75-ая перцентиль равна 98.09

Стандартное нормальное распределение

Как обсуждалось во вводном разделе, у нормальных распределений не обязательно одинаковые средние и стандартные отклонения. Нормальное распределение со средним равным 0 и стандартным отклонением 1 называется стандартным нормальным распределением.

Области нормального распределения часто представлены таблицами стандартного нормального распределения. Часть таблицы стандартного нормального распределения показана в таблице 9.

Z Площадь под
-2.5 0.0062
-2.49 0.0064
-2.48 0.0066
-2.47 0.0068
-2.46 0.0069
-2.45 0.0071
-2.44 0.0073
-2.43 0.0075
-2.42 0.0078
-2.41 0.008
-2.4 0.0082
-2.39 0.0084
-2.38 0.0087
-2.37 0.0089
-2.36 0.0091
-2.35 0.0094
-2.34 0.0096
-2.33 0.0099
-2.32 0.0102
Таблица 9. Часть таблицы стандартного нормального распределения.

Первый столбец «Z» содержит значения стандартного нормального отклонения; второй столбец показывает значение площади левее Z. Поскольку среднее распределения равно нулю, а стандартное отклонение 1, в столбец Z равен числу стандартных отклонений левее (или правее) среднего значения. Например, Z равное -2.5 представляет значение равное 2.5 стандартных отклонений левее среднего. Площадь левее Z равна 0.0062.

Ту же информацию можно получить с помощью следующего калькулятора. На рис. 10 показано, как его можно использовать для вычисления площади левее значения -2,5 для стандартного нормального распределения. Обратите внимание, что среднее значение установлено на 0, а стандартное отклонение установлено на 1.

Рисунок 10. Пример работы калькулятора

Значение из любого нормального распределения может быть преобразовано в соответствующее значение в стандартном нормальном распределении при помощи следующей формулы:

$$
Z = frac{(X-mu)}{sigma}
$$

где (Z) это значение стандартного нормального распределения, (X) – значение исходного распределения, (mu) — среднее исходного распределения, а (sigma) — стандартное отклонение исходного распределения.

В качестве простого упражнения, какая часть нормального распределения со средним значением 50 и стандартным отклонением 10 меньше 26? Применяя формулу, получаем:

$$
Z = (26 – 50)/10 = -2.4
$$

Из таблицы 9, мы знаем, что 0.0082 распределения левее -2.4. Нет необходимости преобразовывать значение к (Z) если вы используете апплет как показано на рис. 11.

Рисунок 11. Площадь левее 26 в нормальном распределении со средним 50 и стандартным отклонением 10.

Если все значения распределения преобразовать в (Z) значения, то у распределения будет среднее 0 и стандартное отклонение 1. Процесс преобразования распределения к стандартному со средним 0 и отклонением 1 называется стандартизацией распределения.

Приближение биномиального распределения нормальным

В разделе об истории нормального распределения мы видели, что нормальное распределение можно использовать для аппроксимации биномиального распределения. В этом разделе показывается, как рассчитать эти приближения.

Давайте начнем с примера. Пусть у вас есть честная монета, и вы хотите знать вероятность выпадения 8 орлов за 10 бросков. У биномиального распределения есть среднее равное

(mu = Np = 10*0.5 = 5) и дисперсия (sigma^2 = Np(1-p) = 10*0.5*05 = 2.5). Стандартное отклонение при этом равно 1.5811. Результат 8 орлов равен ((8 — 5)/1.5811 = 1.897) стандартных отклонений правее среднего распределения. «Какова вероятность получения значения в точности равного 1.897 стандартных отклонений правее среднего?» Вы можете удивиться, но ответ равен 0. Вероятность любой отдельной точки равна 0. Проблема в том, что биномиальное распределение является дискретным вероятностным распределением, тогда как нормальное распределение непрерывно.

Решение состоит в том, чтобы округлить и рассмотреть все значения от 7.5 до 8.5, для получения результат 8 орлов. Используя этот подход, мы вычисляем площадь под нормальной кривой от 7.5 до 8.5. Зона зеленого цвета на рис. 12 является приблизительной вероятностью получения 8 орлов.

Рисунок 12. Приближение вероятности 8 орлов нормальным распределением.

Решение состоит в том, чтобы вычислить эту площадь. Сначала мы вычисляем площадь левее 8.5, а затем вычитаем из нее площадь левее 7,5.

Результаты использования калькулятора площади нормального распределения для определения области ниже 8.5 показаны на рисунке 13. Результаты для 7.5 показаны на рисунке 14.

Рисунок 13. Площадь под 8.5
Рисунок 14. Площадь под 7.5

Разница между площадями составляет 0.044, что является приближением биномиальной вероятности. Для этих параметров приближение очень точное.

Если у вас не было калькулятора площади нормального распределения, вы могли бы найти решение с помощью таблицы стандартного нормального распределения (таблица 9) следующим образом:

  1. Найти значение (Z) для 8.5, используя формулу (Z = (8.5 — 5) / 1.5811 = 2.21).
  2. Найти площадь левее (Z) равного 2.21 (= 0,987).
  3. Найти значение (Z) для 7.5, используя формулу (Z = (7.5 — 5) / 1,5811 = 1.58).
  4. Найти площадь левее (Z) 1.58 (= 0.943).
  5. Вычесть значение на шаге 4 из значения на шаге 2, и получить 0.044.

Та же логика применяется при расчете вероятности диапазона результатов. Например, чтобы рассчитать вероятность от 8 до 10 подбрасываний, вычислите площадь от 7.5 до 10.5.

Точность аппроксимации зависит от значений (N) и (p). Эмпирическое правило заключается в том, что аппроксимация хороша, если оба значения (Np) и (N (1-p)) больше 10.

Статистическая грамотность

Анализ рисков часто основан на предположении о нормальном распределении. Критики говорят, что экстремальные явления в действительности происходят чаще, чем можно было бы ожидать, если бы они были нормальными. Предположение даже было названо «большим интеллектуальным мошенничеством».

Недавняя статья, в которой обсуждается, как защитить инвестиции от экстремальных явлений, названных «риск хвоста» и определяемых как «риск хвоста, или экстремальный шок для финансовых рынков, технически определяется как инвестиция, которая двигается на более трех стандартных отклонений от среднего значения нормального распределения возврата инвестиций.»

Риск хвоста можно оценить, предполагая нормальность распределение и вычисляя вероятность такого события. Так ли следует оценивать «риск хвоста»?

События более трех стандартных отклонений от среднего значения очень редки для нормальных распределений. Однако они не так редки для других распределений, например с сильным перекосом. Если нормальное распределение используется для оценки вероятности событий хвоста, определенных таким образом, то «риск хвоста» будет недооценен.

Понравилась статья? Поделить с друзьями:
  • Закон пяти ошибок
  • Закон ошибок наведения зур
  • Закон о кадастровой ошибке
  • Задания исправь ошибку 2 класс русский язык
  • Задания для работы над ошибками