Средняя квадратическая ошибка коэффициента асимметрии

58. Коэффициенты асимметрии и эксцесса.

Центральные
моменты распределения

Для дальнейшего изучения характера
вариации используются средние значения
разных степеней отклонений отдельных
величин признака от его средней
арифметической величины. Эти показатели
получили название центральных
моментов
распределения порядка,
соответствующего степени, в которую
возводятся отклонения,
или просто моментов.

Показатели формы распределения

  • Асимметрия – Коэффициент
    асимметрии

    характеризует асимметричность
    («скошенность») распределения признака
    в совокупности

  • Эксцесс – Показатель эксцесса


    представляет собой отклонение вершины
    эмпирического распределения вверх или
    вниз («крутость») от вершины кривой
    нормального распределения

Асимметрия распределения

  • При
    =0
    распределение считается нормальным.

  • При

    > 0 правосторонняя асимметрия.

  • При
    <0
    левосторонняя асимметрия.

  • Если асимметрия более 0,5, то независимо
    от знака она считается значительной

  • Если асимметрия меньше 0,25, то она
    считается незначительной

Асимметрия
распределения рассчитанная по формулам
К.Пирсона:

является
приблизительной

Расчет
асимметрии распределения при помощи
нормированного момента третьего
порядка дает наиболее точный результат

т.е.

— нормированный
момент третьего порядка

Показатель Пирсона зависит от степени
асимметричности в средней части ряда
распределения, а показатель асимметрии,
основанный на моменте третьего порядка,
— от крайних значений признака.

Оценка существенности асимметрии

Для оценки существенности асимметрии
вычисляют показатель средней квадратической
ошибки коэффициента асимметрии

Если отношение

имеет значение больше 2, то это
свидетельствует о существенном характере
асимметрии

Эксцесс распределения

Показатель эксцесса

представляет собой отклонение вершины
эмпирического распределения вверх или
вниз («крутость») от вершины кривой
нормального распределения, НО! График
распределения может выглядеть сколь
угодно крутым в зависимости от силы
вариации признака: чем слабее вариация,
тем круче кривая распределения при
данном масштабе. Не говоря уже о том,
что, изменяя масштабы по оси абсцисс и
по оси ординат, любое распределение
можно искусствен но сделать «крутым»
и «пологим». Чтобы показать, в чем состоит
эксцесс распределения, и правильно его
интерпретировать, нужно сравнить ряды
с одинаковой силой вариации (одной и
той же величиной σ) и разными показателями
эксцесса. Чтобы не смешать эксцесс с
асимметрией, все сравниваемые ряды
должны быть симметричными. Такое
сравнение изображено на рис.

Поскольку эксцесс нормального
распределения равен 3, показатель
эксцесса вычисляется по формуле

или

где

— нормированный момент четвертого
порядка

  • При
    >0
    – высоковершинный эксцесс распределения

  • При
    <0
    – низковершинный эксцесс распределение

  • При

    =0 – нормальное распределение

Оценка существенности эксцесса

Для оценки существенности эксцесса
вычисляют показатель его средней
квадратической ошибки

Если отношение

имеет значение больше 3, то это
свидетельствует о существенном характере
эксцесса


Подборка по базе: Романова_Е_А_практическая работа_1.docx, Контрольная работа по английскому языку 7 класс (_Rainbow Englis, Задача 26 сам работа экономика.doc, Практическая работа 7 Разработка руководства системного программ, Лабораторная работа №2_ТБбп2002гс_Терентьев С.П..docx, _Контрольная работа в 8 классе по теме _Системы счисления_ 8 кла, Практическая работа по математике.docx, Экология Лабораторная работа №1.docx, Курсовая работа по МДК 01.01.docx, Лабораторная работа № 2.docx


2. Структурные показатели.

Степень асимметрии.

Симметричным является распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой.

Наиболее точным и распространенным показателем асимметрии является моментный коэффициент асимметрии.

As = M3/s3

где M3 — центральный момент третьего порядка.

s — среднеквадратическое отклонение.

M3 = 1008417642929.4/45 = 22409280953.99

Положительная величина указывает на наличие правосторонней асимметрии

Оценка существенности показателя асимметрии дается с помощью средней квадратической ошибки коэффициента асимметрии:

Если выполняется соотношение |As|/sAs < 3, то асимметрия несущественная, ее наличие объясняется влиянием различных случайных обстоятельств. Если имеет место соотношение |As|/sAs > 3, то асимметрия существенная и распределение признака в генеральной совокупности не является симметричным.

Расчет центральных моментов проводим в аналитической таблице:

Таблица 7- Расчет центральных моментов

Группы Середина интервала, xцентр Кол-во, fi (x — xср)3*fi (x — xср)4*fi
10470 — 13325 11897,5 2 -591260259007,48 3.9387787587509E+15
13325 — 16180 14752,5 12 -661935683552,08 2.5197685020505E+15
16180 — 19035 17607,5 12 -10342745055,34 9842845710927,800
19035 — 21890 20462,5 11 75846797074,87 1.4436173709968E+14
21890 — 24745 23317,5 4 430947710649,96 2.0505928565123E+15
24745 — 27600 26172,5 4 1765161822819,40 1.3438765344411E+16
Итого 45 1008417642929,40 2.2102110044535E+16

В анализируемом ряду распределения наблюдается несущественная асимметрия (0.422/0.617 = 0.68<3)

Применяются также структурные показатели (коэффициенты) асимметрии, характеризующие асимметрию только в центральной части распределения, т.е. основной массы единиц, и независящие от крайних значений признака. Рассчитаем структурный коэффициент асимметрии Пирсона:

Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения.

Чаще всего эксцесс оценивается с помощью показателя:

Для распределений более островершинных (вытянутых), чем нормальное, показатель эксцесса положительный (Ex > 0), для более плосковершинных (сплюснутых) — отрицательный (Ex < 0), т.к. для нормального распределения M4/s4 = 3.

M4 = 2.2102110044535E+16/45 = 4.9115800098966E+14

Число 3 вычитается из отношения μ4/ σ4 потому, что для нормального закона распределения μ4/ σ4 = 3. Таким образом, для нормального распределения эксцесс равен нулю. Островершинные кривые обладают положительным эксцессом, кривые более плосковершинные — отрицательным эксцессом.

Ex < 0 — плосковершинное распределение

Чтобы оценить существенность эксцесса рассчитывают статистику Ex/sEx

где sEx — средняя квадратическая ошибка коэффициента эксцесса.

Если отношение Ex/sEx > 3, то отклонение от нормального распределения считается существенным.

Поскольку sEx < 3, то отклонение от нормального распределения считается не существенным.

Показатели вариации.

Абсолютные показатели вариации.

Размах вариации — разность между максимальным и минимальным значениями признака первичного ряда.

R = xmax — xmin = 27600 — 10470 = 17130 руб.

Среднее линейное отклонение — вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 3129.93

Дисперсия — характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Несмещенная оценка дисперсии — состоятельная оценка дисперсии (исправленная дисперсия).

Среднее квадратическое отклонение.

Каждое значение ряда отличается от среднего значения 18559.17 в среднем на 3758.782

Оценка среднеквадратического отклонения.

Относительные показатели вариации.

К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации — мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v ≤ 30%, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять.

Линейный коэффициент вариации или Относительное линейное отклонение — характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции — отражает относительную колеблемость крайних значений признака вокруг средней.

Рисунок 3- Гисторгамма распределения рабочих строительного треста по заработной плате за январь

Рисунок 4- Кумулята распределения рабочих строительного треста по заработной плате

Ручные расчеты дополним данными, полученными с помощью надстройки «Описательная статистика» пакета Microsoft Excel (Файл – параметры — надстройки – анализ данных – описательная статистика).

Рисунок 4 — Параметры инструмента Ecxel анализ данных «Описательная статистика»

Рисунок 5 — Результаты расчета инструмента Ecxel анализ данных «Описательная статистика»

Составим сравнительную таблицу

Таблица 4- Сравнительние расчетных параметров

Наименование параметра Ecxel

«Описательная статистика»

Расчетные данные Отклонение
Среднее 18631,77778 18559,17 -72,6078
Стандартная ошибка 616,4466675
Медиана 18000 18202,29 202,29
Мода 20100 16180 -3920
Стандартное отклонение 4135,249959 3758,782 -376,468
Дисперсия выборки 17100292,22 14128443 -2971849
Эксцесс -0,37797215 -0,54 -0,16203
Асимметричность 0,393864606 0,63 0,236135
Интервал 17130 17130 0
Минимум 10470 10470 0
Максимум 27600 27600 0
Сумма 838430 838430 0
Счет 45 45 0

Некоторые параметры отличаются, так как программа рассчитывает не по группированному вариационному ряду данным, а по первичному дискретному ряду.

Выводы:

Для данного дискретного ряда характерны следующие показатели. Средняя заработная плата за январь составила 18559,17 руб. Наиболее часто встречающееся значение ряда – 16180 руб. 50% единиц совокупности имеют заработную плату меньше по величине 18202.29 руб.

В анализируемом ряду распределения наблюдается несущественная правосторонняя асимметрия (0.271/0.612 = 0.44<3).

Среднее значение примерно равно моде и медиане, что свидетельствует о нормальном распределении выборки.

Значения As и Ex мало отличаются от нуля. Поэтому можно предположить близость данной выборки к нормальному распределению.

Распределение коммерческих банков по размеру активов характеризуется следующими данными:

Размер активов, млн руб. До 200 200 — 300 300 — 400  400 — 500 500 — 600 600 и более Итого
Удельный вес банков, % к итогу 8 25 52 7 5 3 100

Определите характеристики распределения:

а) среднюю;

б) моду;

в) среднее квадратическое отклонение;

г) коэффициент вариации;

д) коэффициент асимметрии и эксцесс.

Решение:

Данный интервальный вариационный ряд содержит открытые интервалы, которые предварительно необходимо закрыть. Для этого из величины верхней границы первого интервала надо вычесть величину второго интервала. Получим нижнюю границу первого интервала.

200 — 100 = 100.

Первый интервал: 100 — 200.

Теперь к нижней границе последнего интервала прибавляем величину предшествующего интервала:

600 + 100 = 700

Последний интервал: 600 — 700.

а) Определение средней по сгруппированным данным производится по формуле средней арифметической взвешенной:

 Формула средней арифметической взвешенной

Чтобы применить эту формулу, необходимо варианты признака выразить одним числом (дискретным). За такое дискретное число принимается средняя арифметическая простая из верхнего и нижнего значения каждого интервала.

Так, например, дискретная величина х для первого интервала будет равна: (100 + 200) / 2 = 150.

Построим таблицу рассчётных данных:

 Дальнейший расчёт производится обычным методом определения средней арифметической взвешенной.

 Расчёт средней арифметической взвешенной

б) Определим моду.

Мода — это величина признака наиболее часто встречающегося в совокупности.

В интервальных рядах распределения с равными интервалами мода определяется по формуле:

Формула моды

где

хМо – начальное значение интервала, содержащего моду;

iМо – величина модального интервала,

fМо – частота модального интервала,

fМо-1 – частота интервала, предшествующего модальному,

fМо+1 – частота интервала, следующего за модальным.

Мода содержится в интервале от 300 до 400, так как у этого интервала наибоьшая частота

f = 52.

 Расчёт моды млн. руб.

в) Найдём среднее квадратическое отклонение:

 Формула и расчёт среднего квадратического отклонения

Значения размера активов в ряду распределения могут отличаться от среднего значения на 104,28 млн. руб.

Дисперсия будет равна:

σ2 = 10 875

г) Коэффициент вариации рассчитаем по формуле:

Формула и расчёт коэффициента вариации

Совокупность однородна, так как коэффициент вариации не превышает 33%.

д) Рассчитаем показатель асимметрии через отношение центрального момента третьего порядка к среднему квадратическому отклонению данного ряда в кубе, то есть

Формула коэффициента асимметрии

где μ3 — центральный момент третьего порядка, рассчитываемый по формуле:

Центральный момент третьего порядка

μ3 = 88 275 000 / 100 = 882 750

As = 882 750 / 104,283 = 0,78

Так как величина показателя асимметрии положительна, следовательно, речь идёт о правосторонней асимметрии.

Полученный результат свидетельствует о наличии несущественной по величине и положительной по своему характеру асимметрии.

Далее рассчитаем показатель эксцесса (Еk). Наиболее точно он определяется по формуле с использованием центрального момента четвёртого порядка:

Центральный момент четвёртого порядка

μ4 = 52 123 312 500 / 100 = 521 233 125

Показатель эксцесса

σ4 = 118 265 625

Ek = 521 233 125 / 118 265 625 – 3 = 4,41 — 3 = 1,41

Так как Ek > 0 распределение является островершинным.

Понравилась статья? Поделить с друзьями:
  • Среднеквадратичная ошибка определения координат
  • Средняя квадратичная ошибка среднего арифметического значения равна
  • Средняя квадратическая ошибка калькулятор
  • Среднеквадратичная ошибка нейронной сети
  • Средняя квадратичная ошибка прогноза