1.
СТАТИСТИКА
Аналитическая статистика.
Лекция 2. Выборочное наблюдение.
Автор: Равичев Л.В.
РХТУ им. Д.И.Менделеева
Кафедра управления технологическими инновациями
Москва — 2013
2. Выборочное наблюдение
Под выборочным наблюдением понимается такое несплошное
наблюдение, при котором статистическому обследованию
(наблюдению) повергаются единицы изучаемой совокупности,
отобранные случайным образом.
Совокупность отобранных для обследования единиц в
статистике принято называть выборочной, а совокупность
единиц, из которых производится отбор, — генеральной.
2
3. Выборочное наблюдение
№
1
2
3
Характеристика
Генеральная
совокупность
Выборочная совокупность
N
n
Численность единиц,
обладающих обследуемым
признаком.
M
m
Доля единиц, обладающих
обследуемым признаком.
P
Объем совокупности
(численность единиц)
M
N
W
n
N
4
Средний размер признака.
x
x
i 1
i
~
x
N
N
5
6
Дисперсия количесвенного
признака.
Дисперсия альтернативного
признака.
x2
( xi x ) 2
i 1
N
2
ап
p q
m
n
x
i 1
n
n
S ~x2
(x
i 1
i
i
~
x )2
n
2
S ап
W (1 W )
3
4. Ошибка выборочного наблюдения
Ошибка выборочного наблюдения – представляет собой разность между
величиной параметра в генеральной совокупности и его величиной,
вычисленной по результатам выборочного наблюдения.
Предельная ошибка выборки:
~
~
|
x
~
~xx | x xx ||
где:
N
N
xx
xx
ii 11
N
N
ii
nn
~
~
xx
xx
ii 11
ii
nn
4
5. Теорема П.Л.Чебышева
При достаточно большом числе независимых наблюдений с вероятностью,
близкой к единице, можно утверждать, что отклонение выборочной средней
от генеральной будет сколь угодно малым. При этом величина предельной
ошибки выборки не должна превышать t .
~x~x tt ~x~x
где x — средняя ошибка выборки:
~x~x
nn
5
6. Теорема А.М.Ляпунова
Распределение выборочных средних (а следовательно, и их отклонений от
генеральной средней) при достаточно большом числе независимых наблюдений приближенно нормально при условии, что генеральная совокупность обладает конечной средней и ограниченной дисперсией.
tt
22
t
t
22
1
1
~
P || xx ~
~x~x
dt F
F((tt))
P
xx ||
ee dt
22 tt
где:
~x~x
tt
Предельная ошибка выборки дает
возможность выяснить, в каких пределах находится величина генеральной
средней.
6
7. Теорема А.М.Ляпунова
Значение интеграла F(t) для различных значений коэффициента доверия t в
специальных математических таблицах:
Целые и
десятые
доли t
0,0
0,1
0
0,0000
0,0797
1
0,0080
0,0876
2
0,0160
0,3961
3
0,3988
0,3956
2,1
0,0440
0,9643
0,9651
5,0
0,9999999
Сотые доли t
8
0,0638
0,3925
9
0,0718
0,3918
0,9660
0,9698
0,9707
0,9715
—
—
—
—
—
—
Полученное значение F(t) = 0,9698 показывает, что в 96,98% случаев разность
между выборочной и генеральной средней не превысит 2,13* .
Зная выборочную среднюю величину признака и предельную ошибку выборки можно определить границы интервала, в котором заключена генеральная
средняя:
~
~
~
~x~x
xx
~
~x~x
xx
xx
7
8. Расчет предельной ошибки выборки
Расчет значений предельной ошибки выборки может быть произведен с
помощью стандартной функции Excel ДОВЕРИТ.
ДОВЕРИТ(p; ;n)
Пример. В результате выборочного обследования жилищных условий
жителей города на основе собственно-случайной повторной выборки,
получен ряд распределения:
Общая площадь,
приходящаяся на
1 человека, м2
До 5
5-10
10-15
15-20
20-25
25-30
30 и
более
Число жителей
8
95
204
270
210
130
83
Требуется с уровнем надежности 95% определить границы интервала, в
который попадает средний размер общей площади.
8
9. Расчет предельной ошибки выборки
9
10. Теорема Бернулли
При достаточно большом объеме выборки вероятность расхождения между
долей признака в выборочной совокупности (w) и долей признака в
генеральной совокупности (р) будет стремиться к единице.
P || w
w pp || tt
11
P
т.е. с вероятностью, сколь угодно близкой к 1, можно утверждать, что при
достаточно большом объеме выборки частость признака (выборочная доля)
сколь угодно мало будет отличаться от доли признака в генеральной совокупности.
Средняя ошибка выборки для альтернативного признака:
ww
pq
pq
nn
w((11
w
w))
w
nn
10
11. Теорема Бернулли
Предельная ошибка выборки альтернативного признака:
ww tt ww
Доверительный интервал альтернативного признака:
w
ww pp w
w
ww
w
11
12. Уточнение формулы средней ошибки выборки
Если отбор единиц из генеральной совокупности произведен бесповторным
способом, т.е. способом при котором попавшая в выборку единица не
возвращается в совокупность, то в формулы средней ошибки выборки
вносится поправка:
n
n
1
1
N
N
то есть:
22
n
n
ww
~x~x
))
((11
nn
N
N
w((11
w
w))
n
w
n
))
((11
N
nn
N
12
13. Уточнение формулы средней ошибки выборки
Для приведенного выше примера, если предположить, что данные являются
результатом бесповторного выбора из генеральной совокупности из 20000
единиц:
~x
51,11
1000
(1
) 0,22
1000
20000
При большом проценте выборке влияние поправки на бесповторность значительно возрастает.
~x
51,11
1000
(1
) 0,21
1000
10000
~x
51,11
1000
(1
) 0,16
1000
2000
13
14. Предельная ошибка альтернативного признака
Для приведенного выше примера, определим предельную ошибку выборки
для лиц, обеспеченность жильем которых составляет менее 10 м 2.
1. Выборочная доля:
103
w
0,103
1000
2. Дисперсия:
w 2 w(1 w) 0,103 0,897 0,0924
3. Средняя ошибка выборки:
w
0,0924
1000
(1
) 0,0094
1000
20000
4. Предельная ошибка выборки:
w 1,96 0,0094 0,0184
14
15. Способы формирования выборочной совокупности
По виду
видуотбора
отбора
По
Индивидуальный
Индивидуальный
отбор
отбор
Групповойотбор
отбор
Групповой
Комбинированный
Комбинированный
отбор
отбор
15
16. Способы формирования выборочной совокупности
Пометоду
методу отбора
отбора
По
Бесповторныйотбор
отбор
Бесповторный
Повторныйотбор
отбор
Повторный
16
17. Способы формирования выборочной совокупности
Поспособу
способуотбора
отбора
По
Собственно
Собственно
случайная
––случайная
выборка
выборка
МеханичесМеханическаявыборка
выборка
кая
Типическая
Типическая
выборка
выборка
Серийная
Серийная
выборка
выборка
КомбинироКомбинированная
ванная
выборка
выборка
17
18. Типическая выборка
Выборка, пропорционально
дифференциации признака.
Выборка, пропорционально
объему типических групп.
1. Число единиц, подлежащих
отбору из каждой группы:
1. Число единиц, подлежащих
отбору из каждой группы:
Ni
ni n
N
ni n
2. Средняя ошибка выборки:
повторный отбор
i Ni
i Ni
2. Средняя ошибка выборки:
2
n
повторный
отбор
1
N
i 2 N i2
ni
бесповторный отбор
бесповторный
отбор
2
n
n
1
N
1
N
i2 N i2
n
i
n
1 i
Ni
18
19. Типическая выборка
Пример. 10%-ный бесповторный типический отбор рабочих предприятия,
пропорциональный размерам цехов, проведенный с целью оценки потерь
из-за временной нетрудоспособности, привел к следующим результатам:
Цех
Всего
рабочих
Число дней
Обслевременной
довано нетрудоспособности
челоза год
век
средняя дисперсия
1
1000
100
18
49
2
1400
140
12
25
3
800
80
15
16
Необходимо определить пределы среднего числа дней временной
нетрудоспособности одного рабочего в целом по предприятию.
19
20. Типическая выборка
1. Расчет пропорционально объему типических групп.
Средняя из внутригрупповых дисперсий:
2
2
i ni
49 100 25 140 16 80
30,25
100 140 80
n
i
Средняя и предельная ошибки выборки (с вероятностью 0,954):
~x
30,25
320
1
0,29
320
3200
~x 2 0,29 0,58
Выборочная средняя:
~
x
xn
n
i
i
i
18 100 12 140 15 80
14,6
100 140 80
14,,66
00,,58
58
xx
14
14,,66
00,,58
58
14
20
21. Типическая выборка
2. Расчет пропорционально дифференциации признака.
Необходимый объем выборки по каждому цеху:
i
Ni
n1 320
49 1000
25 1400
49 1000
130
17200
n3 320
16 800 17200
n2 320
25 1400
130
17200
16 800
60
17200
Средняя и предельная ошибки выборки (с вероятностью 0,954):
~x 0,28
~x 2 0,28 0,56
14,,6
6
0
0,,56
56
xx
14
14,,6
6
0
0,,56
56
14
21
22. Серийная выборка
Средняя ошибки выборки:
повторный отбор
бесповторный отбор
Dмг
D
мг
rr
Dмг
r
D
r
мг
11
R
rr
R
Межгрупповая дисперсия:
~
~
22
~
~
x
x
xii x
Dмг
D
мг
rr
22
23. Определение необходимого объема выборки
Вид выборочного
наблюдения
Повторный
отбор
Бесповторный отбор
Собственно-случайная и механическая выборки
а) при определении
среднего размера
признака
t 2 ~x2
n
2~x
б) при определении
доли признака
t 2 W (1 W ) N
t 2 W (1 W )
n
n 2
2
W
W N t 2 W (1 W )
t 2 ~x2 N
n 2
~x N t 2 ~x2
Типическая выборка
а) при определении
среднего размера
признака
б) при определении
доли признака
t 2 ~x2
n
2~x
t 2 ~x2 N
n 2
~x N t 2 ~x2
2
t 2 W (1 W )
t
W (1 W ) N
n
n 2
2W
W N t 2 W (1 W )
23
24. Определение необходимого объема выборки
Вид выборочного
наблюдения
Повторный
отбор
Бесповторный отбор
Серийная выборка
а) при определении
среднего размера
признака
t 2 Dмг
r
2~x
б) при определении
доли признака
t 2 Wr (1 Wr ) R
t 2 Wr (1 Wr )
r
r 2
2
W
W R t 2 Wr (1 Wr )
t 2 Dмг R
r 2
~x R t 2 Dмг
24
25. Определение необходимого объема выборки
Пример 1. В микрорайоне проживает 5000 семей. В порядке случайной
бесповторной выборки предполагается определить средний размер семьи
при условии, что ошибка выборочной средней не должна превышать 0,8
человека с вероятностью Р=0,954 и при среднем квадратичном отклонении
3,0 человека.
t 2 ~x2 N
2 2 32 5000
180000
n 2
56
2
2
2
2
~x N t ~x
0,64 5000 2 3
3236
Пример 2. Для определения средней длины детали следует провести
выборочное обследование методом случайного повторного отбора. Какое
количество деталей надо отобрать, чтобы ошибка выборки не превышала 3
мм с вероятностью 0,997 при среднем квадратическом отклонении 6 мм.
t 2 ~x2
32 6 2
n
36
2
2
~x
3
25
26. Определение необходимого объема выборки
Пример 3. В фермерских хозяйствах области 10 000 коров. Из них в
районе А – 5000, в районе Б – 3000, в районе В — 2000. Чтобы определить
средний надой предполагается провести типическую выборку коров с пропорциональным отбором внутри групп (механическим). Какое количество
коров следует отобрать, чтобы с вероятностью 0,954 ошибка выборки не
превышала 5 л, если на основе предыдущих обследований известно, что
дисперсия типической выборки равна 1600?
t 2 ~x2 N
2 2 1600 10000
n 2
2
250
2
2
2
~x N t ~x
5 10000 2 1600
Нужно отобрать 250 коров, из них
в районе А:
n1 250
5000
125
10000
в районе В:
в районе Б:
n2 250
3000
75
10000
2000
n3 250
50
10000
26
27. Определение необходимого объема выборки
Пример 4. На склад поступило 100 ящиков деталей по 80 шт. в каждом.
Для установления среднего веса деталей следует провести серийную выборку деталей методом механического отбора так, чтобы с вероятностью
0,954 ошибка выборки не превышала 2 г. На основе предыдущих обследований известно, что дисперсия серийной выборки равна 4. Определить необходимый объем выборки.
t 2 Dмг R
2 2 4 100
r 2
2
4
2
2
~x R t Dмг
2 100 2 4
Методики, разработанные в рамках конкретных обследований и определенных способов формирования выборочной совокупности, требу-ют
дальнейшего теоретического обоснования и практической провер-ки.
27
28. Малая выборка Распределение Стьюдента
Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 30.
Критерий Стьюдента:
t
где:
мв
n 1
мв
мера случайных колебаний выборочной
средней в малой выборке.
~
(
x
i x)
n
~
x x
МВ t МВ
28
29. Малая выборка Распределение Стьюдента
Способы нахождения критерия Стьюдента.
1. С помощью таблиц распределения Стьюдента (t — распределение):
Уровень значимости
Число степеней
свободы
k=n-1
0,9
0,8
…
0,02
0,01
0,001
1
0,158
0,325
…
31,821
63,657
636,619
2
0,142
0,289
…
6,965
9,925
31,589
…
…
…
…
…
…
…
9
0,129
0,261
…
2,821
3,250
4,781
…
…
…
…
…
…
…
30
0,127
0,256
…
2,457
2,750
3,646
…
…
…
…
…
…
…
120
0,126
0,254
…
2,358
2,617
3,373
0,126
0,253
…
2,326
2,576
3,291
29
30. Малая выборка Распределение Стьюдента
2. С помощью стандартной функции Excel СТЬЮДРАСПОБР.
СТЬДРАСПОБР(р;k).
Для расчета t – распределения, т.е. значения уровня значимости при известных значениях t и k, необходимо воспользоваться стандартной функцией Excel СТЬЮДРАСП.
СТЬДРАСП(t;k;r).
где r может принимать два значения : 1 или 2. При r=1 функция
СТЬЮДРАСП рассчитывает одностороннее t – распределение, при r=2,
двустороннее t – распределение.
30
31. Малая выборка Распределение Стьюдента
Пример. При контрольной проверке качества поставленного в торговлю
маргарина получены следующие данные о содержании консерванта Е205 в
10 пробах, %: 4,3; 4,2; 3,8; 4,3; 3,7; 3,9; 4,5; 4,4; 4,0; 3,9. Определить вероятность того, что среднее содержание консерванта Е205 во всей партии не
выйдет за пределы 0,1% его среднего содержания в представленных
пробах.
31
Слайд 1Все
закончили свои дела?
Приготовьте ручки и тетрадки.
Продолжим
удивлять
друг
друга.
Слайд 2Тема
Выборочное
наблюдение
Общая теория статистики
Слайд 3http://oknedis.narod.ru/
Контактный телефон
моб. 8(925)502-36-48
Анатолий Викторович
Интернет помощь
Слайд 4План
1.Определение выборочного
наблюдения
2. Виды и схемы отбора
3.Характеристики
генеральной и выборочной совокупности
4. Ошибка выборочного наблюдения
5. Распространение
выборочных результатов на генеральную совокупность
6. Необходимый объем выборки
7. Примеры решения задач
Слайд 51.Определение выборочного
наблюдения
Выборочное наблюдение — это способ несплошного статистического
наблюдения, при котором обследуются не все единицы изучаемой (генеральной) совокупности,
а лишь часть ее (выборка), отобранная по определенным правилам и обеспечивающая получение данных, характеризующих совокупность в целом.
Слайд 6 Под выборочным методом понимается обследование части совокупности (выборочной
совокупности), после чего, на основании полученных результатов, делаются выводы относительно
всей совокупности (генеральной совокупности).
Слайд 71.Определение выборочного
наблюдения
Из генеральной совокупности отбирается часть единиц. По
ним проводится исследование, а затем результаты обследования распространяются на всю
совокупность с достаточно высокой степенью достоверности, вероятности.
Слайд 8Причины применения:
♦ Экономия
♦ Невозможность проведения сплошного исследования
Слайд 9Основные обозначения
N – объем, численность, число единиц ГС
n – объем
ВС
Слайд 10
Основная идея выборочного метода состоит в том, что в результате
обследования части совокупности можно судить с определенной вероятностью о характеристиках
всей изучаемой совокупности (генеральной совокупности)
Часть генеральной совокупности, которая подвергается обследованию – называется выборочной совокупностью (выборкой).
Слайд 11 Для того, чтобы выборочная совокупность давала объективные
результаты, она должна быть репрезентативной (каждая единица генеральной совокупности должна
иметь равную возможность попасть в выборку). Только тогда с увеличением объема выборки характеристики выборочной совокупности будут приближаться к характеристикам генеральной совокупности.
Слайд 12
Основной предпосылкой применения выборочного метода является обеспечение равной возможности каждой
единице генеральной совокупности попасть в выборку.
Только при этом условии с
увеличением объема выборки (числа выбираемых единиц) характеристики выборочной совокупности стремятся к характеристикам генеральной совокупности – т.е. выборка должна быть репрезентативной .
Слайд 13
Теоретической основой выборки являются теоремы закона больших чисел
(Чебышева, Ляпунова, Бернулли и др.)
Слайд 14
Теоремы Чебышева, Ляпунова и закон больших чисел доказывают сходство генеральной
ГС и выборочных ВС совокупностей. Различия между Г и В
характеристиками объясняются различием структур ГС и ВС.
Слайд 15Задачи выборочного метода
♦ Определение доверительного интервала, в котором находится характеристика
генеральной совокупности
♦ Определение минимального объема выборки
♦ Определение доверительной вероятности того,
что разность между характеристиками выборочной и генеральной совокупностей не превзойдет наперед заданного числа
Слайд 16Пример. Имеются данные о зарплате рабочих в у. е.
Слайд 171.Определение выборочного
наблюдения
Как видим, зарплату от 100 до 130
в ГС получают 10%, в ВС – 5%. Доля этой
группы в ВС ниже, чем в ГС, ВС неточно представляет ГС.
Зарплату от 190 до 220 в ГС получают 20%, а в выборку получающих такую зарплату попало 45%. Снова налицо проблема репрезентативности.
Слайд 18Сходство ГС и ВС
Из теорем Чебышева, Ляпунова и закона больших
чисел следует:
1-Хотя каждая выборочная средняя отличается от генеральной, среднее значение
по ним равно генеральной:
Слайд 191.Определение выборочного
наблюдения
Реально наблюдаемая совокупность объектов, статистически представленная рядом наблюдений
x1, x2,…, xn случайной величины Х, является выборкой, а гипотетически
существующая (домысливаемая) – генеральной совокупностью.
Слайд 20Основные обозначения:
N – объем генеральной совокупности (количество единиц генеральной
совокупности).
n – объем выборочной совокупности (количество единиц выборочной совокупности)
— генеральное среднее (средняя величина, которая имеет место в генеральной совокупности)
— среднее выборки
где — частота
— генеральная дисперсия , где 0 – признак
генеральной совокупности
Слайд 21 В основе решения задач на выборочный метод лежат
формулы предельных ошибок выборки
Слайд 22Обозначения
t — число, связанное с вероятностью через
табл. закона нормального распределения
— средняя
ошибка выборки
— предельная ошибка
Слайд 23Ошибки выборки
— генеральная средняя
— генеральная доля
— ошибка средней
— ошибка доли
Слайд 24Характеристики выборочной совокупности
— выборочная средняя
— выборочная дисперсия
— выборочная доля
Слайд 251.1. Объем выборки
Число наблюдений n, образующих выборку, называется объемом
выборки. Если объем выборки n достаточно велик (n → ∞),
выборка считается большой, в противном случае она называется выборкой ограниченного объема.
Слайд 27
Малой считается выборка,
в которую входит
меньше 20 единиц.
Слайд 28Рассмотрим особенности малой выборки.
1) Если мы работаем с обычной выборкой,
то используется таблица «Интеграла вероятностей закона нормального распределения».
В случае малой
выборки необходимо пользоваться таблицей «Распределение Стьюдента», при этом число степеней свободы равно:
Слайд 292) При малой выборке из формул исключается
т. е. получается:
∆м.в.
=
2
Слайд 301.1. Объем выборки
Выборка считается малой, если при измерении одномерной случайной
величины X объем выборки не превышает 30 (n
а при измерении одновременно нескольких (k) признаков в многомерном пространстве отношение n к k не превышает 10 (n/k < 10).
Слайд 311.2. Вариационный ряд
Выборка образует вариационный ряд, если ее члены являются
порядковыми статистиками, т. е. выборочные значения случайной величины Х упорядочены
по возрастанию (ранжированы), значения же признака называются вариантами.
Слайд 321.3.Условия проведения выборки
Выборка будет представлять всю совокупность с приемлемой точностью
при выполнении двух условий.
Слайд 331.3.Условия проведения выборки
Во-первых, она должна быть достаточно многочисленной, чтобы в
ней могли проявиться закономерности, существующие в генеральной совокупности.
Слайд 341.3.Условия проведения выборки
Во-вторых, элементы выборки должны быть отобраны объективно, независимо
от воли исследователя, чтобы каждый из них имел одинаковые шансы
быть отобранным или чтобы эти шансы были известны исследователю.
Слайд 351.Определение выборочного
наблюдения
Генеральная совокупность может быть конечной (число наблюдений
N = const) или бесконечной (N = ∞), а выборка
из генеральной совокупности – это всегда результат ограниченного ряда n наблюдений.
Слайд 361.Определение выборочного
наблюдения
Одна и та же случайно отобранная совокупность объектов
– парикмахерских одного административного округа Мурманска, может рассматриваться как выборка
из генеральной совокупности всех парикмахерских этого округа, как выборка из генеральной совокупности всех парикмахерских Мурманска, как выборка из парикмахерских страны, Европы или всего мира.
Слайд 37Способы отбора
По виду различают индивидуальный, групповой и комбинированный отбор. При
индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности,
при групповом отборе – группы единиц, а комбинированный отбор предполагает сочетание группового и индивидуального отбора.
Слайд 382.Виды и схемы отбора
Процесс образования выборочной совокупности называется отбором. Он
осуществляется в порядке беспристрастного, случайного отбора единиц из генеральной совокупности.
Существуют пять основных способов отбора
Слайд 391. Простой случайный отбор
при котором n объектов случайно извлекаются
из генеральной совокупности N объектов (например с помощью таблицы или
датчика случайных чисел), причем каждая из возможных выборок имеют равную вероятность. Такие выборки называются собственно-случайными.
Слайд 40Случайная выборка
♦ Случайная выборка — основа всех других способов отбора.
♦
Случайная выборка осуществляется методом жеребьевки: все единицы совокупности нумеруются, номера
записываются на карточки, а потом отбираются.
♦ На практике осуществляется с помощью таблиц случайных чисел.
Слайд 41Пример 1.
•Нужно отобрать 50 единиц из 500
(десятипроцентная
выборка)
• 4 781
• 3 215
• 7
160
• 7 215
• 1 027
• Отбор может быть повторным и бесповторным
Слайд 42Формулы предельных ошибок выборки
Слайд 43Обозначения:
• — выборочная дисперсия;
• W — выборочная доля;
•
n — объем выборочной совокупности;
• N — объем
генеральной совокупности;
• t — число, связанное с вероятностью, которая берется из таблицы интеграла вероятностей закона нормального распределения.
Слайд 44Пример 2.
Для определения среднего срока службы изделий было обследовано 250
изделий. При этом средний срок службы был установлен на уровне
41,9 месяца. Среднее квадратическое отклонение равно 6,2 месяцам.
С вероятностью 0,9973 определить, в каких пределах находится средний срок службы всех изделий
Слайд 45Решение:
• Р=0,9973, t=3 (из таблицы интеграла вероятностей закона нормального распределения).
•
При этом вероятность делится на 2.
Слайд 46Пример 3.
• Определить вероятность того, что предельная ошибка средней службы
не превысит 1 месяц.
Решение:
Слайд 47Пример 4.
Определение минимального объема выборки.
Сколько следует прохронометрировать операций, чтобы с
вероятностью 0,9973 можно было бы утверждать, что разность между средней
продолжительностью операций в выборочной и генеральной совокупности не превысит 1 секунды, если по результатам предыдущего испытания установлено, что средняя продолжительность операции равна 30 секундам, а среднее квадратическое отклонение равно 7 секундам?
Слайд 48Решение :
Ответ: нужно прохронометрировать не менее 441 операции.
Слайд 492. Простой отбор с помощью регулярной процедуры
осуществляется с
применением механической составляющей (номера квартиры, даты, дня недели, буквы алфавита)
и полученные таким способом выборки называются механическими.
Слайд 503. Стратифицированный отбор
заключается в том, что генеральная совокупность объема
N подразделяется на части совокупности или слои (страты) объема N1,
N2, … , Nr, так что N1 + N2 + … + Nr = N.
Слайд 513. Стратифицированный отбор
Страты — однородные объекты с точки зрения статистических
характеристик (например, население по возрасту делится на две страты –
в трудоспособном и нетрудоспособном возрасте; банки – по размеру капитала). В этом случае выборки называются стратифицированными (расслоенными, типическими, районированными).
Слайд 524.Серийный отбор
Приемы серийного отбора используются для формирования серийных или
гнездовых выборок. Они удобны в том случае, если необходимо обследовать
сразу «блок» или серию объектов (например, партию товара, продукцию определенной серии или предприятия территориально-административной единицы).
Слайд 53 Вся совокупность делится на серии, после чего механическим или собственно
случайным способом отбирается некоторое количество серий. Все единицы совокупности, входящие
в отобранные серии, подвергаются сплошному контролю.
Слайд 55r – количество отобранных серий
R – общее число серий
— межсерийная дисперсия
— межсерийная выборочная дисперсия для доли
— доля
изучаемого признака в i-той группе
— средняя выборочная доля изучаемого признака
Слайд 56
Пример:
На предприятии 10 бригад. Изучается производительность труда. Отбираются 2
бригады. Средняя производительность труда 1-й бригады – 4,6 тонны, а
2-й – 3 тонны. С вероятностью 0,9973 определить пределы в кот. будет находиться средняя производительность труда рабочих данного предприятия.
t = 3
Слайд 59Типическая выборка
способ проведения типической выборки:
1. вся совокупность делится на типические
группы
население
сельское
городское
пример
2. из каждой типической группы отбирается некоторое количество единиц
Отбор может
быть как пропорциональным объёму типических групп, так и непропорциональным
www.olegfedorov.info
Слайд 60Объем выборки
При отборе, пропорциональном объему типических групп,
число наблюдений по каждой группе определяется по формуле:
-объем выборки из -й типической группы.
-общий объем выборки.
-объем -й типической группы в генеральной совокупности.
-объем генеральной совокупности.
Слайд 62
Типическая выборка: пример
Задача. Определим средний возраст мужчин, вступающих в брак,
произведя 5%-ю типическую выборку:
С вероятностью 0,954 определить
пределы, в которых будет
находиться средний возраст мужчин, вступающих в брак
долю мужчин, вступающих в брак во второй раз.
Слайд 63
Типическая выборка: пример
Решение. 1) Средний возраст вступления в брак мужчин
находится в пределах
Слайд 64Таким образом, с вероятностью 0,954 можно утвердить, что средний возраст
мужчин, вступающих в брак, принимает значения 25,2 ± 1,2 года,
или
Решение примера типической выборки
Слайд 65
Типическая выборка: пример
Решение. 2) Доля мужчин, вступающих в брак во
второй раз, находится в пределах
Слайд 66Таким образом, с вероятностью 0,954 можно утверждать, что доля мужчин,
вступающих в брак во второй раз, принимает значения 14% ±
6%, или
Вывод по примеру типической выборки
Слайд 675. Комбинированный (ступенчатый ) отбор
может сочетать в себе сразу
несколько способов отбора (например, стратифицированный и случайный или случайный и
механический); такая выборка называется комбинированной.
Слайд 682.1.Виды отбора
По виду различаются индивидуальный, групповой и комбинированный отбор. При
индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности,
при групповом отборе – качественно однородные группы (серии) единиц, а комбинированный отбор предполагает сочетание первого и второго видов.
Слайд 692.2. Методы отбора
По методу отбора различают повторную и бесповторную выборку.
Бесповторным называется отбор, при котором попавшая в выборку единица не
возвращается в исходную совокупность и в дальнейшем выборе не участвует; при этом численность единиц генеральной совокупности N сокращается в процессе отбора.
Слайд 70
При повторном отборе попавшая в выборку единица после регистрации возвращается
в генеральную совокупность и таким образом сохраняет равную возможность наряду
с другими единицами быть использованной в дальнейшей процедуре отбора; при этом численность единиц генеральной совокупности N остается неизменной (метод в социально-экономических исследованиях применяется редко). Однако, при большом N (N → ∞) формулы для бесповторного отбора приближаются к аналогичным для повторного отбора и практически чаще используются последние (N = const).
Слайд 71Механическая выборка
При механической выборке вся совокупность делится на
группы по числу единиц, которые должны войти в выборку, после
чего из каждой группы отбирается 1 единица. Таким образом механическая выборка может быть бесповторной. Для механической выборки применяются формулы собственно-случайного, бесповторного отбора
Слайд 72Механическая выборка.
• При механической выборке вся совокупность разбивается на столько
групп, сколько единиц должно войти в выборку, затем из каждой
группы выбирается 1 единица, следовательно механическая выборка может быть только бесповторной.
• Применяются формулы для собственно- случайной бесповторной выборки.
• На практике механическая выборка осуществляется при помощи шага отбора.
Слайд 74На практике механическая выборка обычно осуществляется при помощи так называемого
шага отбора
1) Все единицы совокупности нумеруются
2) Определяется шаг
отбора
Слайд 753.Характеристики генеральной и выборочной совокупности
В основе статистических выводов проведенного
исследования лежит распределение случайной величины Х, наблюдаемые же значения (х1,
х2, … , хn) называются реализациями случайной величины Х (n – объем выборки).
Слайд 763.Характеристики генеральной и выборочной совокупности
Распределение случайной величины Х в генеральной
совокупности носит теоретический, идеальный характер, а ее выборочный аналог является
эмпирическим распределением.
Слайд 773.Характеристики генеральной и выборочной совокупности
Некоторые теоретические распределения заданы аналитически,
т.е. их параметры определяют значение функции распределения F(x) в каждой
точке пространства возможных значений случайной величины Х.
Слайд 783.Характеристики генеральной и выборочной совокупности
Для выборки же функцию распределения определить
трудно, а иногда невозможно, поэтому параметры оценивают по эмпирическим данным,
а затем их подставляют в аналитическое выражение, описывающее теоретическое распределение.
Слайд 793.1. Нормальное распределение
По своей природе распределения бывают непрерывными
и дискретными. Наиболее известным непрерывным распределением является нормальное распределение. Выборочными
аналогами параметров μ и σ2 для него являются: среднее значение x и эмпирическая дисперсия s2.
Слайд 803.Характеристики генеральной и выборочной совокупности
Среди дискретных в социально-экономических
исследованиях наиболее часто применяется альтернативное (дихотомическое) распределение.
Слайд 813.2. Альтернативное (дихотомическое) распределение
. Параметр математического ожидания μ этого распределения
выражает относительную величину (или долю) единиц совокупности, которые обладают изучаемым
признаком х (она обозначена буквой р); доля совокупности, не обладающая этим признаком, обозначается буквой q (q = 1 – p). Дисперсия же σ2 альтернативного распределения также имеет эмпирический аналог s2.
Слайд 823.Характеристики генеральной и выборочной совокупности
В зависимости от вида
распределения и от способа отбора единиц совокупности по-разному вычисляются характеристики
параметров распределения.
Слайд 833.3.Доля выборки
Долей выборки kn называется отношение числа единиц выборочной совокупности
к числу единиц генеральной совокупности:
kn = n/N.
Слайд 843.4.Выборочная доля
Отношение числа единиц, обладающих данным признаком или данным его
значением m, к общему числу единиц выборочной совокупности n называется
выборочной долей w:
w = m/n.
Слайд 85Пример
В партии товара, содержащей 10 тыс. штук, при
4% выборке доля выборки kn в абсолютной величине составляет 400
шт. (n = N×0,04); если же в этой выборке обнаружено 12 бракованных изделий, то выборочная доля брака w составит 0,03 (w = 12/400 = 0,03 или 3%).
Слайд 86
-генеральная доля
W – выборочная доля
Слайд 884.Ошибка выборочного наблюдения
Поскольку выборочная совокупность отлична от
генеральной, то возникают ошибки выборки. При сплошном и выборочном наблюдении
могут произойти ошибки двух видов: регистрации и репрезентативности.
Слайд 894.Ошибка выборочного наблюдения
Ошибки регистрации могут
иметь случайный и систематический характер. Случайные ошибки складываются из множества
различных неконтролируемых причин, носят непреднамеренный характер и обычно по совокупности уравновешивают друг друга (например, изменения показателей прибора при температурных колебаниях или магнитных бурях).
Слайд 904.Ошибка выборочного наблюдения
Систематические ошибки тенденциозны,
так как нарушают правила отбора объектов в выборку (например, отклонения
в измерениях при изменении настройки измерительного прибора или отбор каждой четвертой квартиры при 25% выборке в доме с четырьмя квартирами на лестничной площадке).
Слайд 914.Ошибка выборочного наблюдения
Ошибки репрезентативности присущи только выборочному наблюдению. Их невозможно
избежать, поскольку выборочная совокупность не полностью воспроизводит генеральную совокупность. Значения
выборочных показателей отличаются от показателей этих же величин в генеральной совокупности (или получаемых при сплошном наблюдении).
Слайд 924.Ошибка выборочного наблюдения
Ошибка выборочного наблюдения ε есть разность
между значением параметра в генеральной совокупности и его выборочным значением.
Для среднего значения количественного признака она равна:
εx = ⏐μ – x ⏐,
а для доли (альтернативного признака) –
εw = ⏐p – w⏐.
Слайд 93
– генеральная доля
W – выборочная
доля
– число единиц, обладающих признаком в генеральной совокупности
Слайд 95Ошибка выборки – это разность между характеристиками выборочной и генеральной
совокупности.
— ошибка средней
— ошибка доли
Различают средние и предельные
ошибки
выборки.
, где
— предельная ошибка,
— средняя ошибка, t – некоторое число
Слайд 96 — генеральная средняя (средняя величина, которая имеет
место в генеральной совокупности)
—
выборочная средняя
где — частота, — отдельное
значение признака
— генеральная дисперсия , где 0 –
признак генеральной совокупности
Слайд 974.Ошибка выборочного наблюдения
Ошибки выборки свойственны только выборочным наблюдениям. Чем больше
эти ошибки, тем больше эмпирическое распределение отличается от теоретического распределения.
Слайд 98Ошибка выборки – это разность между характеристиками выборочной и генеральной
совокупности.
— ошибка средней
— ошибка доли
Различают средние и предельные
ошибки
выборки.
, где
— предельная ошибка,
— средняя ошибка, t – некоторое число
Слайд 99 Теоремы закона больших чисел устанавливают связь между предельной
ошибкой выборки, гарантированной с определенной вероятностью, числом ( t )
и средней ошибкой выборки ( )
Слайд 102Теорема Ляпунова
А.М. Ляпунов доказал, что распределение выборочных средних( а следовательно,
и их отклонений от генеральной средней ) при достаточно большом
числе независимых наблюдений приближенно нормально при условии, что генеральная совокупность обладает конечной средней и ограниченной дисперсией.
Слайд 103Теорема Ляпунова
Математически теорему Ляпунова можно записать так:
где
π=3,14(математическая постоянная);
— предельная ошибка выборки, которая дает возможность выяснить,
в каких пределах находится величина генеральной средней.
Слайд 1064.Ошибка выборочного наблюдения
Параметры эмпирического распределения x и s2 являются случайными
величинами, следовательно, ошибки выборки также являются случайными величинами, могут принимать
для разных выборок разные значения и поэтому принято вычислять среднюю ошибку.
Слайд 108Средняя ошибка выборки
выражает среднее квадратическое отклонение выборочной
средней от математического ожидания. Эта величина при соблюдении принципа случайного
отбора зависит прежде всего от объема выборки n и от степени колеблемости признака: чем больше n и чем меньше вариация признака (следовательно, и значение σ2), тем меньше величина средней ошибки выборки m.
Слайд 112Предельная ошибка выборки для некоторых способов формирования выборочной совокупности
Слайд 120Задача
В городе 2000 семей. Предполагается провести выборочное обследование методом
случайной бесповторной выборки для нахождения среднего размера семьи.
Слайд 121Определить необходимую численность выборки
при условии, что с вероятностью 0,954
ошибка выборки не превысит 1 человека при среднем
квадратическом отклонении
3 человека.
Слайд 125Ответ
Необходимо обследовать не менее 36 семей.
Метод выборочного наблюдения Понятие выборочного наблюдения. Ошибки выборочного
Метод выборочного наблюдения Понятие выборочного наблюдения. Ошибки выборочного наблюдения. Определение необходимого объема выборки.
Метод выборочного наблюдения n n n Понятие генеральной и выборочной совокупности Способы отбора. Виды выборочной совокупности Основные характеристики генеральной и выборочной совокупности Ошибки выборочного наблюдения Определение необходимого объема выборки
Виды несплошного статистического наблюдения n Монографическое описание – осуществляется для изучения единичных, но типичных в социально-правовом отношении объектов. n Обследование основного массива – способ, при котором исследованию подвергаются доминирующие и наиболее крупные единицы совокупности. n Анкетирование (социологический способ обследования) – специально организованное обследование с целью сбора данных, отсутствующих в официальной статистической отчетности, и проводимое в виде заполнения специально разработанных анкет. n Выборочный – обследование, при котором обследованию подвергаются отдельные единицы, отобранные с соблюдением определённых условий.
Понятие генеральной и выборочной совокупности Совокупность всех мысленно возможных объектов того или иного вида, над которыми проводятся наблюдения с целью получения конкретных значений определённой случайной величины, или совокупность результатов всех мыслимых наблюдений, проводимых при неизменных условиях над одной из случайных величин, связанных с данным видом объектов, называют генеральной совокупностью. Часть отобранных объектов из генеральной совокупности (результаты наблюдений над ограниченным числом объектов из этой совокупности) называется выборочной совокупностью или просто выборкой.
Способы отбора статистических данных n Собственно случайный отбор, при котором объекты выбираются путём жеребьевки. n Механический отбор, при котором генеральную совокупность «механически» делят на столько групп, сколько объектов должно войти в выборку, а из каждой группы выбирают один объект. n Cерийный отбор, при котором объекты отбираются из генеральной совокупности не по одному, а сериями, которые подвергаются сплошному обследованию. n Типический (районированный) отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой ее типической (однородной) части.
Основные характеристики генеральной и выборочной совокупности Генеральная совокупность Выборочная совокупность Объём совокупности N n Кол. единиц, обладающих заданным признаком M m Характеристика Доля единиц, обладающих заданным признаком Среднее значение Дисперсия Среднее квадратическое отклонение
Основные характеристики генеральной и выборочной совокупности Характеристика Дисперсия доли Среднее квадратическое отклонение доли Генеральная совокупность Выборочная совокупность
Погрешность выборочного наблюдения n n Погрешность наблюдения – расхождение между расчётным и действительным значением изучаемых величин. Погрешность измерения – разность между результатом измерения x и истинным значением a изучаемой величины. — абсолютная погрешность измерения. — относительная погрешность измерения. n Погрешность репрезентативности – расхождение между характеристиками выборочной и генеральной совокупности.
Определение необходимой численности выборочной совокупности Допущение, принимаемое при собственно случайном отборе: Объекты изучаемой совокупности подчиняются нормальному закону распределения случайной величины. Правило трёх сигм:
Определение необходимой численности выборочной совокупности Предельная ошибка выборки Объём выборки
Определение необходимой численности выборочной совокупности Пример. Для определения среднего возраста 50 тыс. человек, совершивших экономические преступления в России, необходимо провести выборочное обследование методом механического отбора. При проведении предыдущего подобного обследования величина дисперсии составила = 75. Определите необходимую численность выборки, чтобы с вероятностью 0. 997 предельная ошибка выборки не превышала бы x 2. 5 года. Решение. Для данной численности N = 50 000 чел. и величины доверительной вероятности = 0. 997, имеем t = 3. Используя формулу для определения необходимой численности выборки, получаем: Ответ. Необходимая численность выборки составляет 108 чел.
Ошибка выборочного наблюдения есть разность
между значением параметра в генеральной совокупности и его выборочным значением.
Для среднего значения количественного признака она равна:
x = – x ,
а для доли (альтернативного признака) –
w = p – w .
2 xi x 2 ni n
W0 – генеральная доля
W0 MN
W |
m |
||
W |
– выборочная доля |
n |
|
M |
– число единиц, обладающих признаком в |
||
генеральной совокупности |
Ошибка выборки – это разность между характеристиками выборочной и генеральной совокупности.
x x x0
x — ошибка средней
W W W0
W — ошибка доли
Различают средние и предельные ошибки выборки.
t — предельная , где ошибка,
— средняя ошибка, t – некоторое число
x0 — генеральная средняя (средняя величина, которая имеет место в генеральной совокупности)
x — выборочная средняя
x |
xi ni |
|
n |
||
где |
ni — частота, xi — отдельное |
значение признака
02 — генеральная дисперсия , где 0 – признак генеральной совокупности
4.Ошибка выборочного наблюдения
Ошибки выборки свойственны только выборочным наблюдениям. Чем больше эти ошибки, тем больше эмпирическое распределение отличается от теоретического распределения.
Ошибка выборки – это разность между характеристиками выборочной и генеральной совокупности.
— ошибка средней |
|||||||||||||
x |
x |
||||||||||||
0 |
x |
||||||||||||
x |
|||||||||||||
Различают средние и предельные ошибки
выборки. |
— предельная ошибка, |
|
t |
||
, где |
— средняя ошибка, t – некоторое число
Теоремы закона больших чисел устанавливают связь между предельной ошибкой выборки, гарантированной с определенной вероятностью, числом ( t ) и средней ошибкой выборки ( )
При оценке результатов малой выборки величина генеральной дисперсии в расчетах не используется. Для определения возможных пределов ошибки пользуются так называемым критерием Стьюдента, определяемым по формуле
~
t x x
MB
где MB |
— мера случайных колебаний выборочной средней в малой |
|||||
n |
1 |
|||||
выборке.
Значение этого интеграла для различных значений коэффициента доверия t вычислены и приводятся в специальных математических таблицах. В частности, при
t=1Ф(t)=0,683; t=1,5Ф(t)=0,866; t=2Ф(t)=0,954; t=2,5Ф(t)=0,998; t=3Ф(t)=0,997; t=3,5Ф(t)=0,999.
Соседние файлы в папке статистика
- #
- #
- #
- #
- #
- #
- #
Слайд 1Автор: Равичев Л.В.
РХТУ им. Д.И.Менделеева
Кафедра управления технологическими
инновациями
Москва — 2013
СТАТИСТИКА
Лекция 2. Выборочное наблюдение.
Аналитическая
статистика.
Слайд 22
Выборочное наблюдение
Под выборочным наблюдением понимается такое несплошное
наблюдение, при котором статистическому обследованию (наблюдению) повергаются
единицы изучаемой совокупности, отобранные случайным образом.
Совокупность отобранных для обследования единиц в статистике принято называть выборочной, а совокупность единиц, из которых производится отбор, — генеральной.
Слайд 44
Ошибка выборочного наблюдения
Ошибка выборочного наблюдения – представляет
собой разность между величиной параметра в генеральной
совокупности и его величиной, вычисленной по результатам выборочного наблюдения.
Слайд 55
Теорема П.Л.Чебышева
При достаточно большом числе независимых наблюдений
с вероятностью, близкой к единице, можно утверждать,
что отклонение выборочной средней от генеральной будет сколь угодно малым. При этом величина предельной ошибки выборки не должна превышать tμ.
Слайд 66
Теорема А.М.Ляпунова
Распределение выборочных средних (а следовательно, и
их отклонений от генеральной средней) при достаточно
большом числе независимых наблюде-ний приближенно нормально при условии, что генеральная совокупность об-ладает конечной средней и ограниченной дисперсией.
Предельная ошибка выборки дает возможность выяснить, в каких преде-лах находится величина генеральной средней.
Слайд 77
Теорема А.М.Ляпунова
Значение интеграла F(t) для различных значений
коэффициента доверия t в специальных математических таблицах:
Полученное значение F(t) = 0,9698 показывает, что в 96,98% случаев разность между выборочной и генеральной средней не превысит 2,13*μ.
Слайд 88
Расчет предельной ошибки выборки
Слайд 99
Расчет предельной ошибки выборки
Слайд 1212
Уточнение формулы средней ошибки выборки
Слайд 1313
Уточнение формулы средней ошибки выборки
Для приведенного выше
примера, если предположить, что данные являются результатом
бесповторного выбора из генеральной совокупности из 20000 единиц:
При большом проценте выборке влияние поправки на бесповтор-ность значительно возрастает.
Слайд 1414
Предельная ошибка альтернативного признака
Для приведенного выше примера,
определим предельную ошибку выборки для лиц, обеспеченность
жильем которых составляет менее 10 м2.
1. Выборочная доля:
Слайд 1515
Способы формирования выборочной совокупности
По виду отбора
Слайд 1616
Способы формирования выборочной совокупности
По методу отбора
Слайд 1717
Способы формирования выборочной совокупности
По способу отбора
Слайд 19Типическая выборка
19
Пример. 10%-ный бесповторный типический отбор рабочих
предприятия, пропорциональный размерам цехов, проведенный с целью
оценки потерь из-за временной нетрудоспособности, привел к следующим результатам:
Необходимо определить пределы среднего числа дней временной нетрудоспособности одного рабочего в целом по предприятию.
Слайд 2020
Типическая выборка
1. Расчет пропорционально объему типических групп.
Слайд 2121
Типическая выборка
2. Расчет пропорционально дифференциации признака.
Слайд 2222
Серийная выборка
Средняя ошибки выборки:
повторный отбор
бесповторный отбор
Межгрупповая дисперсия:
Слайд 23
Определение необходимого объема выборки
23
Слайд 2424
Определение необходимого объема выборки
Слайд 2525
Определение необходимого объема выборки
Слайд 2626
Определение необходимого объема выборки
Пример 3. В фермерских
хозяйствах области 10 000 коров. Из них
в районе А – 5000, в районе Б – 3000, в районе В — 2000. Чтобы определить средний надой предполагается провести типическую выборку коров с про-порциональным отбором внутри групп (механическим). Какое количество коров следует отобрать, чтобы с вероятностью 0,954 ошибка выборки не превышала 5 л, если на основе предыдущих обследований известно, что дисперсия типической выборки равна 1600?
Слайд 2727
Определение необходимого объема выборки
Пример 4. На склад
поступило 100 ящиков деталей по 80 шт.
в каждом. Для установления среднего веса деталей следует провести серийную вы-борку деталей методом механического отбора так, чтобы с вероятностью 0,954 ошибка выборки не превышала 2 г. На основе предыдущих обследо-ваний известно, что дисперсия серийной выборки равна 4. Определить не-обходимый объем выборки.
Методики, разработанные в рамках конкретных обследований и опре-деленных способов формирования выборочной совокупности, требу-ют дальнейшего теоретического обоснования и практической провер-ки.
Слайд 2828
Малая выборка
Распределение Стьюдента
Под малой выборкой понимается такое
выборочное наблюдение, числен-ность единиц которого не превышает
30.
Критерий Стьюдента:
где:
мера случайных колебаний выборочной средней в малой выборке.
Слайд 2929
Способы нахождения критерия Стьюдента.
1. С помощью таблиц
распределения Стьюдента (t — распределение):
Малая выборка
Распределение
Стьюдента
Слайд 3030
Малая выборка
Распределение Стьюдента
Слайд 3131
Малая выборка
Распределение Стьюдента
Пример. При контрольной проверке качества
поставленного в торговлю маргарина получены следующие данные
о содержании консерванта Е205 в 10 пробах, %: 4,3; 4,2; 3,8; 4,3; 3,7; 3,9; 4,5; 4,4; 4,0; 3,9. Определить вероят-ность того, что среднее содержание консерванта Е205 во всей партии не выйдет за пределы 0,1% его среднего содержания в представленных пробах.