Величина ошибки выборки обратно пропорциональна

    1. Ошибка выборки

2.1. Понятие и виды ошибок выборки

Поскольку изучаемая статистическая
совокупность состоит из единиц с
варьирующими признаками, то состав
выборочной совокупности может в той
или иной мере отличаться от состава
генеральной совокупности.

Расхождение
между характеристиками выборки и
генеральной совокупности составляет
ошибку
выборки
.

Виды ошибок выборки

Ошибки

выборки

Систематические

Случайные

Ошибки

регистрации

Обусловлены
причинами, действующими в одном
направлении (например, округление
цифр).

Проявляются
в различных направлениях и уравновешивают
друг друга (невнимательность).

Ошибки

репрезентативности

Неправильный,
тенденциозный отбор единиц, без
соблюдения принципа случайности
(выбираются преднамеренно худшие или
лучшие единицы).

Несмотря
на принцип случайности отбора единиц,
все же имеются расхождения между
характеристиками выборки и генеральной
совокупности (но эти ошибки объективны
и не связаны с волей наблюдателя).

Основная
задача выборочного метода – изучение
случайных ошибок репрезентативности.

2.2. Средняя ошибка выборки

Случайная ошибка
репрезентативности зависит от следующих
фактов (при этом считается, что ошибок
регистрации нет):

  1. Чем
    больше численность выборки при прочих
    равных условиях, тем меньше величина
    ошибки выборки, т.е. ошибка выборки
    обратно пропорциональна ее численности.

  2. Чем
    меньше варьирование признака, тем
    меньше ошибка выборки. Если признак
    совсем не варьирует, а, следовательно,
    величина дисперсии равна нулю, то ошибки
    выборки не будет, т.к. любая единица
    совокупности будет совершенно точно
    характеризовать всю совокупность по
    этому признаку. Таким образом, ошибка
    выборки прямо пропорциональна величине
    дисперсии.

В
математической статистике доказывается,
что величина средней ошибки случайной
повторной выборки может быть определена
по формуле


(6.1)

Однако
следует иметь в виду, что величина
дисперсии в генеральной совокупности

2
нам не известна, т.к. наблюдение выборочное.
Мы можем рассчитать лишь дисперсию в
выборочной совокупности S2.
Соотношение между дисперсиями генеральной
и выборочной совокупности выражается
формулой:


(6.2)

Если
n
велико, следовательно

Таким
образом, можно приблизительно считать,
что выборочная дисперсия равна генеральной
дисперсии.


2 =
S2

И формула средней ошибки повторной
выборки (6.1.) примет вид:


(6.3)

Но
здесь мы рассмотрели только ошибку
выборки для средней величины интересующего
признака. Существует также показатель
доли единиц с интересующим признаком.
Расчет ошибки этого показателя имеет
свои особенности.

Дисперсия
для показателя доли признака определяется
по формуле:

S2=(1-)
(6.4)

Тогда средняя ошибка повтора выборки
для показателя доли признака будет
равна:


(6.5)

Доказательство
формул (6.3) и (6.5) исходит из схемы повторной
выборки. Обычно же выборку организуют
бесповторным способом. Т.к. при бесповторном
отборе численность генеральной
совокупности N
в коде выборки сокращается, то в формулы
ошибки выборки включают дополнительный
множитель
,
и формулы
принимают вид:


(6.6)


(6.7)

Пример
1. Определим, на сколько отличаются
выборочные и генеральные показатели
по данным 10%-ной бесповторной выборки
успеваемости студентов.

Оценка,
х
i

Число
студентов в выборке,
fi

2

9

3

27

4

54

5

10

Итого

100

Расчет ошибки бесповторной выборки для
средней величины:

n
= 100 N
= 1000

Найдем выборочную
дисперсию по формуле:

Здесь
не известна величина
,
которую можно найти как обычную среднюю
взвешенную величину:

Таким
образом,

Т.е.
можно сказать, что средний балл всех
студентов ()
равен 3,650,07

Теперь
рассчитаем долю студентов в генеральной
совокупности, обучающихся на «4» и «5».

Найдем по выборке
долю студентов, получивших оценки «4»
и «5».

(или
64%)

Расчет
ошибки бесповторной выборки для доли
производится по формуле:

(или
4,5%)

Таким образом, доля студентов, обучающихся
на «4» и «5» по генеральной совокупности
(P) составляет
0,640,045 (или 64%4,5%).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
    1. Ошибка выборки

2.1. Понятие и виды ошибок выборки

Поскольку изучаемая статистическая
совокупность состоит из единиц с
варьирующими признаками, то состав
выборочной совокупности может в той
или иной мере отличаться от состава
генеральной совокупности.

Расхождение
между характеристиками выборки и
генеральной совокупности составляет
ошибку
выборки
.

Виды ошибок выборки

Ошибки

выборки

Систематические

Случайные

Ошибки

регистрации

Обусловлены
причинами, действующими в одном
направлении (например, округление
цифр).

Проявляются
в различных направлениях и уравновешивают
друг друга (невнимательность).

Ошибки

репрезентативности

Неправильный,
тенденциозный отбор единиц, без
соблюдения принципа случайности
(выбираются преднамеренно худшие или
лучшие единицы).

Несмотря
на принцип случайности отбора единиц,
все же имеются расхождения между
характеристиками выборки и генеральной
совокупности (но эти ошибки объективны
и не связаны с волей наблюдателя).

Основная
задача выборочного метода – изучение
случайных ошибок репрезентативности.

2.2. Средняя ошибка выборки

Случайная ошибка
репрезентативности зависит от следующих
фактов (при этом считается, что ошибок
регистрации нет):

  1. Чем
    больше численность выборки при прочих
    равных условиях, тем меньше величина
    ошибки выборки, т.е. ошибка выборки
    обратно пропорциональна ее численности.

  2. Чем
    меньше варьирование признака, тем
    меньше ошибка выборки. Если признак
    совсем не варьирует, а, следовательно,
    величина дисперсии равна нулю, то ошибки
    выборки не будет, т.к. любая единица
    совокупности будет совершенно точно
    характеризовать всю совокупность по
    этому признаку. Таким образом, ошибка
    выборки прямо пропорциональна величине
    дисперсии.

В
математической статистике доказывается,
что величина средней ошибки случайной
повторной выборки может быть определена
по формуле


(6.1)

Однако
следует иметь в виду, что величина
дисперсии в генеральной совокупности

2
нам не известна, т.к. наблюдение выборочное.
Мы можем рассчитать лишь дисперсию в
выборочной совокупности S2.
Соотношение между дисперсиями генеральной
и выборочной совокупности выражается
формулой:


(6.2)

Если
n
велико, следовательно

Таким
образом, можно приблизительно считать,
что выборочная дисперсия равна генеральной
дисперсии.


2 =
S2

И формула средней ошибки повторной
выборки (6.1.) примет вид:


(6.3)

Но
здесь мы рассмотрели только ошибку
выборки для средней величины интересующего
признака. Существует также показатель
доли единиц с интересующим признаком.
Расчет ошибки этого показателя имеет
свои особенности.

Дисперсия
для показателя доли признака определяется
по формуле:

S2=(1-)
(6.4)

Тогда средняя ошибка повтора выборки
для показателя доли признака будет
равна:


(6.5)

Доказательство
формул (6.3) и (6.5) исходит из схемы повторной
выборки. Обычно же выборку организуют
бесповторным способом. Т.к. при бесповторном
отборе численность генеральной
совокупности N
в коде выборки сокращается, то в формулы
ошибки выборки включают дополнительный
множитель
,
и формулы
принимают вид:


(6.6)


(6.7)

Пример
1. Определим, на сколько отличаются
выборочные и генеральные показатели
по данным 10%-ной бесповторной выборки
успеваемости студентов.

Оценка,
х
i

Число
студентов в выборке,
fi

2

9

3

27

4

54

5

10

Итого

100

Расчет ошибки бесповторной выборки для
средней величины:

n
= 100 N
= 1000

Найдем выборочную
дисперсию по формуле:

Здесь
не известна величина
,
которую можно найти как обычную среднюю
взвешенную величину:

Таким
образом,

Т.е.
можно сказать, что средний балл всех
студентов ()
равен 3,650,07

Теперь
рассчитаем долю студентов в генеральной
совокупности, обучающихся на «4» и «5».

Найдем по выборке
долю студентов, получивших оценки «4»
и «5».

(или
64%)

Расчет
ошибки бесповторной выборки для доли
производится по формуле:

(или
4,5%)

Таким образом, доля студентов, обучающихся
на «4» и «5» по генеральной совокупности
(P) составляет
0,640,045 (или 64%4,5%).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Справочник /
Лекторий Справочник /
Лекционные и методические материалы по статистике /
Статистика: выборочное наблюдение

pptx

Конспект лекции по дисциплине «Статистика: выборочное наблюдение»,
pptx

Файл загружается

Файл загружается

Благодарим за ожидание, осталось немного.

pptx

Конспект лекции по дисциплине «Статистика: выборочное наблюдение».
pptx

txt

Конспект лекции по дисциплине «Статистика: выборочное наблюдение», текстовый формат

СТАТИСТИКА
ПРАКТИЧЕСКОЕ ЗАНЯТИЕ
ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
ТЕСТЫ
1. Несплошное наблюдение, при котором статистическому обследованию
подвергаются единицы изучаемой совокупности, отобранные случайным способом,
называется:
А) монографическим;
Б) основного массива;
В) выборочным.
2. Выборочная совокупность – это часть генеральной совокупности:
А) случайно попавшая в поле зрения исследователя;
Б) состоящая из единиц, отобранных в случайном порядке;
В) состоящая из единиц, номера которых отобраны в случайном порядке.
3. Укажите, при соблюдении каких условий выборка будет репрезентативной,
представительной:
А) отбор единиц совокупности, при котором каждая из единиц получает
определенную, обычно равную вероятность попасть в выборку;
Б) достаточное количество отобранных единиц совокупности;
В) отбор единиц произвольный.
4. Отбор, при котором попавшая в выборку единица не возвращается в совокупность,
из которой осуществляется дальнейший отбор, является:
А) повторным;
Б) бесповторным.
5. Укажите основные способы отбора единиц в выборочную совокупность из
генеральной:
А) собственно-случайный;
Б) механический;
В) монографический;
Г) анкетный;
Д) типический;
Е) серийный.
6. Отклонение выборочных характеристик от соответствующих характеристик
генеральной совокупности, возникающее вследствие нарушения принципа
случайности отбора, называется:
А) случайной ошибкой;
Б) систематической ошибкой репрезентативности.
7. Отклонение выборочных характеристик от соответствующих характеристик
генеральной совокупности, возникающее вследствие несплошного характера
наблюдения, называется:
А) случайной ошибкой репрезентативности;
Б) систематической ошибкой репрезентативности.
8. Преимущество выборочного наблюдения перед сплошным состоит в более точном
определении обобщающих характеристик:
А) да;
Б) нет.
9. Выборочное наблюдение в сравнении со сплошным позволяет расширить
программу исследования:
А) да;
Б) нет.
10. Вычисленные параметры по выборочной совокупности:
А) характеризует саму выборку;
Б) точно характеризуют генеральную совокупность;
В) не точно характеризуют генеральную совокупность.
11. Ошибка выборки представляет собой
характеристик
выборочной
совокупности
совокупности:
А) да;
Б) нет.
12. Величина ошибки выборки зависит от:
А) величины самого вычисляемого параметра;
Б) единиц измерения параметра;
В) объема численности выборки.
возможные пределы отклонений
от
характеристик
генеральной
13. Размер ошибки выборки прямо пропорционален:
А) дисперсии признака;
Б) среднему квадратическому отклонению.
14. Величина ошибки выборки обратно пропорциональна:
А) численности единиц выборочной совокупности;
Б) квадратному корню из этой численности.
15. Увеличение доверительной вероятности:
А) увеличивает ошибку выборки;
Б) уменьшает ошибку выборки.
16. Механический отбор всегда бывает:
А) повторным;
Б) бесповторным.
17. Типический отбор применяется в тех случаях, когда генеральная совокупность:
А) неоднородна по показателям, подлежащим изучению;
Б) однородна по показателям, подлежащим изучению.
18. Укажите, связана ли величина t с объемом выборки:
А) связана;
Б) не связана.
19. Укажите, от чего зависит величина t:
А) от вероятности, с какой необходимо гарантировать пределы ошибки выборки;
Б) от объема генеральной совокупности.
20. Укажите, что произойдет с предельной ошибкой выборки, если дисперсию
увеличить в 4 раза:
А) уменьшится в 2 раза;
Б) увеличится в 2 раза;
Г) не изменится.
21. Укажите, что произойдет с предельной ошибкой выборки, если дисперсию
уменьшить в 4 раза, численность выборки увеличить в 9 раз, а вероятность исчисления
изменится с 0,683 до 0,997 (t = 1 и t = 3):
А) уменьшится в 18 раз;
Б) увеличится в 18 раз;
В) уменьшится в 2 раза;
Г) не изменится.
22. Механический отбор точнее собственно-случайного, поскольку он:
А) более сложно организован;
Б) всегда бесповторен.
23. Расположите по возрастанию точности следующие способы отбора:
А) собственно-случайный;
Б) механический;
В) типический;
Г) серийный (гнездовой).
24. Типический отбор точнее, поскольку он:
А) наиболее сложно организован;
Б) обеспечивает попадание в выборку представителей из выделенных групп в
генеральной совокупности.
25. Величина ошибки выборки при типическом отборе меньше, поскольку в ее расчете
используется:
А) общая дисперсия признака;
Б межгрупповая дисперсия;
В) средняя из внутригрупповых дисперсий.
26. Увеличение численности выборки в 4 раза:
А) уменьшает ошибку выборки в 2 раза;
Б) увеличивает ошибку выборки в 2 раза;
В) уменьшает ошибку выборки в 4 раза;
Г) увеличивает ошибку выборки в 4 раза;
Д) не изменяет ошибку выборки.
27. Величина ошибки выборки:
А) прямо пропорциональна ;
Б) обратно пропорциональна ;
В) обратно пропорциональна n.
28. Ошибка выборки при механическом отборе уменьшится в следующем случае:
А) если уменьшить численность выборочной совокупности;
Б) если увеличить численность выборочной совокупности.
29. Укажите, при
репрезентативность:
А) серийной;
Б) типической;
В) случайной;
Г) механической.
каком
виде
выборки
обеспечивается
наибольшая
30. По данным выборочного наблюдения оценивается среднее значение некоторой
величины. Укажите, в каком направлении изменится предельная ошибка оценки, если
доверительная вероятность увеличится:
А) уменьшится;
Б) увеличится;
В) не изменится.
31. В выборах мэра примут участие около 1 млн избирателей: кандидат Р. Будет
выбран, если за него проголосуют более 50 % избирателей. Накануне выборов
проведен опрос случайно отобранных 1000 избирателей: 540 из них сказали, что будут
голосовать за Р. Укажите, можно ли при уровне доверительной вероятности 0,954
утверждать, что Р. Победит на выборах:
А) можно;
Б) нельзя.
32. Исследуемая партия состоит из 5 тыс. деталей. Предполагается, что партия деталей
содержит 8 % бракованных. Определите необходимый объем выборки, чтобы с
вероятностью 0,997 установить долю брака с погрешностью не более 2 %:
А) 1650;
Б) 1244;
В) 1300.
33. Укажите, по какой формуле определяется предельная ошибка выборки средней при
типическом отборе для бесповторной выборки:
А) ;
Б)
В)
Г)
34. Укажите, по какой формуле определяется предельная ошибка выборки для доли
при механическом отборе:
А) ;
Б)
В)
Г)
35. Из партии готовой продукции методом случайного бесповторного отбора отобрано
250 изделий, из которых пять оказались бракованными. Определите с вероятностью
0,954 возможные пределы процента брака во всей партии. Объем выборки составляет
10 % всего объема готовой продукции:
А) 2% ± 1,68%;
Б) 10% ± 2%.
36. Малой выборкой называется выборочное наблюдение, объем которого:
А) не превышает 30 единиц;
Б) не превышает 50 единиц.
37. По данным 5%-ного выборочного обследования, дисперсия среднего срока
пользования краткосрочным кредитом 1-го банка 144, а 2-го 81. Число счетов 1-го
банка в 4 раза больше, чем 2-го. Ошибка выборки больше:
А) в 1-м банке;
Б) во 2-м банке;
В) ошибки одинаковы;
Г) предсказать невозможно.
38. По выборочным данным (10%-ный отбор) удельный вес счетов со сроком
пользования кредитом, превышающим 50 дней, в 1-м банке составил 5%, во 2-м банке
10%. При одинаковой численности счетов в выборочной совокупности ошибка
выборки больше:
А) в 1-м банке;
Б) во 2-м банке;
В) ошибки равны;
Г) данные не позволяют сделать вывод.
39. Укажите, по какой формуле можно определить необходимый объем выборки при
собственно случайном повторном отборе при определении доли признака:
А) ;
Б) .
ПРИМЕРЫ РЕШЕНИЯ ЗАДАЧ
Пример 1.
Для определения средней цены товара А в порядке случайной выборки было
обследовано 100 торговых предприятий, в результате установлено, что средняя цена в
выборке товара А составила 57 руб. при среднеквадратическом отклонении 4 руб.
Установлено, что в выборочной совокупности 20 торговых предприятий торгуют
импортным товаром.
С вероятностью 0,954 определите пределы, в которых будет находиться средняя
цена товара А во всех торговых предприятиях, и долю предприятий, торгующих
импортным товаром.
Решение.
Поскольку общая численность генеральной совокупности торговых предприятий
не указана, расчет ошибки средней можно произвести только по формуле:
Тогда пределы, в которых находится средняя цена во всей совокупности торговых
предприятий, будут:
Таким образом, с вероятностью, равной 0,954 можно утверждать, что цена товара
А, продаваемого во всех торговых предприятиях, будет не менее 56 руб. 20 коп. и не
превысит величину 57 руб. 80 коп.
Доля торговых предприятий, торгующих импортным товаром, находится в
пределах:
Выборочная доля составит:
Ошибку выборки для доли определим по формуле:
.
.
С вероятностью 0,954 можно утверждать, что доля магазинов, торгующих
импортным товаром, во всей их совокупности будет находится в пределах
р = 20% ± 8%, или 12% ≤ р ≤ 28%.
Пример 2.
Для определения среднего срока пользования краткосрочным кредитом в банке
была проведена 10%-ная механическая выборка, в которую попало 200 счетов. В
результате обследования установлено, что средний срок пользования краткосрочным
кредитом 40 дней при среднеквадратическом отклонении 8 дней. В десяти счетах срок
пользования кредитом превышал 50 дней. С вероятностью 0,954 определить пределы,
в которых будет находиться срок пользования краткосрочным кредитом в генеральной
совокупности и доля счетов со сроком пользования краткосрочным кредитом более 50
дней.
Решение.
Средний срок пользования кредитом в банке находится в пределах:
.
Т.к. выборка механическая, то ошибка выборки определяется по формуле:
С вероятностью 0,954 можно утверждать, что срок пользования краткосрочным
кредитом в банке находится в пределах:
.
Доля кредитов со сроком пользования более 50 дней находится в пределах:
Выборочная доля составит:
05
Ошибку выборки для доли определим по формуле:
.
С вероятностью 0,954 можно утверждать, что доля кредитов в банке со сроком
пользования более 50 дней будет находится в пределах р = 5% ± 2,9%, или
2,1% ≤ р ≤ 7,9%.
Пример 3.
В результате 10%-ного выборочного обследования, проведенного по методу
пропорционального типического отбора, получены исходные данные (табл.).
Показатели
Работники государственных
предприятий и учреждений
Средняя
заработ ная
плат а, руб.
Число
обследованн
ых
работников,
чел.
Среднее
квадратичес
кое
отклонение,
руб.
Удельны й
вес ж енщин
в общей
численности
работников,
%
3900
400
800
40
С вероятностью
0,954 определите
пределы,600
в которых будет
средняя
Работники
частных
5600
1200 находится 50
заработная
предприятийплата работников, и долю женщин в общей численности работников.
Решение.
1. Определим среднюю заработную плату работников:
2. Вычислим среднюю из групповых дисперсий:
.
3. Определим предельную ошибку выборки по формуле:
— средняя дисперсия выборочной совокупности.
4. Средняя заработная плата работников находится в пределах:
Т.о., с вероятностью 0,954 можно гарантировать, что средняя заработная плата
работников в генеральной совокупности будет не менее 4856 руб. 50 коп., но не более
4983 руб. 50 коп.
5. Долю женщин в общей численности работников определим по формуле:
6. Выборочную дисперсию альтернативного признака вычислим по формуле:
.
Ошибку для доли определим по формуле:
7. Доля женщин в общей численности работников находится в пределах:
Следовательно, с вероятностью 0,954 можно утверждать, что доля женщин в
генеральной совокупности находится в пределах от 43 до 49 %.
Пример 4.
В одном из учебных заведений насчитывается 50 студенческих групп. С целью
изучения успеваемости студентов произведена 10%-ная серийная выборка, в которую
попали 5 групп студентов. В результате обследования установлено, что средняя
успеваемость в группах составила: 3,2; 3,4; 3,8; 4,0; 4,1 балла. С вероятностью 0,997
определите пределы, в которых будет находиться средний балл студентов учебного
заведения.
Решение.
Средний балл всех студентов находится в пределах:
.
Определим выборочную среднюю серийной выборки:
Дисперсию серийной выборки определим по формуле:
где — выборочная средняя каждой серии;
— выборочная средняя серийной выборки.
Значение дисперсии составляет:
Рассчитаем предельную ошибку выборки для средней по формуле:
где — межсерийная дисперсия; – число отобранных серий; – число серий в
генеральной совокупности.
С вероятностью 0,997 можно утверждать, что средний балл всех студентов
учебного заведения находится в пределах , или балла.
Пример 5.
Предприятие выпустило 100 партий готовой продукции А по 50 шт. в каждой из
них. Для проверки качества готовой продукции была проведена 10%-ная серийная
выборка, в результате которой установлено, что доля бракованной продукции
составила 12%. Дисперсия серийной выборки равна 0,0036.
С вероятностью 0,997 определите пределы, в которых находится доля бракованной
продукции А.
Решение.
Доля бракованной продукции А будет находится в пределах:
Определим предельную ошибку выборки для серийного отбора:
С вероятностью 0,997 можно утверждать, что доля бракованной продукции А
находится в пределах 6,6% ≤ р ≤ 17,4%.
Пример 6.
Определите численность рабочих, которую необходимо отобрать в выборочную
совокупность с тем, чтобы при изучении их средней заработной платы предельная
ошибка выборки не превышала 30 руб. с вероятностью 0,997, если по данным
предыдущего обследования среднее квадратическое отклонение составило 70 руб.
Решение.
Поскольку способ отбора не указан, расчет следует проводить по формуле для
повторного отбора:
Пример 7.
В городе Н проживает 100 тыс. чел. С помощью механической выборки
определите долю населения со среднедушевыми денежными доходами до 1500 руб. в
месяц. Какова должна быть численность выборки, чтобы с вероятностью 0,997 ошибка
выборки не превышала 2%, если на основе предыдущих обследований известно, что
дисперсия равна 0,24?
Решение.
Определим необходимую численность выборки по формуле:
Задачи для самостоятельного решения
Задача 1.
В результате выборочного обследования незанятого населения, ищущего работу,
осуществленного на основе собственно-случайной повторной выборки, получен
следующий ряд распределения (табл.).
Возраст, лет
до 25
25 — 35
35 — 45
45 — 55
55 и
более
Численность
15
37
71
45
22
лиц данного
С вероятностью 0,954 определите границы:
возраста
а) среднего возраста незанятого населения;
б) доли (удельного веса) лиц, моложе 25 лет, в общей численности незанятого
населения.
Задачи для самостоятельного решения
Задача 2.
Определите, сколько учащихся первых классов школ района необходимо отобрать в
порядке собственно-случайной бесповторной выборки, чтобы с вероятностью 0,997
определить границы среднего роста первоклассников с предельной ошибкой 2 см.
Известно, что всего в первых классах школ района обучается 1100 учеников, а
дисперсия роста по результатам аналогичного обследования в другом районе
составила 24.
Задачи для самостоятельного решения
Задача 3.
В целях изучения доходов населения по трем районам области сформирована 2%ная выборка, пропорциональная численности населения этих районов. Полученные
результаты представлены в табл.
Район
I
Численность
населения,
чел.
Обследова
но, чел.
120 000
2400
Доход в расчете на 1
человека
средняя,
тыс. руб.
дисперсия
2,9
1,3
II
170 000
3400
2,5
1,1
Определите границы среднедушевых доходов населения по области в целом при
III
90 000
1800
2,7
1,6
уровне вероятности 0,997.
Задачи для самостоятельного решения
Задача 4.
В целях контроля качества комплектующих из партии изделий, упакованных в 50
ящиков по 20 изделий в каждом, была произведена 10%-ная серийная выборка. По
попавшим в выборку ящикам среднее отклонение параметров изделия от нормы
соответственно составило 9; 11; 12; 8 и 14 мм. С вероятностью 0,954 определите
среднее отклонение параметров по всей партии в целом.
Задача 5.
Планируется обследование населения с целью определения средних расходов на
медицинские услуги и лекарственные средства. Определите необходимый объем
собственно-случайной бесповторной выборки, чтобы получить результаты с
точностью 10 руб. при уровне вероятности 0,954. Известно, что в районе проживает 73
тыс. человек, а пробное обследование показало, что среднее квадратическое
отклонение расходов населения на эти цели составляет 38 руб.

Статистика

Статистика. Статистические данные

ПРАВИТЕЛЬСТВО САНКТ-ПЕТЕРБУРГА
КОМИТЕТ ПО НАУКЕ И ВЫСШЕЙ ШКОЛЕ
Государственное бюджетное образовательное учреждение среднего профессионального образов…

Автор лекции

Смирнова С. О.

Авторы

Статистика

Статистика

Курс : Статистика
Статистика В.М. Гусаров Москва, Юнити , 2003г
Статистика В.С. Мхиторян , Москва, Экономист, 2005г.
Статистика И.И. Елисеева
Статисти…

Смотреть все

Поделись лекцией и получи скидку!

Заполни поля, отправь лекцию и мы вышлем тебе скидку-промокод на Автор24

Предмет

Название лекции

Авторы

Описание

Другие Экономические предметы

  • Экономика

  • Менеджмент

  • Бухгалтерский учет и аудит

  • Управление персоналом

  • Статистика

  • Маркетинг

  • Экономика предприятия

  • Государственное и муниципальное управление

  • Финансовый менеджмент

  • Эконометрика

  • Финансы

  • Менеджмент организации

  • Бизнес-планирование

  • Управление проектами

  • Экономический анализ

  • Экономическая теория

  • Микро-, макроэкономика

  • Инновационный менеджмент

  • Логистика

  • Анализ хозяйственной деятельности

Концепция репрезентативности часто встречается в статистических отчетах и ​​при подготовке выступлений и отчетов. Пожалуй, без него сложно представить какое-либо представление информации для ознакомления.

Содержание

  • 1 Репрезентативность — что это?
  • 2 Другие определения
  • 3 Репрезентативная выборка
  • 4 Вероятностная выборка
  • 5 Вероятностные выборки
  • 6 Выборка потребителей
  • 7 Размер выборки
  • 8 Понятие ошибки репрезентативности
  • 9 Виды ошибок
  • 10 Преднамеренные и непреднамеренные ошибки репрезентативности
  • 11 Валидность, надежность, репрезентативность. Расчет ошибок
  • 12 Репрезентативные системы

Репрезентативность — что это?

понятие репрезентативности

Репрезентативность отражает степень, в которой выбранные объекты или части соответствуют содержанию и значению набора данных, из которого они были выбраны.

Другие определения

Репрезентативность можно понимать в разных контекстах. Но по своему смыслу репрезентативность — это соответствие характеристик и свойств выбранных единиц генеральной совокупности, которые точно отражают характеристики всей генеральной базы данных в целом.репрезентативность, что это такое

Кроме того, репрезентативность информации определяется как способность данных выборки представлять параметры и свойства совокупности, которые важны с точки зрения проводимых исследований.

Репрезентативная выборка

Принцип выборки заключается в выборе наиболее важных свойств, которые точно отражают общую совокупность данных. Для этого используются различные методы, позволяющие получить точные результаты и общее представление о генеральной совокупности, используя только выборочные материалы, описывающие качество всех данных.

Таким образом, нет необходимости изучать весь материал, но достаточно учесть выборочную репрезентативность. Что это? Это набор отдельных данных, чтобы получить представление об общей массе информации.репрезентативность результатов

В зависимости от метода они делятся на вероятностные и маловероятные. Вероятностный — это выборка, которая создается путем вычисления наиболее важных и интересных данных, которые в будущем будут репрезентативными для генеральной совокупности. Это осознанный выбор или случайная выборка, однако оправданная своим содержанием.

Маловероятно — это одна из разновидностей случайной выборки, составленной по принципу обычной лотереи. В этом случае мнение лица, взявшего такую ​​пробу, не принимается во внимание. Используется только слепая жребий.

Вероятностная выборка

Вероятностные выборки также можно разделить на несколько типов:

  • Один из самых простых и понятных принципов — нерепрезентативная выборка. Например, этот метод часто используется при проведении социальных опросов. При этом участники опроса не выбираются из общей массы по каким-либо конкретным критериям, а информация берется от первых 50 человек, принявших участие.
  • Выборка вероятностей — это еще одна разновидность выборки невероятности, которая часто используется для исследования больших наборов данных. Для этого используется множество условий и правил. Выбираются объекты, которые должны им соответствовать. То есть на примере социального опроса можно предположить, что будет опрошено 100 человек, но при составлении статистического отчета будет учитываться только мнение определенного количества людей, которые будут соответствовать установленным требованиям.
  • Преднамеренные выборки отличаются тем, что они имеют ряд требований и условий для отбора, но все же полагаются на совпадения, не преследуя цели получения хорошей статистики.

репрезентативность информации

Вероятностные выборки

Для вероятностных выборок рассчитывается ряд параметров, которым будут соответствовать объекты в выборке, и среди них различными способами могут быть выбраны именно те факты и данные, которые будут представлены как репрезентативность данных выборки. Эти методы расчета требуемых данных могут быть:

  • Простая случайная выборка. Он заключается в том, что среди выделенного сегмента методом полностью случайной лотереи выбирается необходимый объем данных, который будет репрезентативной выборкой.
  • Систематическая и случайная выборка позволяет составить систему расчета необходимых данных на основе случайно выбранного сегмента. Итак, если первое случайное число, указывающее порядковый номер данных, выбранных из общей совокупности, равно 5, следующими данными для выбора могут быть, например, 15, 25, 35 и так далее. Этот пример ясно объясняет, что даже случайный выбор может быть основан на систематических вычислениях требуемых входных данных.

Выборка потребителей

Осмысленная выборка — это способ взглянуть на каждый отдельный сегмент, и на основе его оценки составляется генеральная совокупность, отражающая характеристики и свойства всей базы данных. Таким образом, собирается больше данных, отвечающих требованиям репрезентативной выборки. Легко выбрать набор параметров, которые не будут включены в общее количество, без потери качества выбранных данных, представляющих генеральную совокупность. Таким образом определяется репрезентативность результатов исследования.

Размер выборки

Не последняя проблема, которую необходимо решить, — это размер выборки для репрезентативной репрезентативности населения. Размер выборки не всегда зависит от количества источников в генеральной совокупности. Однако репрезентативность выборки напрямую зависит от того, на сколько сегментов в конечном итоге следует разделить результат. Чем больше таких сегментов, тем больше данных включается в итоговую выборку. Если результаты требуют общих обозначений и не требуют конкретики, то в результате выборка становится меньше, поскольку, не вдаваясь в детали, информация представлена ​​более поверхностно, а значит, ее прочтение будет общим.

ошибка репрезентативности

Понятие ошибки репрезентативности

Репрезентативная систематическая ошибка — это конкретное несоответствие между характеристиками населения и данными выборки. При проведении выборочного исследования невозможно получить абсолютно точные данные, как при полном изучении генеральных популяций и выборки, представленной только частью информации и параметров, в то время как более детальное изучение возможно только при изучении всей совокупности численность населения. Поэтому некоторые ошибки и ошибки неизбежны.

Виды ошибок

При составлении репрезентативной выборки возникают некоторые ошибки:

  • Случайный.
  • Стандарт.
  • Не намеренно.
  • Систематический.
  • Предел.
  • Умышленное.

Причиной появления случайных ошибок может быть прерывистый характер исследования генеральной совокупности. Обычно ошибка случайной репрезентативности незначительна по величине и характеру.

Между тем систематические ошибки возникают, когда нарушаются правила отбора данных из генеральной совокупности.репрезентативность данных

Средняя ошибка — это разница между средним значением выборки и основной совокупностью. Это не зависит от количества единиц в выборке. Он обратно пропорционален размеру выборки. Таким образом, чем больше объем, тем меньше среднее значение ошибки.

Предельная ошибка — это наибольшая возможная разница между средним значением выполненной выборки и всей генеральной совокупностью. Эта ошибка характеризуется как максимум возможных ошибок в данных условиях их возникновения.

Преднамеренные и непреднамеренные ошибки репрезентативности

Ошибки искажения данных могут быть преднамеренными или непреднамеренными.

Итак, причины появления преднамеренных ошибок — это подход к отбору данных с использованием метода выявления трендов. Непреднамеренные ошибки возникают и на этапе подготовки выборочного наблюдения, формирования репрезентативной выборки. Чтобы избежать таких ошибок, необходимо создать хорошую основу выборки для списков единиц выборки. Он должен полностью соответствовать целям выборки, быть надежным и охватывать все аспекты исследования.

Валидность, надежность, репрезентативность. Расчет ошибок

1

Расчет ошибки репрезентативности (Mm) среднего арифметического (M).

Стандартное отклонение: размер выборки (> 30).

Репрезентативная ошибка (Мр) и относительная величина (Р): размер выборки (n> 30).

В случае, если необходимо изучить совокупность, где размер выборки невелик и менее 30 единиц, количество наблюдений уменьшится на одну единицу.

Величина ошибки прямо пропорциональна размеру выборки. Репрезентативность информации и расчет степени возможности составления точного прогноза отражает определенное значение предельной погрешности.2

Репрезентативные системы

В процессе оценки представления информации используется не только репрезентативная выборка, но и лицо, получающее информацию, также использует репрезентативные системы. Таким образом, мозг обрабатывает определенный объем информации, создавая репрезентативную выборку всего потока информации, чтобы качественно и быстро оценить предоставленные данные и понять суть проблемы. Ответьте на вопрос: «Представление — что это?» — В масштабе человеческого сознания это довольно просто. Для этого мозг использует все подчиненные органы чувств, в зависимости от типа информации, которую необходимо изолировать от общего потока. Поэтому проводится различие между:3

  • Система визуального представления, в которой задействованы органы зрительного восприятия глаза. Людей, которые часто используют эту систему, называют визуалами. С помощью этой системы человек обрабатывает информацию, поступающую в виде изображений.
  • Система кинестетической репрезентации — это обработка потока информации путем ее восприятия через обонятельные и тактильные каналы.
  • Система слухового представления. Основной используемый орган — слух. Информация, предоставленная в виде аудио- или голосового файла, обрабатывается именно этой системой. Людей, которые лучше всего воспринимают информацию на слух, называют аудиалами.

4

  • Система цифрового представления используется вместе с другими как средство получения информации извне. Это субъективно-логическое восприятие и понимание полученных данных.

достоверность надежность репрезентативность

Так что же такое репрезентативность? Простая выборка из набора или целостная процедура обработки информации? Мы можем однозначно сказать, что репрезентативность во многом определяет наше восприятие потоков данных, помогая выделить самые тяжелые и наиболее важные из них.

11.2. Оценка результатов выборочного наблюдения

11.2.1. Средняя и предельная ошибки выборки. Построение доверительных границ для средней и доли

Средняя ошибка выборки показывает, насколько отклоняется в среднем параметр выборочной совокупности от соответствующего параметра генеральной. Если рассчитать среднюю из ошибок всех возможных выборок определенного вида заданного объема (n), извлеченных из одной и той же генеральной совокупности, то получим их обобщающую характеристику — среднюю ошибку выборки (mu).

В теории выборочного наблюдения выведены формулы для определения mu, которые индивидуальны для разных способов отбора (повторного и бесповторного), типов используемых выборок и видов оцениваемых статистических показателей.

Например, если применяется повторная собственно случайная выборка, то mu определяется как:

— при оценивании среднего значения признака;

— если признак альтернативный, и оценивается доля.

При бесповторном собственно случайном отборе в формулы вносится поправка (1 — n/N):

— для среднего значения признака;

— для доли.

Вероятность получения именно такой величины ошибки всегда равна 0,683. На практике же предпочитают получать данные с большей вероятностью, но это приводит к возрастанию величины ошибки выборки.

Предельная ошибка выборки (Delta) равна t-кратному числу средних ошибок выборки (в теории выборки принято коэффициент t называть коэффициентом доверия):

Delta =t mu.

Если ошибку выборки увеличить в два раза (t = 2), то получим гораздо большую вероятность того, что она не превысит определенного предела (в нашем случае — двойной средней ошибки) — 0,954. Если взять t = 3, то доверительная вероятность составит 0,997 — практически достоверность.

Уровень предельной ошибки выборки зависит от следующих факторов:

  • степени вариации единиц генеральной совокупности;
  • объема выборки;
  • выбранных схем отбора (бесповторный отбор дает меньшую величину ошибки);
  • уровня доверительной вероятности.

Если объем выборки больше 30, то значение t определяется по таблице нормального распределения, если меньше — по таблице распределения Стьюдента.

Приведем некоторые значения коэффициента доверия из таблицы нормального распределения.

Таблица
11.2.

Значение доверительной вероятности P 0,683 0,954 0,997
Значение коэффициента доверия t 1,0 2,0 3,0

Доверительный интервал для среднего значения признака и для доли в генеральной совокупности устанавливается следующим образом:

Итак, определение границ генеральной средней и доли состоит из следующих этапов:

Ошибки выборки при различных видах отбора

  1. Собственно случайная и механическая выборка. Средняя ошибка собственно случайной и механической выборки находятся по формулам, представленным в табл. 11.3.

Таблица
11.3.
Формулы для расчета средней ошибки собственно случайной и механической выборки (mu)

где sigma^{2} — дисперсия признака в выборочной совокупности.

Пример 11.2. Для изучения уровня фондоотдачи было проведено выборочное обследование 90 предприятий из 225 методом случайной повторной выборки, в результате которого получены данные, представленные в таблице.

Таблица
11.4.

Уровень фондоотдачи, руб. До 1,4 1,4-1,6 1,6-1,8 1,8-2,0 2,0-2,2 2,2 и выше Итого
Количество предприятий 13 15 17 15 16 14 90

В рассматриваемом примере имеем 40%-ную выборку (90 : 225 = 0,4, или 40%). Определим ее предельную ошибку и границы для среднего значения признака в генеральной совокупности по шагам алгоритма:

  1. По результатам выборочного обследования рассчитаем среднее значение и дисперсию в выборочной совокупности:

Таблица
11.5.

Результаты наблюдения Расчетные значения
уровень фондоотдачи, руб., xi количество предприятий, fi середина интервала, xixb4 xixb4fi xixb42fi
До 1,4 13 1,3 16,9 21,97
1,4-1,6 15 1,5 22,5 33,75
1,6-1,8 17 1,7 28,9 49,13
1,8-2,0 15 1,9 28,5 54,15
2,0-2,2 16 2,1 33,6 70,56
2,2 и выше 14 2,3 32,2 74,06
Итого 90 162,6 303,62

Выборочная средняя

Выборочная дисперсия изучаемого признака

  1. Определяем среднюю ошибку повторной случайной выборки

  2. Зададим вероятность, на уровне которой будем говорить о величине предельной ошибки выборки. Чаще всего она принимается равной 0,999; 0,997; 0,954.

Для наших данных определим предельную ошибку выборки, например, с вероятностью 0,954. По таблице значений вероятности функции нормального распределения (см. выдержку из нее, приведенную в Приложении 1) находим величину коэффициента доверия t, соответствующего вероятности 0,954. При вероятности 0,954 коэффициент t равен 2.

  1. Предельная ошибка выборки с вероятностью 0,954 равна

    delta_{x}= tmu_{x}= 2*0.035 = 0.07

  2. Найдем доверительные границы для среднего значения уровня фондоотдачи в генеральной совокупности

Таким образом, в 954 случаях из 1000 среднее значение фондоотдачи будет не выше 1,88 руб. и не ниже 1,74 руб.

Выше была использована повторная схема случайного отбора. Посмотрим, изменятся ли результаты обследования, если предположить, что отбор осуществлялся по схеме бесповторного отбора. В этом случае расчет средней ошибки проводится по формуле

Тогда при вероятности равной 0,954 величина предельной ошибки выборки составит:

delta_{x}= tmu_{x}= 2*0.027 = 0.054

Доверительные границы для среднего значения признака при бесповторном случайном отборе будут иметь следующие значения:

Сравнив результаты двух схем отбора, можно сделать вывод о том, что применение бесповторной случайной выборки дает более точные результаты по сравнению с применением повторного отбора при одной и той же доверительной вероятности. При этом, чем больше объем выборки, тем существеннее сужаются границы значений средней при переходе от одной схемы отбора к другой.

По данным примера определим, в каких границах находится доля предприятий с уровнем фондоотдачи, не превышающим значения 2,0 руб., в генеральной совокупности:

  1. рассчитаем выборочную долю.

Количество предприятий в выборке с уровнем фондоотдачи, не превышающим значения 2,0 руб., составляет 60 единиц. Тогда

m = 60, n = 90, w = m/n = 60 : 90 = 0,667;

  1. рассчитаем дисперсию доли в выборочной совокупности

sigma_{w}^{2}= w(1 - w) = 0,667(1 - 0,667) = 0,222;

  1. средняя ошибка выборки при использовании повторной схемы отбора составит

Если предположить, что была использована бесповторная схема отбора, то средняя ошибка выборки с учетом поправки на конечность совокупности составит

  1. зададим доверительную вероятность и определим предельную ошибку выборки.

При значении вероятности Р = 0,997 по таблице нормального распределения получаем значение для коэффициента доверия t = 3 (см. выдержку из нее, приведенную в Приложении 1):

delta_{x}= tmu_{x}= 3*0.04 = 0.12

  1. установим границы для генеральной доли с вероятностью 0,997:

Таким образом, с вероятностью 0,997 можно утверждать, что в генеральной совокупности доля предприятий с уровнем фондоотдачи, не превышающим значения 2,0 руб., не меньше, чем 54,7%, и не больше 78,7%.

  1. Типическая выборка. При типической выборке генеральная совокупность объектов разбита на k групп, тогда

N1 + N2 + … + Ni + … + Nk = N.

Объем извлекаемых из каждой типической группы единиц зависит от принятого способа отбора; их общее количество образует необходимый объем выборки

n1 + n2 + … + ni + … + nk = n.

Существуют следующие два способа организации отбора внутри типической группы: пропорциональной объему типических групп и пропорциональной степени колеблемости значений признака у единиц наблюдения в группах. Рассмотрим первый из них, как наиболее часто используемый.

Отбор, пропорциональный объему типических групп, предполагает, что в каждой из них будет отобрано следующее число единиц совокупности:

n = ni · Ni/N

где ni — количество извлекаемых единиц для выборки из i-й типической группы;

n — общий объем выборки;

Ni — количество единиц генеральной совокупности, составивших i-ю типическую группу;

N — общее количество единиц генеральной совокупности.

Отбор единиц внутри групп происходит в виде случайной или механической выборки.

Формулы для оценивания средней ошибки выборки для среднего и доли представлены в табл. 11.6.

Таблица
11.6.
Формулы для расчета средней ошибки выборки (mu) при использовании типического отбора, пропорционального объему типических групп

Здесь sigma^{2} — средняя из групповых дисперсий типических групп.

Пример 11.3. В одном из московских вузов проведено выборочное обследование студентов с целью определения показателя средней посещаемости вузовской библиотеки одним студентом за семестр. Для этого была использована 5%-ная бесповторная типическая выборка, типические группы которой соответствуют номеру курса. При отборе, пропорциональном объему типических групп, получены следующие данные:

Таблица
11.7.

Номер курса Всего студентов, чел., Ni Обследовано в результате выборочного наблюдения, чел., ni Среднее число посещений библиотеки одним студентом за семестр, xi Внутригрупповая выборочная дисперсия, sigma_{i}^{2}
1 650 33 11 6
2 610 31 8 15
3 580 29 5 18
4 360 18 6 24
5 350 17 10 12
Итого 2 550 128 8

Число студентов, которое необходимо обследовать на каждом курсе, рассчитаем следующим образом:

  • общий объем выборочной совокупности:

    n = 2550/130*5 =128 (чел.);

  • количество единиц, отобранных из каждой типической группы:

аналогично для других групп:

n2 = 31 (чел.);

n3 = 29 (чел.);

n4 = 18 (чел.);

n5 = 17 (чел.).

Проведем необходимые расчеты.

  1. Выборочная средняя, исходя из значений средних типических групп, составит:

  2. Средняя из внутригрупповых дисперсий

  3. Средняя ошибка выборки:

    С вероятностью 0,954 находим предельную ошибку выборки:

    delta_{x} = tmu_{x} = 2*0.334 = 0.667

  4. Доверительные границы для среднего значения признака в генеральной совокупности:

Таким образом, с вероятностью 0,954 можно утверждать, что один студент за семестр посещает вузовскую библиотеку в среднем от семи до девяти раз.

  1. Малая выборка. В связи с небольшим объемом выборочной совокупности те формулы для определения ошибок выборки, которые использовались нами ранее при «больших» выборках, становятся неподходящими и требуют корректировки.

Среднюю ошибку малой выборки определяют по формуле

Предельная ошибка малой выборки:

delta_{MB}= tmu_{MB}

Распределение значений выборочных средних всегда имеет нормальный закон распределения (или приближается к нему) при п > 100, независимо от характера распределения генеральной совокупности. Однако в случае малых выборок действует иной закон распределения — распределение Стьюдента. В этом случае коэффициент доверия находится по таблице t-распределения Стьюдента в зависимости от величины доверительной вероятности Р и объема выборки п. В Приложении 1 приводится фрагмент таблицы t-распределения Стьюдента, представленной в виде зависимости доверительной вероятности от объема выборки и коэффициента доверия t.

Пример 11.4. Предположим, что выборочное обследование восьми студентов академии показало, что на подготовку к контрольной работе по статистике они затратили следующее количество часов: 8,5; 8,0; 7,8; 9,0; 7,2; 6,2; 8,4; 6,6.

Оценим выборочные средние затраты времени и построим доверительный интервал для среднего значения признака в генеральной совокупности, приняв доверительную вероятность равной 0,95.

  1. Среднее значение признака в выборке равно

  2. Значение среднего квадратического отклонения составляет

  3. Средняя ошибка выборки:

  4. Значение коэффициента доверия t = 2,365 для п = 8 и Р = 0,95 .
  5. Предельная ошибка выборки:

    delta_{MB}= tmu_{MB}=2,365*0,344 = 0,81356 ~ 0,81 (ч)

  6. Доверительный интервал для среднего значения признака в генеральной совокупности:

То есть с вероятностью 0,95 можно утверждать, что затраты времени студента на подготовку к контрольной работе находятся в пределах от 6,9 до 8,5 ч.

11.2.2. Определение численности выборочной совокупности

Перед непосредственным проведением выборочного наблюдения всегда решается вопрос, сколько единиц исследуемой совокупности необходимо отобрать для обследования. Формулы для определения численности выборки выводят из формул предельных ошибок выборки в соответствии со следующими исходными положениями (табл. 11.7):

  1. вид предполагаемой выборки;
  2. способ отбора (повторный или бесповторный);
  3. выбор оцениваемого параметра (среднего значения признака или доли).

Кроме того, следует заранее определиться со значением доверительной вероятности, устраивающей потребителя информации, и с размером допустимой предельной ошибки выборки.

Таблица
11.8.
Формулы для определения численности выборочной совокупности

Примечание: при использовании приведенных в таблице формул рекомендуется получаемую численность выборки округлять в большую сторону для обеспечения некоторого запаса в точности.

Пример 11.5. Рассчитаем, сколько из 507 промышленных предприятий следует проверить налоговой инспекции, чтобы с вероятностью 0,997 определить долю предприятий с нарушениями в уплате налогов. По данным прошлого аналогичного обследования величина среднего квадратического отклонения составила 0,15; размер ошибки выборки предполагается получить не выше, чем 0,05.

При использовании повторного случайного отбора следует проверить

При бесповторном случайном отборе потребуется проверить

Как видим, использование бесповторного отбора позволяет проводить обследование гораздо меньшего числа объектов.

Пример 11.6. Планируется провести обследование заработной платы на предприятиях отрасли методом случайного бесповторного отбора. Какова должна быть численность выборочной совокупности, если на момент обследования в отрасли число занятых составляло 100 000 чел.? Предельная ошибка выборки не должна превышать 100 руб. с вероятностью 0,954. По результатам предыдущих обследований заработной платы в отрасли известно, что среднее квадратическое отклонение составляет 500 руб.

Следовательно, для решения поставленной задачи необходимо включить в выборку не менее 100 человек.

СТАТИСТИКА
ПРАКТИЧЕСКОЕ ЗАНЯТИЕ
ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
ТЕСТЫ
1. Несплошное наблюдение, при котором статистическому обследованию
подвергаются единицы изучаемой совокупности, отобранные случайным способом,
называется:
А) монографическим;
Б) основного массива;
В) выборочным.
2. Выборочная совокупность – это часть генеральной совокупности:
А) случайно попавшая в поле зрения исследователя;
Б) состоящая из единиц, отобранных в случайном порядке;
В) состоящая из единиц, номера которых отобраны в случайном порядке.
3. Укажите, при соблюдении каких условий выборка будет репрезентативной,
представительной:
А) отбор единиц совокупности, при котором каждая из единиц получает
определенную, обычно равную вероятность попасть в выборку;
Б) достаточное количество отобранных единиц совокупности;
В) отбор единиц произвольный.
4. Отбор, при котором попавшая в выборку единица не возвращается в совокупность,
из которой осуществляется дальнейший отбор, является:
А) повторным;
Б) бесповторным.
5. Укажите основные способы отбора единиц в выборочную совокупность из
генеральной:
А) собственно-случайный;
Б) механический;
В) монографический;
Г) анкетный;
Д) типический;
Е) серийный.
6. Отклонение выборочных характеристик от соответствующих характеристик
генеральной совокупности, возникающее вследствие нарушения принципа
случайности отбора, называется:
А) случайной ошибкой;
Б) систематической ошибкой репрезентативности.
7. Отклонение выборочных характеристик от соответствующих характеристик
генеральной совокупности, возникающее вследствие несплошного характера
наблюдения, называется:
А) случайной ошибкой репрезентативности;
Б) систематической ошибкой репрезентативности.
8. Преимущество выборочного наблюдения перед сплошным состоит в более точном
определении обобщающих характеристик:
А) да;
Б) нет.
9. Выборочное наблюдение в сравнении со сплошным позволяет расширить
программу исследования:
А) да;
Б) нет.
10. Вычисленные параметры по выборочной совокупности:
А) характеризует саму выборку;
Б) точно характеризуют генеральную совокупность;
В) не точно характеризуют генеральную совокупность.
11. Ошибка выборки представляет собой
характеристик
выборочной
совокупности
совокупности:
А) да;
Б) нет.
12. Величина ошибки выборки зависит от:
А) величины самого вычисляемого параметра;
Б) единиц измерения параметра;
В) объема численности выборки.
возможные пределы отклонений
от
характеристик
генеральной
13. Размер ошибки выборки прямо пропорционален:
А) дисперсии признака;
Б) среднему квадратическому отклонению.
14. Величина ошибки выборки обратно пропорциональна:
А) численности единиц выборочной совокупности;
Б) квадратному корню из этой численности.
15. Увеличение доверительной вероятности:
А) увеличивает ошибку выборки;
Б) уменьшает ошибку выборки.
16. Механический отбор всегда бывает:
А) повторным;
Б) бесповторным.
17. Типический отбор применяется в тех случаях, когда генеральная совокупность:
А) неоднородна по показателям, подлежащим изучению;
Б) однородна по показателям, подлежащим изучению.
18. Укажите, связана ли величина t с объемом выборки:
А) связана;
Б) не связана.
19. Укажите, от чего зависит величина t:
А) от вероятности, с какой необходимо гарантировать пределы ошибки выборки;
Б) от объема генеральной совокупности.
20. Укажите, что произойдет с предельной ошибкой выборки, если дисперсию
увеличить в 4 раза:
А) уменьшится в 2 раза;
Б) увеличится в 2 раза;
Г) не изменится.
21. Укажите, что произойдет с предельной ошибкой выборки, если дисперсию
уменьшить в 4 раза, численность выборки увеличить в 9 раз, а вероятность исчисления
изменится с 0,683 до 0,997 (t = 1 и t = 3):
А) уменьшится в 18 раз;
Б) увеличится в 18 раз;
В) уменьшится в 2 раза;
Г) не изменится.
22. Механический отбор точнее собственно-случайного, поскольку он:
А) более сложно организован;
Б) всегда бесповторен.
23. Расположите по возрастанию точности следующие способы отбора:
А) собственно-случайный;
Б) механический;
В) типический;
Г) серийный (гнездовой).
24. Типический отбор точнее, поскольку он:
А) наиболее сложно организован;
Б) обеспечивает попадание в выборку представителей из выделенных групп в
генеральной совокупности.
25. Величина ошибки выборки при типическом отборе меньше, поскольку в ее расчете
используется:
А) общая дисперсия признака;
Б межгрупповая дисперсия;
В) средняя из внутригрупповых дисперсий.
26. Увеличение численности выборки в 4 раза:
А) уменьшает ошибку выборки в 2 раза;
Б) увеличивает ошибку выборки в 2 раза;
В) уменьшает ошибку выборки в 4 раза;
Г) увеличивает ошибку выборки в 4 раза;
Д) не изменяет ошибку выборки.
27. Величина ошибки выборки:
А) прямо пропорциональна ;
Б) обратно пропорциональна ;
В) обратно пропорциональна n.
28. Ошибка выборки при механическом отборе уменьшится в следующем случае:
А) если уменьшить численность выборочной совокупности;
Б) если увеличить численность выборочной совокупности.
29. Укажите, при
репрезентативность:
А) серийной;
Б) типической;
В) случайной;
Г) механической.
каком
виде
выборки
обеспечивается
наибольшая
30. По данным выборочного наблюдения оценивается среднее значение некоторой
величины. Укажите, в каком направлении изменится предельная ошибка оценки, если
доверительная вероятность увеличится:
А) уменьшится;
Б) увеличится;
В) не изменится.
31. В выборах мэра примут участие около 1 млн избирателей: кандидат Р. Будет
выбран, если за него проголосуют более 50 % избирателей. Накануне выборов
проведен опрос случайно отобранных 1000 избирателей: 540 из них сказали, что будут
голосовать за Р. Укажите, можно ли при уровне доверительной вероятности 0,954
утверждать, что Р. Победит на выборах:
А) можно;
Б) нельзя.
32. Исследуемая партия состоит из 5 тыс. деталей. Предполагается, что партия деталей
содержит 8 % бракованных. Определите необходимый объем выборки, чтобы с
вероятностью 0,997 установить долю брака с погрешностью не более 2 %:
А) 1650;
Б) 1244;
В) 1300.
33. Укажите, по какой формуле определяется предельная ошибка выборки средней при
типическом отборе для бесповторной выборки:
А) ;
Б)
В)
Г)
34. Укажите, по какой формуле определяется предельная ошибка выборки для доли
при механическом отборе:
А) ;
Б)
В)
Г)
35. Из партии готовой продукции методом случайного бесповторного отбора отобрано
250 изделий, из которых пять оказались бракованными. Определите с вероятностью
0,954 возможные пределы процента брака во всей партии. Объем выборки составляет
10 % всего объема готовой продукции:
А) 2% ± 1,68%;
Б) 10% ± 2%.
36. Малой выборкой называется выборочное наблюдение, объем которого:
А) не превышает 30 единиц;
Б) не превышает 50 единиц.
37. По данным 5%-ного выборочного обследования, дисперсия среднего срока
пользования краткосрочным кредитом 1-го банка 144, а 2-го 81. Число счетов 1-го
банка в 4 раза больше, чем 2-го. Ошибка выборки больше:
А) в 1-м банке;
Б) во 2-м банке;
В) ошибки одинаковы;
Г) предсказать невозможно.
38. По выборочным данным (10%-ный отбор) удельный вес счетов со сроком
пользования кредитом, превышающим 50 дней, в 1-м банке составил 5%, во 2-м банке
10%. При одинаковой численности счетов в выборочной совокупности ошибка
выборки больше:
А) в 1-м банке;
Б) во 2-м банке;
В) ошибки равны;
Г) данные не позволяют сделать вывод.
39. Укажите, по какой формуле можно определить необходимый объем выборки при
собственно случайном повторном отборе при определении доли признака:
А) ;
Б) .
ПРИМЕРЫ РЕШЕНИЯ ЗАДАЧ
Пример 1.
Для определения средней цены товара А в порядке случайной выборки было
обследовано 100 торговых предприятий, в результате установлено, что средняя цена в
выборке товара А составила 57 руб. при среднеквадратическом отклонении 4 руб.
Установлено, что в выборочной совокупности 20 торговых предприятий торгуют
импортным товаром.
С вероятностью 0,954 определите пределы, в которых будет находиться средняя
цена товара А во всех торговых предприятиях, и долю предприятий, торгующих
импортным товаром.
Решение.
Поскольку общая численность генеральной совокупности торговых предприятий
не указана, расчет ошибки средней можно произвести только по формуле:
Тогда пределы, в которых находится средняя цена во всей совокупности торговых
предприятий, будут:
Таким образом, с вероятностью, равной 0,954 можно утверждать, что цена товара
А, продаваемого во всех торговых предприятиях, будет не менее 56 руб. 20 коп. и не
превысит величину 57 руб. 80 коп.
Доля торговых предприятий, торгующих импортным товаром, находится в
пределах:
Выборочная доля составит:
Ошибку выборки для доли определим по формуле:
.
.
С вероятностью 0,954 можно утверждать, что доля магазинов, торгующих
импортным товаром, во всей их совокупности будет находится в пределах
р = 20% ± 8%, или 12% ≤ р ≤ 28%.
Пример 2.
Для определения среднего срока пользования краткосрочным кредитом в банке
была проведена 10%-ная механическая выборка, в которую попало 200 счетов. В
результате обследования установлено, что средний срок пользования краткосрочным
кредитом 40 дней при среднеквадратическом отклонении 8 дней. В десяти счетах срок
пользования кредитом превышал 50 дней. С вероятностью 0,954 определить пределы,
в которых будет находиться срок пользования краткосрочным кредитом в генеральной
совокупности и доля счетов со сроком пользования краткосрочным кредитом более 50
дней.
Решение.
Средний срок пользования кредитом в банке находится в пределах:
.
Т.к. выборка механическая, то ошибка выборки определяется по формуле:
С вероятностью 0,954 можно утверждать, что срок пользования краткосрочным
кредитом в банке находится в пределах:
.
Доля кредитов со сроком пользования более 50 дней находится в пределах:
Выборочная доля составит:
05
Ошибку выборки для доли определим по формуле:
.
С вероятностью 0,954 можно утверждать, что доля кредитов в банке со сроком
пользования более 50 дней будет находится в пределах р = 5% ± 2,9%, или
2,1% ≤ р ≤ 7,9%.
Пример 3.
В результате 10%-ного выборочного обследования, проведенного по методу
пропорционального типического отбора, получены исходные данные (табл.).
Показатели
Работники государственных
предприятий и учреждений
Средняя
заработ ная
плат а, руб.
Число
обследованн
ых
работников,
чел.
Среднее
квадратичес
кое
отклонение,
руб.
Удельны й
вес ж енщин
в общей
численности
работников,
%
3900
400
800
40
С вероятностью
0,954 определите
пределы,600
в которых будет
средняя
Работники
частных
5600
1200 находится 50
заработная
предприятийплата работников, и долю женщин в общей численности работников.
Решение.
1. Определим среднюю заработную плату работников:
2. Вычислим среднюю из групповых дисперсий:
.
3. Определим предельную ошибку выборки по формуле:
— средняя дисперсия выборочной совокупности.
4. Средняя заработная плата работников находится в пределах:
Т.о., с вероятностью 0,954 можно гарантировать, что средняя заработная плата
работников в генеральной совокупности будет не менее 4856 руб. 50 коп., но не более
4983 руб. 50 коп.
5. Долю женщин в общей численности работников определим по формуле:
6. Выборочную дисперсию альтернативного признака вычислим по формуле:
.
Ошибку для доли определим по формуле:
7. Доля женщин в общей численности работников находится в пределах:
Следовательно, с вероятностью 0,954 можно утверждать, что доля женщин в
генеральной совокупности находится в пределах от 43 до 49 %.
Пример 4.
В одном из учебных заведений насчитывается 50 студенческих групп. С целью
изучения успеваемости студентов произведена 10%-ная серийная выборка, в которую
попали 5 групп студентов. В результате обследования установлено, что средняя
успеваемость в группах составила: 3,2; 3,4; 3,8; 4,0; 4,1 балла. С вероятностью 0,997
определите пределы, в которых будет находиться средний балл студентов учебного
заведения.
Решение.
Средний балл всех студентов находится в пределах:
.
Определим выборочную среднюю серийной выборки:
Дисперсию серийной выборки определим по формуле:
где — выборочная средняя каждой серии;
— выборочная средняя серийной выборки.
Значение дисперсии составляет:
Рассчитаем предельную ошибку выборки для средней по формуле:
где — межсерийная дисперсия; – число отобранных серий; – число серий в
генеральной совокупности.
С вероятностью 0,997 можно утверждать, что средний балл всех студентов
учебного заведения находится в пределах , или балла.
Пример 5.
Предприятие выпустило 100 партий готовой продукции А по 50 шт. в каждой из
них. Для проверки качества готовой продукции была проведена 10%-ная серийная
выборка, в результате которой установлено, что доля бракованной продукции
составила 12%. Дисперсия серийной выборки равна 0,0036.
С вероятностью 0,997 определите пределы, в которых находится доля бракованной
продукции А.
Решение.
Доля бракованной продукции А будет находится в пределах:
Определим предельную ошибку выборки для серийного отбора:
С вероятностью 0,997 можно утверждать, что доля бракованной продукции А
находится в пределах 6,6% ≤ р ≤ 17,4%.
Пример 6.
Определите численность рабочих, которую необходимо отобрать в выборочную
совокупность с тем, чтобы при изучении их средней заработной платы предельная
ошибка выборки не превышала 30 руб. с вероятностью 0,997, если по данным
предыдущего обследования среднее квадратическое отклонение составило 70 руб.
Решение.
Поскольку способ отбора не указан, расчет следует проводить по формуле для
повторного отбора:
Пример 7.
В городе Н проживает 100 тыс. чел. С помощью механической выборки
определите долю населения со среднедушевыми денежными доходами до 1500 руб. в
месяц. Какова должна быть численность выборки, чтобы с вероятностью 0,997 ошибка
выборки не превышала 2%, если на основе предыдущих обследований известно, что
дисперсия равна 0,24?
Решение.
Определим необходимую численность выборки по формуле:
Задачи для самостоятельного решения
Задача 1.
В результате выборочного обследования незанятого населения, ищущего работу,
осуществленного на основе собственно-случайной повторной выборки, получен
следующий ряд распределения (табл.).
Возраст, лет
до 25
25 — 35
35 — 45
45 — 55
55 и
более
Численность
15
37
71
45
22
лиц данного
С вероятностью 0,954 определите границы:
возраста
а) среднего возраста незанятого населения;
б) доли (удельного веса) лиц, моложе 25 лет, в общей численности незанятого
населения.
Задачи для самостоятельного решения
Задача 2.
Определите, сколько учащихся первых классов школ района необходимо отобрать в
порядке собственно-случайной бесповторной выборки, чтобы с вероятностью 0,997
определить границы среднего роста первоклассников с предельной ошибкой 2 см.
Известно, что всего в первых классах школ района обучается 1100 учеников, а
дисперсия роста по результатам аналогичного обследования в другом районе
составила 24.
Задачи для самостоятельного решения
Задача 3.
В целях изучения доходов населения по трем районам области сформирована 2%ная выборка, пропорциональная численности населения этих районов. Полученные
результаты представлены в табл.
Район
I
Численность
населения,
чел.
Обследова
но, чел.
120 000
2400
Доход в расчете на 1
человека
средняя,
тыс. руб.
дисперсия
2,9
1,3
II
170 000
3400
2,5
1,1
Определите границы среднедушевых доходов населения по области в целом при
III
90 000
1800
2,7
1,6
уровне вероятности 0,997.
Задачи для самостоятельного решения
Задача 4.
В целях контроля качества комплектующих из партии изделий, упакованных в 50
ящиков по 20 изделий в каждом, была произведена 10%-ная серийная выборка. По
попавшим в выборку ящикам среднее отклонение параметров изделия от нормы
соответственно составило 9; 11; 12; 8 и 14 мм. С вероятностью 0,954 определите
среднее отклонение параметров по всей партии в целом.
Задача 5.
Планируется обследование населения с целью определения средних расходов на
медицинские услуги и лекарственные средства. Определите необходимый объем
собственно-случайной бесповторной выборки, чтобы получить результаты с
точностью 10 руб. при уровне вероятности 0,954. Известно, что в районе проживает 73
тыс. человек, а пробное обследование показало, что среднее квадратическое
отклонение расходов населения на эти цели составляет 38 руб.

Понравилась статья? Поделить с друзьями:
  • Вероятность совершить ошибку 1 рода возникает когда
  • Величина ошибки выборки зависит от тест
  • Величина относительной ошибки расчетов равна
  • Вероятность пропуска ошибки
  • Величина допустимой ошибки выборки зависит от чего