Ошибки выборки курсовая - Не ошибается лишь тот, кто ничего не делает!

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

1. ТЕОРЕТИЧЕСКОЕ ОБОСНОВАНИЕ ВЫБОРКИ И ВЫБОРОЧНОГО НАБЛЮДЕНИЯ

1.1 Понятие выборочного наблюдения, основные виды

.2 Определение объема выборки

.3 Ошибки выборочного наблюдения

2. СТАТИСТИЧЕСКИЙ АНАЛИЗ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ

2.1 Выборочное исследование в статистическом анализе

.2 Методика расчета ошибок выборочного наблюдения

.3 Расчет средних ошибок выборочной доли и выборочной средней

ЗАКЛЮЧЕНИЕ

СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ

ПРИЛОЖЕНИЕ

ВВЕДЕНИЕ

В современном мире многие процессы, с одной стороны, являются достаточно сложными и изменчивыми, а, с другой стороны, эти процессы можно выразить с помощью числовых значений.

В экономике, как и в других областях деятельности человека, часто применение сплошного наблюдения физически невозможно из-за большого массива данных или экономически нецелесообразно. Поэтому в статистическом анализе применяется выборочное наблюдение. Физическая невозможность имеет место, например, при изучении пассажиропотоков, рыночных цен, семейных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением, например, дегустация, испытание кирпичей на прочность и т.п. Поэтому в статистическом анализе применяется выборочное наблюдение.

Из этого следует, что тема выбранной курсовой работы является весьма актуальной.

Целью данной курсовой работы является теоретическое, а также практическое обоснование выбранной темы.

В связи с поставленной целью можно выделить ряд задач:

.Раскрытие понятия выборочного наблюдения, ее категории.

2.Обосновать виды отбора в выборочном наблюдении.

.Дать определение численности выборки.

.Показать практическое применение в статистическом анализе выборочного наблюдения.

Объектом данной курсовой работы является выборочное наблюдение в статистическом исследовании.

Предмет курсовой работы — это выборка и выборочная совокупность.

По результатам написания данной работы будут сделаны определенные теоретические и практические выводы.

1.ТЕОРЕТИЧЕСКОЕ ОБОСНОВАНИЕ ВЫБОРКИ И ВЫБОРОЧНОГО НАБЛЮДЕНИЯ

1.1Понятие выборочного наблюдения, основные виды

Теория выборочного наблюдения базируется на статистических закономерностях, которые формируются и обнаруживаются в массовых явлениях и процессах. Это свойство закономерностей получило название закона больших чисел. Математической основой закона больших чисел, да и статистической науки в целом, служит теория вероятностей. Последняя представляет собой раздел математики, в котором изучаются случайные явления (события), имеющие устойчивую частность, а, следовательно, и вероятность, что помогает выявлять закономерности при массовом повторении явлений [2].

Основная задача выборочного метода — определение ошибки выборки, ибо, если не известен размер ошибки, данные выборки не могут иметь практического значения.

Под выборочным наблюдением (сокращенно выборка) понимается не сплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергается не всё, а отдельные единицы (обычно до 5-10%, реже до 15-20%), отобранные с соблюдением определенных условий.

Выборочный метод — это наиболее совершенная с научной точки зрения разновидность несплошного статистического наблюдения на основе статистической индукции, при котором характеристики всей статистической (генеральной) совокупностью (N) получаются в результате изучения некоторой ее части (n), отобранной с соблюдением определенных правил (на основе случайного отбора) и поэтому являющейся репрезентативной, т.е. репрезентативной и достоверной.

Самый важный признак выборочного наблюдения как вида сплошного наблюдения — случайный характер выборки, а главная его особенность заключается в том, что при отборе единиц совокупности для обследования обеспечивается равная возможность в отобранную часть любой из единиц.

В зависимости от характеристик выборочных совокупностей выборки могут быть представительными, расслоенными, засоренными и цензурированными.

Представительная выборка — выборка наблюдений из генеральной совокупности, наиболее полно и адекватно представляющая ее свойства.

Расслоенная выборка — выборка, включающая ряд выборочных совокупностей, взятых из соответствующих слоев генеральной совокупности. Широко используется при выборочном обследовании в экономике, демографии и социологии [7].

Засоренная выборка — выборка наблюдений, содержащая «грубые» ошибки. Основная масса элементов засоренной выборки является реализацией случайной величины X, закон распределения которой известен. Такие элементы («типичные») появляются в совокупности с вероятностью . С вероятностью элементы совокупности оказываются реализацией другой случайной величины Y, закон распределения которой в общем случае неизвестен. Такие элементы называются грубыми ошибками. Обычные оценки, например, средняя арифметическая выборочная, на засоренной выборке теряют свои оптимальные свойства (эффективность, несмещенность) с ростом интенсивности засорения.

Цензурированная выборка — выборка, полученная из вариационного ряда наблюдений путем отбрасывания некоторого числа экстремальных наблюдений. Если отбрасывание производится по признаку выхода наблюдений за пределы заданного интервала, то такой прием называется цензурирование первого типа. В этом случае число оставшихся наблюдений является случайной величиной. Если отбрасывается фиксированная доля крайних малых значений и фиксированная доля крайних больших значений, то это называется цензурированием второго типа уровня. При этом, число оставшихся в рассмотрении наблюдений является величиной заранее заданной.

Проведение выборочных исследований статистической информации состоит из следующих этапов:

¾формулировка цели статистического наблюдения;

¾обоснование целесообразности выборочного наблюдения;

¾отграничение генеральной совокупности;

¾установление системы отбора единиц для наблюдения;

¾определение числа единиц, подлежащих отбору;

¾проведение отбора единиц;

¾проведение наблюдения;

¾расчет выборочных характеристик и их ошибок;

¾распространение выборочных данных на генеральную совокупность.

Выборочное исследование осуществляется с минимальными затратами труда и средств и в более короткие сроки, чем сплошное наблюдение, что повышает оперативность статистической информации, уменьшает ошибки регистрации. В проведении ряда исследований выборочный метод является единственно возможным, например, при контроле качества продукции, сопровождающимся разрушением проверяемого изделия [10].

Выборочный метод дает достаточно точные результаты, поэтому он может применяться для проверки данных сплошного наблюдения. Минимальная численность обследуемых единиц позволяет провести исследование более тщательно и квалифицированно. Например, при переписях населения практикуются выборочные контрольные наблюдения для проверки правильности записей сплошного наблюдения.

В основе теории выборочного наблюдения лежат теоремы законов больших чисел, которые позволяют решить два взаимосвязанных вопроса выборки: рассчитать ее объем при заданной точности исследования и определить ошибку при данном объеме выборки.

При использовании выборочного метода обычно используются два вида обобщающих показателей: относительную величину альтернативного признака и среднюю величину количественного признака.

Относительная величина альтернативного признака характеризует долю (удельный вес) единиц в статистической совокупности, обладающих изучаемым признаком. В генеральной совокупности эта доля единиц называется генеральной долей (p), а в выборочной совокупности — выборочной долей (w).

Средняя величина количественного признака в генеральной совокупности называется генеральной средней (), а в выборочной совокупности — выборочной средней ().

Процесс образования выборки называется отбором, который осуществляется в порядке беспристрастного, случайного отбора единиц из генеральной совокупности.

Основным условием проведения выборочного наблюдения является предупреждение возникновения систематических (тенденциозных) ошибок, возникающих вследствие нарушения принципа равных возможностей попадания в выборку каждой единицы совокупности. Предупреждение систематических ошибок достигается в результате применения научно обоснованных способов формирования выборочной совокупности.

Существуют различные способы отбора: индивидуальный, групповой (серийный), комбинированный, повторный (возвратный), бесповторный (безвозвратный), одноступенчатый, многоступенчатый, собственно-случайный, механический, типический, двухфазный и многофазный отбор [3].

При индивидуальном отборе в выборку отбираются отдельные единицы совокупности. Отбор повторяется столько раз, сколько необходимо отобрать единиц.

Групповой (серийный) отбор заключается в отборе серий (например, отбор изделий для проверки их целыми партиями). Если обследованию подвергаются все единицы отобранных серий, отбор называется серийным, а если обследуется только часть единиц каждой серии, отбираемых в индивидуальным порядке из серии, то — комбинированным.

Если в процессе отбора отобранная единица не исключается из совокупности, т.е. возвращается в совокупность, и может быть повторно отобранной, то такой отбор называется повторным или возвратным, в противном случае — бесповторным или безвозвратным. Серийный отбор, как правило, безвозвратный.

При одноступенчатом отбираются единицы совокупности (или серии) непосредственно для наблюдения. При многоступенчатом отбираются сначала крупные серии единиц (первая ступень отбора), наблюдению они не подвергаются. Затем из них отбираются серии, меньшие по численности единиц (вторая ступень), наблюдению не подвергаются, и так до тех пор, пока не будут отобраны те единицы совокупности (серии), которые будут подвергнуты наблюдению.

Собственно-случайный отбор состоит в отборе единиц (серий) из всей генеральной совокупности в целом посредством жеребьевки или на основании таблиц случайных чисел.

Жеребьевка состоит в том, что на каждую единицу отбора составляется карточка, которой присуждается порядковый номер. После тщательного перемешивания по очереди извлекаются карточки, пока не будет отобрано требуемое число единиц [8].

Случайными числами называются ряды чисел, являющихся реализациями последовательности взаимно независимых и одинаково распределенных случайных величин. Эти последовательности чисел получаются либо с помощью физических генераторов (подбрасывание кубиков с нанесенными на их сторонами цифрами; вытягиванием из урны карточек с написанными на них цифрами, преобразование случайных сигналов и др. физико-технические процессы), либо с помощью программных генераторов (аналитическим методом с помощью программ для ЭВМ). Числа, являющиеся результатами соответствующей вычислительной процедуры, называются псевдослучайными числами. Последовательность псевдослучайных чисел носит детерминированный характер, но в определенных границах она удовлетворяет свойствам равномерного распределения и свойству случайности.

Механический отбор заключается в том, что составляется список единиц генеральной совокупности и в зависимости от числа отбираемых единиц (серий) устанавливается шаг отбора, т.е. через какой интервал следует брать для наблюдения единицы (серии). Например, в простейшем случае, при 10%-м отборе, отбирается каждая десятая единица по этому списку, т.е. если первой взята единица за №1, то следующими отбираются 11-я, 21-я и т.д. В такой последовательности производится отбор, если единицы совокупности расположены в списке без учета их рангов, т.е. значимости по изучаемым признакам. Начало отбора в этом случае не имеет значения, его можно начать в приведенном примере от любой единицы из первого десятка. При расположении единиц совокупности в ранжированном порядке за начало отбора должна быть принята середина интервала (шага отбора) во избежание систематической ошибки выборки.

При типическом отборе генеральная совокупность разбивается на типические группы единиц по какому-либо признаку (формируются однородные совокупности), а затем из каждой из них производится механический или собственно-случайный отбор. Отбор единиц из типов производится тремя методами: пропорционально численности единиц типических групп, непропорционально численности единиц типических групп и пропорционально колеблемости признака в группах.

В целях экономии средств данные по некоторым интересующим исследователя признакам можно анализировать на основании изучения всех единиц выборочной совокупности, а по другим признакам — на основании части единиц выборочной совокупности, которые представляют подвыборку из единиц первоначальной выборки. Этот метод называется двухфазным отбором. При наличии нескольких подвыборок — метод многофазного отбора.

Многофазный отбор по своей структуре отличается от многоступенчатого отбора, так при многофазном отборе используются на каждой фазе одни и те же отобранные единицы, при многоступенчатом отборе на разных ступенях применяются единицы отбора разных порядков. Многофазным отбором чаще всего пользуются в тех случаях, когда различно число единиц, необходимых для определения отдельных показателей с заданной точностью. Это связано как с различиями в степени колеблемости признаков, так и с разной точностью, требуемой для расчетов. Ошибки при многофазной выборке рассчитываются на каждой фазе отдельно.

Отличие в методах повторного и бесповторного отбора математически отображают с помощью поправочного коэффициента на бесповторность (К):

— численность единиц выборочной совокупности;- численность единиц генеральной совокупности.

В математической статистике разработана методика анализа выборочного наблюдения случайных явлений. Основой такого анализа является предположение о множественности производимых выборочных наблюдений, и, как следствие, построение целого ряда распределения вероятностей различных характеристик полученных выборок. Предполагается осуществление только отдельного выборочного наблюдения.

Результаты выборочного наблюдения должны быть корректно перенесены на генеральную совокупность. При применении выборочного метода всегда происходит погашение особенностей отдельных единиц генеральной совокупности. Именно поэтому предполагается несоответствие параметров генеральной совокупности параметрам выборочной, т.е. наличие больших или меньших ошибок наблюдения. Чтобы исключить такое несоответствие параметры генеральной совокупности обычно представляют не с помощью отдельного значения, а в виде границ интервала, в пределах которого могут происходить колебания параметров.

Применение выборочного исследования предполагает определение параметров совокупности с некоторой степенью точности. Причем, точность зависит от меры репрезентативности выборки относительно генеральной совокупности, т.е. от качества выборочных данных. Чем хуже представлена в выборке генеральная совокупность, тем меньше степень точности выводов. Следовательно, тем дальше должны быть «раздвинуты» пределы интервала, в которых может колебаться параметр генеральной совокупности.

Еще одним определителем степени точности выводов служит их последующее применение. То есть, чем более корректные данные о генеральной совокупности требуется получить, тем дальше «раздвигаются» пределы интервала. Например, если исследование проводится в целях обучения студентов методике выборки, то принимается условная (низкая) степень точности. Тогда как, исследование, необходимое для государственного управления, предполагает высокую степень точности.

Как уже говорилось ранее, основным условием проведения выборочного наблюдения является предупреждение возникновения систематических (тенденциозных) ошибок, возникающих вследствие нарушения принципа равных возможностей попадания в выборку каждой единицы совокупности. Поэтому в следующем разделе речь пойдет об ошибках, возникающих при статистическом исследовании [4].

1.2Определение объема выборки

Определение необходимого объема выборки n основывается на формулах предельных ошибок выборочной доли и выборочной средней. Например, для повторного отбора предельные ошибки равны:

Отсюда объемы выборок для расчета выборочной доли nw и выборочной средней nx следующие:

Аналогичным образом определяются объемы выборок при различных способах отбора выборочной совокупности. Для серийного отбора определяется число отобранных серий.

При серийном или типическом отборе, не пропорциональном объему групп, общее число отбираемых единиц делится на количество групп. Полученная величина является объемом выборки из каждой группы.

При отборе, пропорциональном числу единиц в группе, число наблюдений по каждой группе определяется по формуле:

где nj — объем выборки из j -й группы; — общий объем выборки;

Nj — объем j -й группы;

N — объем генеральной совокупности.

При отборе с учетом вариации признака, приводящем к минимальной ошибке выборки, процент выборки из каждой типической группы должен быть пропорционален среднему квадратическому отклонению в этой группе.

Расчет численности выборки производится по формулам:

для средней

, для доли

Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 20-30 и может составлять 5-6. С увеличением численности выборочной совокупности повышается точность выборочных данных, однако приходится иногда ограничиваться малым числом наблюдений. Эта необходимость возникает, например, при проверке качества продукции, связанной с уничтожением проверяемой единицы продукции. В математической статистике доказывается, что при малых выборках характеристики выборочной совокупности можно распространять на генеральную, но расчет средней и предельной ошибок выборки имеет особенности.

Ранее указывалось, что при большом объеме выборочной совокупности (n > 100) коэффициент , на который необходимо умножить выборочную дисперсию, чтобы получить генеральную, не играет большой роли. Но когда выборочная совокупность небольшая, этот коэффициент необходимо принимать во внимание. Средняя ошибка малой выборки () вычисляется по формуле:

где — дисперсия в малой выборке, которая определяется следующим образом:

Предельная ошибка имеет вид:

Значение коэффициента доверия зависит не только от заданной доверительной вероятности, но и от численности единиц выборки n. Английский ученый Стьюдент доказал, что в случаях малой выборки действует особый закон распределения вероятности.

При большом числе единиц исследуемой совокупности ошибки и неточности могут погашаться, однако, если применяется выборочное наблюдение, тогда ошибки могут существенно повлиять на результаты исследования. В следующем разделе речь пойдет об ошибках выборочного наблюдения [6].

1.3Ошибки выборочного наблюдения

Выборочную совокупность можно сформировать по количественному признаку статистических величин, а также по альтернативному или атрибутивному. В первом случае обобщающей характеристикой выборки служит выборочная средняя величина, обозначаемая , а во втором — выборочная доля величин, обозначаемая w. В генеральной совокупности соответственно: генеральная средняя и генеральная доля р.

В ходе наблюдения могут возникнуть следующие ошибки:

1.Ошибки регистрации — ошибочные результаты наблюдения, полученные в результате недостаточной квалификации исследователя, неточности измерительных приборов, некорректности подсчетов и т.д.

2.Ошибки могут быть случайными и систематическими:

¾систематические ошибки репрезентативности — ошибки, вызванные нарушением правил выбора единиц совокупности для наблюдения;

¾ошибки репрезентативности (случайные) — ошибки, отражающие несовпадение выводов о части явления с выводами о явлении в целом. Такие ошибки возникают при применении несплошного метода наблюдения, случайные ошибки репрезентативности — ошибки, отражающие неравномерное распределение единиц в совокупности, в связи с чем, выборочная совокупность не корректно характеризует генеральную совокупность.

Разности — и W — р называются ошибкой выборки, которая делится на ошибку регистрации и ошибку репрезентативности.

Величина ошибки выборки может быть разной для разных выборок из одной генеральной совокупности, поэтому в статистике определяется средняя ошибка повторной и бесповторной выборки по формулам:

Средняя ошибка повторной выборки — повторная;

где Дв — выборочная дисперсия.

При определении величины репрезентативной ошибки предполагается, что ошибка регистрации равна нулю. Определение ошибки производится по формулам ошибки выборочной доли и ошибки выборочной средней. Систематическая ошибка репрезентативности возникает вследствие нарушения правил отбора единиц генеральной совокупности, в частности принципа беспристрастного, непреднамеренного отбора. Систематическая ошибка может привести к полной непригодности результатов наблюдений.

Ошибка выборочной средней представляет собой расхождение (разность) между выборочной средней и генеральной средней , возникающее вследствие несплошного выборочного характера наблюдения. Величина ошибки выборочной средней определяется как предел отклонения от , гарантируемый с заданной вероятностью:

где — гарантийный коэффициент, зависящий от вероятности , с которой гарантируется невыход разности за пределы ; — средняя ошибка выборочной средней.

Практическая часть рассматриваемой курсовой работы будет представлена в следующем разделе [9].

статистический выборочный средний ошибка

2. СТАТИСТИЧЕСКИЙ АНАЛИЗ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ

2.1Выборочное исследование в статистическом анализе

Рассмотрим на практике как проводится статистический анализ выборочного наблюдения.

Случайные числа могут быть выбраны по таблице случайных чисел (ПРИЛОЖЕНИЕ), которая содержит 2000 случайных чисел, объединенных для удобства пользования таблицей в 500 блоков по 4 значения. Например, 5489, 5583, 3156, 0835, 1988, 3912.

Применение комбинаций этих цифр зависит от размера совокупности: если в генеральной совокупности 1000 единиц, то порядковый номер каждой единицы должен состоять из двух цифр от 000 до 999. В этом случае первые 8 номеров единиц выборочной совокупности следующие:

, 955, 833, 156, 083, 519, 883, 912.

При произвольном объеме генеральной совокупности, отличающегося от 100, 1000, 10000 могут использоваться псевдослучайные числа, сформированные на ЭВМ, или из таблицы случайных чисел формируется последовательность случайных величин, распределенных в интервале от 0 до 1. Например, в приведенном выше примере:

,5489; 0,5583; 0,3156; 0,0835; 0,1988; 0,3912 и т.д.

Если генеральная совокупность состоит из 2000 единиц, то в выборочную совокупность должны войти единицы с номерами:

* 0,5489 = 1097,8 или 1099;

* 0,5583 = 1116,6 или 1117;

* 0,3156 = 631,2 или 631;

* 0,0835 = 167,0 или 167;

* 0,1988 = 397,6 или 398;

* 0,3912 = 782,4 или 782.

Процесс формирования случайных чисел и определения номера отбираемой единицы продолжается до тех пор, пока не будет получен заданный объем выборочной совокупности.

Можно предложить другой способ случайного отбора единиц в выборку. Допустим, что выборка состоит из 75 единиц, а генеральная совокупность — из 780. Из таблицы случайных чисел выбираются, например, следующие: 5489, 5583, 3156, 0835, 1988, 3912.

В выборку могут войти только единицы, порядковые номера которых равны трехзначным числам меньше 780. Поэтому, используя только три последние цифры каждого числа, отбирается необходимые 75 номеров: 489, 583, 156 и т.д. Можно использовать и первые три цифры каждого числа, тогда отобранные номера: 548, 558, 315, 83, 198, 391. Можно разбить случайные четырехзначные случайные числа на ряд, состоящий из трехзначных чисел:

, 955, 833, 156, 083, 519, 883, 912

и отобрать из них номера, которые меньше 780, а именно: 548, 156, 83, 519.

Как уже отмечалось в предыдущей главе определение необходимого объема выборки n основывается на формулах предельных ошибок выборочной доли и выборочной средней.

Для серийного отбора определяется число отобранных серий. Формулы расчета приведены в табл.1.

Таблица 1

Методы отбора выборкиОбъем выборки или число серий для определениявыборочной доливыборочной среднейМеханический и собственно-случайный повторный отборМеханический и собственно-случайный бесповторный отборСерийный отбор при повторном отборе равновеликих серийСерийный отбор при бесповторном отборе равновеликих серийТипический отбор при повторном случайном отборе внутри групп, пропорциональном объему группТипический отбор при бесповторном случайном отборе внутри групп, пропорциональном объему групп

где nw, nx — объемы выборок соответственно для определения ошибок выборочной доли и выборочной средней;w, rx — число отобранных серий соответственно для определения ошибок выборочной доли и выборочной средней;

— предельные ошибки соответственно выборочной доли и выборочной средней.

Вариация () признака существует объективно, независимо от исследователя, но к началу выборочного наблюдения она неизвестна. Для приближенной оценки используются следующие способы:

1.Дисперсия определяется на основе результатов проведения «пробного» обследования (обычно небольшого объема). По данным нескольких пробных обследований выбирается наибольшее значение дисперсии.

2.Дисперсия принимается из предыдущих исследований.

3.По правилу «трех сигм» общий размах вариации Н укладывается в 6 сигм, среднее квадратическое отклонение принимается равным Для большей точности размах делится на 5.

.Если хотя бы приблизительно известна средняя величина изучаемого признака, то .

.При изучении альтернативного признака (изучении доли), если нет даже приблизительных сведений о доле единиц, обладающих заданным значением этого признака, принимается максимально возможная величина дисперсии, равная 0,25.

В связи с тем, что генеральная дисперсия оценивается приближенно, рекомендуется рассчитанный объем выборки округлять в большую сторону.

Часто на практике задается не величина абсолютной предельной ошибки , а величина относительной погрешности , выраженная в процентах к средней величине

откуда

В этом случае объем выборки будет:

Если известен коэффициент вариации , то объем выборки будет:

Например, по данным пробного обследования коэффициент вариации составляет 40%. Сколько необходимо отобрать единиц, чтобы с вероятностью 0,954 предельная относительная ошибка выборки не превышала 5%?

При

При отборе, пропорциональном числу единиц в группе, число наблюдений по каждой группе определяется по формуле

где nj — объем выборки из j -й группы; — общий объем выборки;

Nj — объем j -й группы;

N — объем генеральной совокупности.

для средней

для доли

Таким образом, планомерность статистического наблюдения заключается в том, что оно готовится и проводится по разработанному плану, который входит в план всего статистического анализа выборочного наблюдения и включает вопросы методологии, организации, техники сбора информации, контроля ее достоверности и оформления итоговых результатов.

Далее рассмотрим на практике как определяются в статистическом анализе ошибки выборочного наблюдения.

2.2Методика расчета ошибок выборочного наблюдения

Как говорилось ранее, при определении величины репрезентативной ошибки предполагается, что ошибка регистрации равна нулю. Определение ошибки производится по формулам ошибки выборочной доли и ошибки выборочной средней. Систематическая ошибка репрезентативности возникает вследствие нарушения правил отбора единиц генеральной совокупности, в частности принципа беспристрастного, непреднамеренного отбора. Систематическая ошибка может привести к полной непригодности результатов наблюдений.

Рассмотрим на примере, насколько отличаются выборочные и генеральные показатели по данным об успеваемости студентов (две 10%-е выборки) (табл. 2).

Таблица 2

Данные по выборкам

ОценкаЧисло студентов, челГенеральная совокупностьПервая выборкаВторая выборка2 3 4 5100 300 520 809 27 54 1012 29 52 7Итого1000100100

Средний балл для генеральной совокупности

по первой выборке

по второй выборке

Доля студентов, получивших оценки «4» и «5»:

по генеральной совокупности

по первой выборке

по второй выборке

Разность между показателями выборочной и генеральной совокупности является случайной ошибкой репрезентативности (ошибкой выборки).

Ошибки репрезентативности:

Как видно из расчетов, выборочная средняя и выборочная доля являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку.

где — гарантийный коэффициент, зависящий от вероятности ,с которой гарантируется невыход разности за пределы ; — средняя ошибка выборочной средней.

Значения гарантийного коэффициента и соответствующие им вероятности приведены в таблице 3. Обычно вероятность принимается равной 0,9545 или 0,9973, а при этом равно соответственно 2 и 3.

Таблица 3

Значения гарантийного коэффициента

1,00 1,10 1,20 1,30 1,40 1,50 1,60 1,70 1,80 1,90 2,00 2,10 2,20 2,30 2,40 2,50 2,60 2,70 2,80 2,90 3,000,6827 0,7287 0,7699 0,8064 0,8385 0,8664 0,8904 0,9109 0,9281 0,9426 0,9545 0,9643 0,9722 0,9786 0,9836 0,9876 0,9907 0,9931 0,9949 0,9963 0,9973

Средняя ошибка определяется как среднее квадратическое отклонение средней величины в генеральной совокупности (средней генеральной)

В математической статистике доказывается, что величина средней квадратической стандартной ошибки простой случайной повторной выборки может быть определена по формуле:

где — дисперсия признака в генеральной совокупности.

Дисперсия суммы независимых величин равна сумме дисперсий слагаемых

Если все величины Xi имеют одинаковую дисперсию, то:

Тогда дисперсия средней будет:

Тогда средняя ошибка при определении средней:

Между дисперсиями в генеральной и выборочной совокупностях существует следующее соотношение:

где — дисперсия признака в выборке.

Если n достаточно велико, то близко к единице и дисперсию в генеральной совокупности можно заменить на дисперсию в выборке.

Тогда средняя ошибка средней в генеральной совокупности может быть как среднее квадратическое отклонение средней величины в выборочной совокупности (средней выборочной)

Средняя ошибка выборочной средней:

Значения средней ошибки выборки определяются по формуле:

где — дисперсия в генеральной совокупности.

Между дисперсиями в генеральной и выборочной совокупностях существует следующее соотношение:

где — дисперсия в выборке.

При повторном отборе средняя ошибка определяется следующим образом:

где — средняя величина дисперсии количественного признака , которая рассчитывается по формуле средней арифметической невзвешенной

или средней арифметической взвешенной:

где fi — статистический вес.

В данном разделе были показаны общие формулы расчета ошибок выборочного наблюдения в статистическом анализе. Однако, в зависимости от способов отбора выборочной совокупности, расчет средней ошибки выборочной средней имеет свои особенности и формулы расчета. Это будет проиллюстрировано в следующем разделе.

2.3Расчет средних ошибок выборочной доли и выборочной средней

Формулы расчета средней ошибки выборочной средней для различных, наиболее часто используемых способов отбора выборочной совокупности приведены в таблице 4.

Таблица 4

Формулы расчета средних ошибок выборочной доли и выборочной средней

Метод отбора выборкиСредняя ошибкавыборочной доливыборочной среднейМеханический или собственно-случайный повторный отборМеханический или собственно-случайный бесповторный отборСерийный отбор при повторном отборе равновеликих серийСерийный отбор при бесповторном отборе равновеликих серийТипический отбор при повторном случайном отборе внутри групп, пропорциональном объему группТипический отбор при бесповторном случайном отборе внутри групп, пропорциональном объему групп

где N — численность генеральной совокупности;

— межсерийная дисперсия выборочной доли;- число отобранных серий;- число серий в генеральной совокупности;

— средняя из групповых дисперсий выборочной доли;

— дисперсия признака x в выборке;

— межсерийная дисперсия выборочных средних;

— средняя из групповых дисперсий выборочной средней.

При бесповторном оборе с каждой отобранной единицей или серией вероятность отбора оставшихся единиц или серий повышается, при этом средняя ошибка выборочной средней уменьшается по сравнению с повторным отбором и имеет следующий вид:

1)для механического или собственно случайного бесповторного отбора:

При достаточно большом объеме совокупности N можно воспользоваться формулой:

2)для серийного бесповторного отбора равновеликих серий:

При достаточно большом числе серий в генеральной совокупности R можно воспользоваться формулой:

3)для типического отбора с бесповторным случайном отборе внутри групп, пропорциональном объему групп:

Межсерийная дисперсия выборочных средних и средняя из выборочных дисперсий типических групп вычисляются следующим образом:

где — среднее значение показателя в j — й серии;

— дисперсия признака x в j — й типической группе;j — число единиц в j -й типической группе.

Средние ошибки выборки при типическом методе отбора, пропорциональном объему групп и колеблемости признака в группе приведены в таблице 5.

Таблица 5

Формулы расчета средних ошибок выборочной средней и выборочной доли при типическом методе отбора

Метод отбора выборкиСредняя ошибкавыборочной доливыборочной среднейповторный случайный отбор внутри групп, непропорциональный объему группбесповторный случайный отбор внутри групп, непропорциональный объему группповторный случайный отбор внутри групп, пропорциональный колеблемости признака в группахбесповторный случайный отбор внутри групп, пропорциональный колеблемости признака в группах

где Nj — число единиц в j -й типической группе;j — число отобранных единиц в j -й типической группе;

— выборочная дисперсия признака x в j — й типической группе (дисперсия признака в выборке из j — й типической группы);

— выборочная дисперсия доли в j — й типической группе

(дисперсия доли в выборке из j — й типической группы);

— среднее квадратическое отклонение признака x в выборке из j — й типической группе.

Средние ошибки выборки при комбинированной выборке с равновеликими сериями приведены в табл.6.

Таблица 6

Формулы расчета средних ошибок выборки при комбинированной выборке с равновеликими сериями

Метод отбора выборкиСредняя ошибкавыборочной доливыборочной среднейповторный отбор серийбесповторный отбор серий

где — общее число единиц в отобранных сериях ();

n — выбранное число единиц, подвергающихся обследованию, из

отобранных серий.

При многоступенчатом отборе на каждой ступени отбора может быть найдена своя средняя ошибка. При отборе, например, крупных групп из генеральной совокупности средняя ошибка выборки — ; при отборе мелких групп из крупных средняя ошибка выборки — ; при отборе отдельных единиц совокупности из мелких групп средняя ошибка выборки — . Если численность групп одинаковая, то средняя ошибка, как для средней, так и для доли, трехступенчатого отбора может быть определена по формуле:

Предельная ошибка выражается следующим образом:

и зависит от вариации изучаемого признака в генеральной совокупности, объема и доли выборки, способа отбора единиц из генеральной совокупности и от величины вероятности, с которой гарантируются результаты выборочного наблюдения.

Средняя величина количественного признака в генеральной совокупности определяется с у четом предельной ошибки выборочной средней

Из всего вышесказанного можно сделать следующие выводы:

1.Определение объема выборки зависит от метода отбора, который может быть механический бесповторный и механический повторный отбор, серийный при повторном и серийный при бесповторном отборе, типический при повторном случайном и типический при бесповторном случайном отборе. В зависимости от принадлежности к тому или иному методу, объем выборки рассчитывается по определенным формулам.

2.Планомерность статистического наблюдения заключается в том, что оно готовится и проводится по разработанному плану, который входит в план всего статистического анализа выборочного наблюдения и включает вопросы методологии, организации, техники сбора информации, контроля ее достоверности и оформления итоговых результатов.

.Разность между показателями выборочной и генеральной совокупности называется ошибкой выборки. Ошибки выборки подразделяются на ошибки регистрации и ошибки репрезентативности. Во 2 и 3 разделе были представлены формулы расчета ошибок выборочного наблюдения в статистическом анализе в зависимости от способов отбора выборочной совокупности.

ЗАКЛЮЧЕНИЕ

Выборочное наблюдение относится к разновидности несплошного наблюдения. Оно охватывает отобранную часть единиц генеральной совокупности. Цель выборочного наблюдения — по отобранной части единиц дать характеристику всей совокупности единиц. Чтобы отобранная часть была репрезентативна (т.е. представляла всю совокупность единиц), выборочное наблюдение должно быть специально организовано. Следовательно, в отличие от генеральной совокупности, представляющей всю совокупность исследуемых единиц, выборочная совокупность представляет ту часть единиц генеральной совокупности, которая является объектом непосредственного наблюдения.

Данная курсовая работа содержит 2 главы, а именно: теоретические аспекты выборочного наблюдения и статистический анализ выборочного наблюдения.

Поставленная во введении цель дипломного проекта достигнута и решены основные задачи.

В результате решения вышеизложенных проблем можно сделать следующие выводы.

Теоретическое обоснование поставленного вопроса выявило понятие выборочного наблюдения, его основные виды, определение объема выборки, ошибки выборочного наблюдения.

Статистический анализ выборочного наблюдения показал следующие основные моменты:

. Определение объема выборки зависит от метода отбора, который может быть механический бесповторный и механический повторный отбор, серийный при повторном и серийный при бесповторном отборе, типический при повторном случайном и типический при бесповторном случайном отборе. В зависимости от принадлежности к тому или иному методу, объем выборки рассчитывается по определенным формулам.

. Планомерность статистического наблюдения заключается в том, что оно готовится и проводится по разработанному плану, который входит в план всего статистического анализа выборочного наблюдения и включает вопросы методологии, организации, техники сбора информации, контроля ее достоверности и оформления итоговых результатов.

. Разность между показателями выборочной и генеральной совокупности называется ошибкой выборки. Ошибки выборки подразделяются на ошибки регистрации и ошибки репрезентативности. Во 2 и 3 разделе были представлены формулы расчета ошибок выборочного наблюдения в статистическом анализе в зависимости от способов отбора выборочной совокупности.

И в заключение следует отметить, что практическое применение анализа статистического наблюдения активно используется во многих областях жизнедеятельности людей, например, широко применяется в социальной и экономической статистике, в частности в контроле за коммерческой деятельностью юридических и физических лиц со стороны финансовых организаций. Это подтверждает актуальность выбора данной темы курсовой работы.

СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ

1.Статистика: учебник: Васильева Э.К., Лялин В.С. Издательство: Юнити Дана, 2012 г. — 398 страниц.

2.Статистика: учебное пособие: Эриашвили Н.Д., Воронин В.Ф., Жильцова Ю.В. Издательство: Юнити-Дана, 2012 г. — 536 страниц.

.Социально-экономическая статистика: учебное пособие: Мухина И.А. Издательство: ФЛИНТА, 2011 г. — 116 страниц.

.Статистика: учебное пособие: Кузнецова Е.И., Гусаров В.М. Издательство: Юнити-Дана, 2011 г. — 479 страниц.

.Общая теория статистики: Учебное пособие: Балдин К.В., Рукосуев А.В. Издательство: Дашков и К, 2010 г. — 312 страниц.

.Общая теория статистики: учебник: Илышев А.М. Издательство: Юнити-Дана, 2008 г. — 535 страниц.

.Статистика предприятий и бизнес-статистика: учебное пособие: Образцова О.И. Издательство: Издательский дом Высшей школы экономики, 2011 г. — 698 страниц.

.Статистика: учебное пособие: Плохотников К.Э., Колков С.В. Издательство: ФЛИНТА, 2012 г. — 286 страниц.

.Методология статистического исследования социально-экономических процессов: под ред. В.Г. Минашкина. Издательство: Юнити-Дана, 2012 г. — 391 страница.

.Статистика. Учебник / Под. Ред. Елисеевой И.И., — М.: Высшее образование, 2009. — 252 страницы.

11.

ПРИЛОЖЕНИЕ

Таблица случайных чисел

5489558331560835198839120938746008694420352209357877566570209555737571247878554475557579255024879477086423491012825026335759355450809074700162493224636891022672630368953371319672312918738004387547264473515634532326237803837421910464069695297068780388325119635001205026368456570304361314281796844705035654325473369536194415143453421050368789024734240865294351422981551447649863861378070534548652456570857801277681610132867993839303203569617691187″095159915245570055647352089162496568;4184217945549083225424352965515412097069291629729885027501448034812232137666023055241341986065656981984201712284270730080146529123545694037753366460958534152358492028265238540279371993433223276875523079781947, 63803425726772851130772201648573745306533645749759698682419129760361933414736938489953481641365208525296453844568162879780004707188096608446188397680881564542190807330142794168430599373120554720421192117588516432463557576656166053895470770269589080592585190127923324527341404517306005170403453275473848622556833358801257616344397276635369120731903352949083426052774998429852043965,402889365148176287131189109089897273321319359321482020232589174004248924000519691636723712277965385547650703167808417543030897321289769004808098962948197219724151283853192192920426957349035916657683683270664100330867165670164220253363458227190451382537050521278255527622333956411881996380634062959795111257612575683733369322740383456323261534103365’11172417317624345240545586728536296657735412811409304697691945691422550775960670301313513886326894692584265314725113573514699545933153039914639404384376332886498327011045497955527528902851215700477085112904606821832325728962796227533077871874188004142537068822149438374098022012174732015016371097104073728542412692742251060743018730769062353477013907658039948425777859197606231418668566871943430705798171822486417034359538756242558258723197491927925991405897691918685996060522499303458958128988256941768565901932604336231973411217958465211080453482047802216738732356434767010622729862

Теги:
Выборочное наблюдение в статистическом исследовании
Курсовая работа (теория)
Экономическая теория

Источник

Ошибка выборки

2.1. Понятие и виды ошибок выборки

Поскольку изучаемая статистическая
совокупность состоит из единиц с
варьирующими признаками, то состав
выборочной совокупности может в той
или иной мере отличаться от состава
генеральной совокупности.

Расхождение
между характеристиками выборки и
генеральной совокупности составляет
ошибку
выборки.

Виды ошибок выборки

Ошибки

выборки

Систематические

Случайные

Ошибки

регистрации

Обусловлены
причинами, действующими в одном
направлении (например, округление
цифр).

Проявляются
в различных направлениях и уравновешивают
друг друга (невнимательность).

Ошибки

репрезентативности

Неправильный,
тенденциозный отбор единиц, без
соблюдения принципа случайности
(выбираются преднамеренно худшие или
лучшие единицы).

Несмотря
на принцип случайности отбора единиц,
все же имеются расхождения между
характеристиками выборки и генеральной
совокупности (но эти ошибки объективны
и не связаны с волей наблюдателя).

Основная
задача выборочного метода – изучение
случайных ошибок репрезентативности.

2.2. Средняя ошибка выборки

Случайная ошибка
репрезентативности зависит от следующих
фактов (при этом считается, что ошибок
регистрации нет):

Чем
больше численность выборки при прочих
равных условиях, тем меньше величина
ошибки выборки, т.е. ошибка выборки
обратно пропорциональна ее численности.
Чем
меньше варьирование признака, тем
меньше ошибка выборки. Если признак
совсем не варьирует, а, следовательно,
величина дисперсии равна нулю, то ошибки
выборки не будет, т.к. любая единица
совокупности будет совершенно точно
характеризовать всю совокупность по
этому признаку. Таким образом, ошибка
выборки прямо пропорциональна величине
дисперсии.

В
математической статистике доказывается,
что величина средней ошибки случайной
повторной выборки может быть определена
по формуле

(6.1)

Однако
следует иметь в виду, что величина
дисперсии в генеральной совокупности

²
нам не известна, т.к. наблюдение выборочное.
Мы можем рассчитать лишь дисперсию в
выборочной совокупности S².
Соотношение между дисперсиями генеральной
и выборочной совокупности выражается
формулой:

(6.2)

Если
n
велико, следовательно

Таким
образом, можно приблизительно считать,
что выборочная дисперсия равна генеральной
дисперсии.


²=
S²

И формула средней ошибки повторной
выборки (6.1.) примет вид:

(6.3)

Но
здесь мы рассмотрели только ошибку
выборки для средней величины интересующего
признака. Существует также показатель
доли единиц с интересующим признаком.
Расчет ошибки этого показателя имеет
свои особенности.

Дисперсия
для показателя доли признака определяется
по формуле:

S²=(1-)
(6.4)

Тогда средняя ошибка повтора выборки
для показателя доли признака будет
равна:

(6.5)

Доказательство
формул (6.3) и (6.5) исходит из схемы повторной
выборки. Обычно же выборку организуют
бесповторным способом. Т.к. при бесповторном
отборе численность генеральной
совокупности N
в коде выборки сокращается, то в формулы
ошибки выборки включают дополнительный
множитель
,
и формулы
принимают вид:

(6.6)

(6.7)

Пример
1. Определим, на сколько отличаются
выборочные и генеральные показатели
по данным 10%-ной бесповторной выборки
успеваемости студентов.

Оценка, х_i	Число студентов в выборке, f_i
2	9
3	27
4	54
5	10
Итого	100

Расчет ошибки бесповторной выборки для
средней величины:

n
= 100 N
= 1000

Найдем выборочную
дисперсию по формуле:

Здесь
не известна величина
,
которую можно найти как обычную среднюю
взвешенную величину:

Таким
образом,

Т.е.
можно сказать, что средний балл всех
студентов ()
равен 3,650,07

Теперь
рассчитаем долю студентов в генеральной
совокупности, обучающихся на «4» и «5».

Найдем по выборке
долю студентов, получивших оценки «4»
и «5».

(или
64%)

Расчет
ошибки бесповторной выборки для доли
производится по формуле:

(или
4,5%)

Таким образом, доля студентов, обучающихся
на «4» и «5» по генеральной совокупности
(P) составляет
0,640,045 (или 64%4,5%).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

Источник

Национальный Открытый Институт России г. Санкт- Петербург

Кафедра Финансов, денежного обращения и кредита

Дисциплина Статистика

КУРСОВАЯ РАБОТА

Студента (-ки) группы____________

___________________________________

(фамилия, имя, отчество)

Характеристика выборочного наблюдения: виды выборки, способы отбора и ошибки выборочного наблюдения

(название темы)

Государственное и муниципальное управление

(специальность)

Проверил____________________

Дата________________________

Оценка______________________

Выполнил ___________________

Санкт-Петербург

2012

Оглавление

Введение

1. Общая характеристика выборочного наблюдения

2. Ошибки выборки

3. Распространение выборочных результатов на генеральную совокупность

4. Определение необходимого объема выборки

Заключение

Список литературы

Введение

С незапамятных времен человечество осуществляло учет многих сопутствующих его жизнедеятельности явлений и предметов и связанные с ним вычисления. Люди получали разносторонние, хотя и различающиеся полнотой на различных этапах общественного развития, данные учитывавшиеся повседневно в процессе принятия хозяйственных решений, а в обобщенном виде и на государственном уровне при определении русла экономической и социальной политики и характера внешнеполитической деятельности.

Руководствуясь соображениями зависимости благосостояния нации от величины создаваемого полезного продукта, интересов стратегической безопасности государств и народов- от численности взрослого мужского населения, доходов казны- от размера налогооблагаемых ресурсов и т. д., издавна отчетливо осознавалась и реализовывалась в форме различных учетных акций.

С учетом достижений экономической науки стал возможен расчет показателей, обобщенно характеризующих результаты воспроизводственного процесса на уровне общества: совокупного общественного продукта, национального дохода, валового национального продукта.

Актуальность исследования. Всю перечисленную информацию в постоянно возрастающих объемах предоставляет обществу статистика, являющаяся необходимо принадлежностью государственного аппарата. Статистические данные, таким образом, способны сказать языком статистических показателей о многом в весьма яркой и убедительной форме. Существует несколько способов статистического учета, среди которых выделяется способ выборочного наблюдения.

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе данных полученных по выборке. При этом сходят из того, что все средние и относительные показатели, полученные по выборке, являются несмещенными и эффективными характеристиками генеральной совокупности.

Выборочная совокупность – часть единиц генеральной совокупности, отобранная в случайном порядке, ее численность обозначается n. Выборочное наблюдение – не сплошное наблюдение, при котором обследованию подвергается определенная часть единиц изучаемой совокупности, отобранная в случайном порядке.

Преимущества выборочного наблюдения:

1) при обследовании слишком больших совокупностей, когда сплошное наблюдение требует огромных затрат труда и средств;

2) при необходимости получения информации в сжатые сроки;

3) при невозможности сплошного наблюдения.

Основные принципы выборочного наблюдения:

1) обеспечение случайности – заключается в том, что при отборе каждой из единиц изучаемой совокупности обеспечивается равная возможность попасть в выборку

2) –обеспечение достаточного числа отобранных единиц.

Цель данной курсовой работы – дать анализ системе выборочного наблюдения.

Задачи исследования:

 Общая характеристика выборочного наблюдения.

 Ошибки выборки.

 Распространение выборочных результатов на генеральную совокупность.

 Определение необходимого объема выборки.

Объект исследования – статистические методы расчета.

Предмет исследования – выборочное наблюдение.

Степень разработанности темы: Первыми работами, посвященными теории стратифицированной выборки, были работы А. Чупрова и А.Боули. В дальнейшем теоретическим исследованиям преимуществ стратифицированных выборок и уточнения основных моментов их организации были посвящены работы Д. Неймана,Т. Далениуса, У.Кокрена, Л. Киша, Ю. Воронова и многих других авторов. [3;5] Вопросам применения выборочного наблюдения уделялось в трудах В. Ю. Авдеев, H. Е. Васильева, А. В. Газарян, Е. М. Гутцайт, И. И. Елисеев, Ю. Ю. Кочинев, Т.Н. Малькова, Я. В. Соколов, А. А. Терехов, Е. М. Четыркин.

Современные методы организации выборочных обследований и соответствующая теория подробно рассматриваются в книгах Ф.Йейтса, Л.Киша, К.Мозера и других зарубежных авторов. В отечественной литературе хорошо известны монографии А.Боярского, З.Гранкова, В.Немчинова, И.Венецкого и других, целиком посвященные теоретическим вопросам дизайна выборки.

Теоретическая значимость работы – произведена систематизация теоретических сведений по исследуемому вопросу, сформулированы основные положения выборочного наблюдения как метода статистического анализа.

Практическая значимость работы — материалы работы могут быть использованы при разработке выборки для массовых обследований, а также при подготовке курсов: история применения выборочного наблюдения в эмпирических исследованиях; теория и практика выборочного наблюдения в статистике.

1. Общая характеристика выборочного наблюдения

Тема «выборочное наблюдение» является одной из центральных в курсе теории статистики. Это обусловлено, прежде всего, взаимосвязью данной темы с другими темами, в особенности, со статистическим наблюдением, статистическими показателями, таблицами, графиками и др. Основываясь на фундаментальных теоретических положениях, в частности, предельных теоремах закона больших чисел (Чебышева – Ляпунова, Бернулли и др.), выборочное наблюдение тесно связано с курсами математической статистики и теории вероятностей.

Целью выборочного наблюдения является определение характеристик генеральной совокупности – генеральной средней (x¯) и генеральной доли (p). Характеристики выборочной совокупности – выборочная средняя (x) и выборочная доля (ω) отличаются от генеральных характеристик на величину ошибки выборки (Δ). Поэтому для определения характеристик генеральной совокупности необходимо вычислять ошибку репрезентативности, которая определяется по формулам, разработанным в теории вероятностей для каждого вида выборки и способа отбора. [10, с. 32]

Статистическое наблюдение можно организовать сплошное и несплошное.

Сплошное наблюдение предусматривает обследование всех единиц изучаемой совокупности и связано большими трудовыми и материальными затратами. Изучение не всех единиц совокупности, а лишь некоторой части, по которой следует судить о свойствах всей совокупности в целом, можно осуществить несплошным наблюдением. В статистике результаты сплошного наблюдения иногда оцениваются как выборочные характеристики. Такая трактовка полученных данных имеет место в тех случаях, когда число обследованных единиц невелико и нет твердой уверенности в том, что изучаемые характеристики не могут принимать иных значений, кроме выявленных в результате наблюдения. При проведении экспериментов число значений может быть бесконечно большим, поэтому, формулируя выводы на основе ограниченного их числа, необходимо рассматривать полученные данные как выборочные характеристики. [10, с. 34]

В статистической практике самым распространенным является выборочное наблюдение.

Выборочное наблюдение – это такое несплошное наблюдение, при котором отбор подлежащих обследованию единиц осуществляется в случайном порядке, отобранная часть изучается, а результаты распространяются на всю исходную совокупность. Наблюдение организуется таким образом, что эта часть отобранных единиц в уменьшенном масштабе репрезентирует (представляет) всю совокупность. [8, с. 21]

Совокупность, из которой производится отбор, называется генеральной, и все ее обобщающие показатели — генеральными.

Совокупность отобранных единиц именуют выборочной совокупностью, и все ее обобщающие показатели – выборочными.

Имеется ряд причин, в силу которых, во многих случаях выборочному наблюдению отдается предпочтение перед сплошным. Наиболее существенны из них следующие:

— экономия времени и средств в результате сокращения объема работы;

— сведение к минимуму порчи или уничтожения исследуемых объектов (определение прочности пряжи при разрыве, испытание электрических лампочек на продолжительность горения, проверка консервов на доброкачественность);

— необходимость детального исследования каждой единицы наблюдения при невозможности охвата всех единиц (при изучении бюджета семей);

— достижение большой точности результатов обследования благодаря сокращению ошибок, происходящих при регистрации. [6, с. 145]

Преимущество выборочного наблюдения по сравнению со сплошным можно реализовать, если оно организованно и проведено в строгом соответствии с научными принципами теории выборочного метода. Такими принципами являются: обеспечение случайности (равной возможности попадания в выборку) отбора единиц и достаточного их числа. Соблюдение этих принципов позволяет получить объективную гарантию репрезентативности полученной выборочной совокупности. Понятие репрезентативности отобранной совокупности не следует понимать как ее представительство по всем признакам изучаемой совокупности, а только в отношении тех признаков, которые изучаются или оказывают существенное влияние на формирование сводных обобщающих характеристик.

При случайности отбора каждая единица совокупности должна иметь равную вероятность попасть в выборку. На практике не всегда удается обеспечить соблюдение данного принципа. Для этого необходимо учесть все элементы генеральной совокупности. Например, невозможно пронумеровать все домашние хозяйства или все население страны, так как это очень большая совокупность и состав ее постоянно меняется. В таких случаях прибегают к методике неслучайного отбора, стараясь, чтобы элементы случайности присутствовали. Примером такого отбора служит механическая выборка, при которой вся исследуемая совокупность предварительно упорядочивается и правило выбора из нее отдельных единиц устанавливает исследователь. [4, с. 75]

Выборочный метод наблюдения широко используется на практике как в области естественных наук для оценки результатов экспериментов, так и в экономике. Госкомстат России проводит выборочные обследования бюджетов домашних хозяйств, потребительских ожиданий населения, обследования населения по проблемам занятости и др. На выборочной основе организовано статистическое наблюдение за деятельностью малых предприятий, за их деловой активностью, наличием и движением основных фондов. Выборочный метод используется также при изучении объема и состава затрат организаций на рабочую силу. Сфера применения этого метода постоянно расширяется, что связано с рядом его преимуществ.

Во-первых, выборочный метод обеспечивает значительную экономию материальных и финансовых ресурсов при проведении статистического наблюдения, что позволяет расширить программу обследования и повысить его оперативность. Второе преимущество – высокая достоверность получаемых данных, так как при относительно небольшом объеме выборки можно организовать эффективный контроль за качеством собираемой информации. Таким образом, при использовании выборочного метода снижается вероятность появления ошибок регистрации и необнаружения их на стадии проверки первичной информации. И, наконец, в ряде случаев, когда сплошное наблюдение связано с уничтожением или порчей обследуемых единиц (например, при проверке качества поступающих в продажу продуктов питания), возможно только выборочное обследование. [17, с. 34]

Точность оценок, полученных на основе выборочного метода, зависит не от доли обследованных единиц, а от их числа. Если объем генеральной совокупности достаточно велик, то доля отобранных для наблюдения единиц может быть очень небольшой, а точность оценок – высокой. Например, выборочное обследование по проблемам занятости в России охватывает около 0,2% населения в возрасте от 15 до 72 лет, но обеспечивает высокую точность оценок параметров генеральной совокупности. Если же объем такой совокупности невелик, то эффект от применения выборочного наблюдения может выражаться не столько в экономии материальных ресурсов, сколько в повышении качества собираемой исходной информации. Для получения несмещенной оценки в этом случае процент отбора должен быть значительно больше. Под несмещенной оценкой подразумевается такая характеристика выборочной совокупности, математическое ожидание которой совпадает с ее значением в генеральной совокупности.

Основная задача выборочного наблюдения в экономике состоит в том, чтобы на основе характеристик выборочной совокупности (средней и доли) получить достоверные суждения о показателях средней и доли в генеральной совокупности. При этом следует иметь в виду, что при любых статистических исследованиях (сплошных и выборочных) возникают ошибки двух видов: регистрации и репрезентативности.

По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности; при групповом отборе – качественно однородные группы или серии изучаемых единиц; комбинированный отбор предполагает сочетание первого и второго видов.

По методу отбора различают повторную и бесповторную выборки.

При повторной выборке общая численность единиц генеральной совокупности в процессе выборки остается неизменной. Ту или иную единицу, попавшую в выборку, после регистрации снова возвращают в генеральную совокупность, и она сохраняет равную возможность со всеми прочими единицами при повторном отборе единиц вновь попасть в выборку («отбор по схеме возвращенного шара»). Повторная выборка в социально-экономической жизни встречается редко. Обычно выборку организуют по схеме бесповторной выборки.

При бесповторной выборке единица совокупности, попавшая в выборку, в генеральную совокупность не возвращается и в дальнейшем в выборке не участвует; т.е. последующую выборку делают из генеральной совокупности уже без отобранных ранее единиц («отбор по схеме невозвращенного шара»). [9, с. 45]

Таким образом, при бесповторной выборке численность единиц генеральной совокупности сокращается в процессе исследования.

Способом отбора определяется конкретный механизм или процедура выборки единиц из генеральной совокупности.

По степени охвата единиц совокупности различают большие и малые (n<30) выборки.

Основные характеристики параметров генеральной и выборочной совокупностей обозначаются символами: [14, с. 31]

N – объем генеральной совокупности (число входящих в нее единиц);

n – объем выборки (число обследованных единиц);

x – генеральная средняя (среднее значение признака в генеральной совокупности);

x- выборочная средняя;

p – генеральная доля (доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности);

w – выборочная доля;

s²- генеральная дисперсия (дисперсия признака в генеральной совокупности);

σ² — выборочная дисперсия того же признака;

σ – среднее квадратическое отклонение в выборке;

s – среднее квадратическое отклонение в генеральной совокупности.

В практике выборочных исследований наибольшее распространение получили следующие виды выборки: собственно-случайная, механическая, типическая, серийная, комбинированная.

При выборочном наблюдении должна быть обеспечена случайность отбора единиц. Каждая единица должна иметь равную с другими возможность быть отобранной. Именно на этом основывается собственно – случайная выборка.

К собственно – случайной выборке относится отбор единиц из всей генеральной совокупности (без предварительного расчленения ее на какие – либо группы) посредством жеребьевки (преимущественно) или какого – либо иного подобного способа, например, с помощью таблицы случайных чисел. Случайный отбор – это отбор не беспорядочный. Принцип случайности предполагает, что на включение или исключение объекта из выборки не может повлиять какой – либо фактор, кроме случая. Примером собственно – случайного отбора могут служить тиражи выигрышей: из общего количества выпущенных билетов наугад отбирается определенная часть номеров, на которые приходятся выигрыши. Причем всем номерам обеспечивается равная возможность попадания в выборку. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки. [13, с. 44]

Доля выборки есть отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:

Кв. = n / N.

Собственно – случайный отбор «в чистом виде» применяется в практике выборочного наблюдения редко, но он является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного наблюдения.

2. Ошибки выборки

Ошибки регистрации присущи любому статистическому наблюдению, и появление их может быть вызвано несовершенством измерительных приборов, недостаточной квалификацией наблюдателя, неточностью подсчетов.

Ошибки репрезентативности характерны только для несплошного наблюдения. Они могут быть систематическими и случайными. Систематические ошибки могут появляться в связи с особенностями применяемых способов отбора и обработки данных или в связи с нарушением установленных правил отбора. Случайные ошибки репрезентативности возникают в связи с недостаточно равномерным представлением в выборочной совокупности различий единиц генеральной совокупности. [4, с. 23]

Особенность выборочного наблюдения состоит в том, что величину этих ошибок можно рассчитать и решить вопрос о целесообразности выборки.

Ошибка выборки зависит от численности выборки и от вариации признака в генеральной совокупности. Чем больше численность выборки, тем меньше ошибка, чем больше вариация признака, тем больше ошибка.

При расчете средней ошибки случайной бесповторной выборки необходимо учитывать поправку на бесповторность отбора.

Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.

Ошибка выборки ε или, иначе говоря, ошибка репрезентативности представляет собой разность соответствующих выборочных и генеральных характеристик:

для средней количественного признака

ε = | x — x |;

для доли (альтернативного признака)

ε = | w – p |;

Ошибка выборки свойственна только выборочным наблюдениям. Чем больше значение этой ошибки, тем в большей степени выборочные показатели отличаются от соответствующих генеральных показателей.

Выборочная средняя и выборочная доля по всей сути являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок – среднюю ошибку выборки μ. [4, с. 33]

Средняя ошибка выборки – это среднее квадратическое отклонение всех возможных значений выборочной средней от генеральной средней, т. е. от своего математического ожидания.

От чего зависит средняя ошибка выборки?

При собственно случайном повторном отборе средняя ошибка выборки зависит от:

• вариации изучаемого признака в генеральной совокупности;

• объема выборки;

Чем больше вариация признака, тем больше ошибка выборки. Для ее уменьшения необходимо увеличить объем выборочной совокупности.

Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки ∆. Она определяется в долях средней ошибки с заданной вероятностью, т. е. ∆ = tμ

где t – коэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки. [4, с. 42]

При вероятности: Таблица 1

Р(t) = 0,683	t =1
Р(t) = 0,866	t =1,5
Р(t) = 0,954	t =2
Р(t) = 0,988	t =2,5
Р(t) = 0,997	t = 3
Р(t) = 0,999	t = 3,5

При собственно случайном бесповторном отборе средняя ошибка выборки зависит от:

• вариации изучаемого признака;

• объема выборки;

• доли обследованных единиц.

Чем больше объем выборки и доля обследованных единиц, тем меньше ошибка выборки; вариация признака связана с ней прямо пропорционально.

Если доля обследованных единиц невелика, то дополнительный множитель под знаком радикала практически не влияет на ошибку выборки. В этом случае ошибку выборки при бесповторном отборе можно найти по формулам, которые применяются при повторном отборе.

Наряду с абсолютной величиной средней и предельной ошибок выборки в статистической практике используется относительная их величина, рассчитываемая как отношение ошибки к исследуемому параметру: ∆отн = ∆ ⁄ x или ∆отн = ∆ ⁄ p. Теоретически в знаменателе должно быть значение исследуемого параметра генеральной совокупности. Однако оно неизвестно, поэтому относительная ошибка рассчитывается через соответствующий параметр выборки: ∆отн = ∆ ⁄ x или ∆отн = ∆ ⁄ w. Относительная ошибка выражается в процентах. Выборка считается репрезентативной, если ∆отн <=5%.

При соблюдении принципа случайного отбора средняя ошибка выборки определяется, прежде всего, объемом выборки: чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, все более точно характеризуем всю генеральную совокупность. [4, с. 43]

Средняя ошибка также зависит от степени варьирования изучаемого признака. Степень варьирования, как известно, характеризуется дисперсией σ² или w (1−w) – для альтернативного признака. Чем меньше вариация признака, а, следовательно, и дисперсия, тем меньше средняя ошибка выборки, и наоборот. При нулевой дисперсии (признак не варьирует) средняя ошибка выборки равна нулю, т.е. любая единица генеральной совокупности будет совершенно точно характеризовать всю совокупность по этому признаку.

Зависимость средней ошибки выборки от ее объема и степени варьирования признака отражена в формулах, с помощью которых можно рассчитать среднюю ошибку выборки в условиях выборочного наблюдения, когда генеральные характеристики (x, р) неизвестны, и, следовательно, не представляется возможным нахождение реальной ошибки выборки непосредственно по формулам. [6, с. 43]

Поскольку практически дисперсия признака в генеральной совокупности σ² точно неизвестна, на практике пользуются значением дисперсии S², рассчитанным для выборочной совокупности на основании закона больших чисел, согласно которому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности.

Таким образом, расчетные формулы средней ошибки выборки при случайном повторном отборе будут следующие:

Для средней количественного признака

μ = √S² / n;

Для доли (альтернативного признака)

μ = √w(1- w)/n

Однако дисперсия выборочной совокупности не равна дисперсии генеральной совокупности, и, следовательно, средние ошибки выборки, рассчитанные по формулам (2.3) и (2.4), будут приближенными. Но в теории вероятностей доказано, что генеральная дисперсия выражается через выборную следующим соотношением: σ² = S² n / n – 1 [4, с. 42]

Так как n/(n-1) при достаточно больших n – величина, близкая к единице, то можно принять, что σ² приблизительно равен S², а, следовательно, в практических расчетах средних ошибок выборки можно использовать формулы (см выше). И только в случаях малой выборки (когда объем выборки не превышает 30) необходимо учитывать коэффициент

n/(n-1) и исчислять среднюю ошибку малой выборки по формуле:

μ= √S²/n-1

При случайном бесповторном отборе в приведенные выше формулы расчеты средних ошибок выборки необходимо подкоренное выражение умножить на 1-(n / N), поскольку в процессе бесповторной выборки сокращается численность единиц генеральной совокупности. Следовательно, для бесповторной выборки расчетные формулы средней ошибки выборки примут такой вид:

Для средней количественного признака

μx̃ = √S² / n (1-(n / N));

Для доли (альтернативного признака)

μw = √w(1-w)/n (1-(n/ N))

Так как n всегда меньше N, то дополнительный множитель 1-(n / N) всегда будет меньше единицы. Отсюда следует, что средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном. В то же время при сравнительно небольшом проценте выборки этот множитель близок к единице (например, при 5 %-ной выборке он равен 0.95; при 2%-ной – 0.98 и т.д.). Поэтому иногда на практике пользуются для определения средней ошибки выборки формулами без указанного множителя, хотя выборку и организуют как бесповторную. Это имеет место в тех случаях, когда число единиц генеральной совокупности N, и по существу, введение дополнительного множителя, близкого по значению к единице, практически не повлияет на значение средней ошибки выборки. [2, с. 53]

Источник