При проведении
статистического наблюдения возможно
появление ошибок. Их можно разделить
на две группы: ошибки репрезентативности
и ошибки регистрации.
Ошибки
репрезентативности свойственны
выборочному наблюдению и возникают
вследствие того, что выборочная
совокупность недостаточно точно
воспроизводит генеральную.
Ошибки регистрации
возникают в результате неправильного
установления фактов или неправильной
их записи.
В связи с этим
результаты статистического наблюдения
контролируются и при этом используются
2 вида контроля: логический и арифметический.
Логический контроль
состоит в сопоставлении ответов на
поставленные вопросы программы
наблюдения, арифметический контроль
представляет собой проверку групповых
и общих цифровых данных.
Вопросы для самопроверки
-
Какова цель
статистического наблюдения? -
Какие существуют
виды выборочного наблюдения? -
Что входит в состав
плана наблюдения? -
Чем отличается
план наблюдения от программы наблюдения? -
Виды ошибок
статистического наблюдения. -
Какие существуют
способы контроля за результатами
статистического наблюдения?
Тест для
самопроверки к теме 1
«Статистическое
наблюдение»
1. Регистрация
денежных переводов, поступивших от
клиентов в отделение связи, это наблюдение:
1. несплошное
2. периодическое
3. текущее
4. единовременное
2. Ошибки
репрезентативности возникают:
1. при неправильной
записи в формуляр переписи
2. при проведении
выборочного наблюдения
3. при низкой
квалификации регистраторов
3. Перечень признаков,
характеризующих работника предприятия:
1. возраст
2. должность
3. оклад
4. стаж работы
Тема 2. Сводка и группировка статистических данных
2.1 Понятие статистической сводки и ее виды
Статистическая
сводка
является второй стадией статистического
исследования и представляет собой
научную обработку первичных данных с
целью получения обобщающих характеристик
изучаемого явления.
Статистическая
сводка бывает следующих видов:
-
централизованная
сводка; -
децентрализованная
сводка.
При нецентрализованной
сводке полученные в результате проведения
выборочного наблюдения данные сразу
направляются в центральные органы для
обработки и обобщения.
Преимущество такой
сводки – быстрота обработки статистических
данных, а недостатком является трудности
в обнаружении ошибок.
При децентрализованной
сводке информация проходит несколько
ступеней и только затем предоставляется
в центральный статистический орган.
Кроме того, сводка
бывает постой и сложной. При простой
сводке обобщенная информация не
группируется, а при сложной сводке
используется метод группировок.
2.2 Понятие статистических группировок и их виды
Основным элементом
сложной сводки является статистическая
группировка.
Группировка
– это расчленение единиц изучаемой
совокупности на группы по существенным
для них признакам. Группировочный
признак – это признак, по которому
проводится распределение единиц
совокупности на отдельные группы.
В зависимости от
задач, решаемых методом группировок,
они подразделяются на три вида:
-
типологические;
-
структурные;
-
аналитические.
Типологическая
группировка
предполагает расчленение множества
разнородных явлений на однородные
типические группы.
Структурные
группировки
позволяют определить соотношение в
изучаемом явлении отдельных частей. С
помощью структурных группировок
изучается состав населения по полу,
возрасту, образованию, семейному
положению. Аналитические группировки
позволяют решать задачи по изучению
связей между факторными и результативными
признаками в однородной совокупности.
В зависимости от
вида признака, который был положен в
основу группировки, они бывают:
-
дискретные;
-
интервальные
группировки.
В дискретных
группировках
признак принимает в определенных
пределах отдельные, прерывные значения,
выражаемые, как правило, целыми числами.
В интервальных группировках признаки
представлены в виде интервалов.
При построении
статистических группировок встает
вопрос о количестве групп, на которые
надо разбить исследуемую совокупность.
Число групп в
дискретных группировках устанавливается
равным числу значений признака.
При построении
интервальной группировки сначала
определяется количество групп, а потом
и величина интервала. При этом используются
формулы Г.Стерджесса.
Число групп
определяется по формуле:
,
(2.1)
где
N
– число единиц в изучаемой совокупности.
Величина интервала
определяется по формуле:
(2.2)
где
– максимальное значение признака;
–минимальное
значение признака.
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
2.4. Точность статистического наблюдения
Под точностью статистического наблюдения понимают степень соответствия значения наблюдаемого показателя, вычисленного по материалам обследования, его действительной величине. Расхождение, или разница, между ними называется ошибкой статистического наблюдения.
Различают две группы ошибок:
- ошибки регистрации;
- ошибки репрезентативности.
Ошибки регистрации присущи любому статистическому наблюдению, как сплошному, так и несплошному. Они делятся на случайные ошибки регистрации и систематические ошибки регистрации.
Случайными ошибками регистрации называют ошибки, возникающие вследствие действия случайных факторов. К ним можно отнести различного рода непреднамеренные описки: например, вместо возраста человека «15 лет» указано «5 лет», у Ивановой Марии Петровны в графе пол отмечен «Мужской» и т. п. Такие ошибки легко выявляются методом логического анализа, например, если человеку 8 лет, но имеется высшее образование, а в графе «Семейное положение» указано «Состоит в браке», то, естественно, следует исправить возраст. Если объем исследуемой совокупности велик или велика доля отбора при выборочном наблюдении, случайные ошибки регистрации имеют тенденцию взаимопогашаться вследствие действия закона больших чисел, поскольку ошибки, как правило, разнонаправлены и искажают статистический показатель как в большую, так и в меньшую сторону. При небольшом объеме наблюдения требуется тщательная выверка его результатов — логический анализ данных.
Систематические ошибки регистрации чаще всего имеют однонаправленные искажения: они либо увеличивают, либо уменьшают статистический показатель, и, что характерно, подобная ситуация повторяется от обследования к обследованию. Так, по результатам переписей (практически всех!) число замужних женщин превышает число женатых мужчин — мужчинам приятнее ощущать себя неженатыми, а для женщины как бы «стыдно» быть не замужем. Другой пример, когда человек округляет свой возраст — вместо 32 лет говорит 30, вместо 79-80 и т. п. (это явление широко известно и даже получило свое название — «аккумуляция возрастов»). Систематические ошибки регистрации могут возникать и из-за неточностей измерительных приборов, если сбор информации проводят путем непосредственного наблюдения.
Ошибки репрезентативности присущи только несплошному обследованию. Они также делятся на случайные и систематические ошибки.
Случайные ошибки репрезентативности возникают из-за того, что обследованию подвергается не вся совокупность в целом, а только ее часть, и, следовательно, при несплошном наблюдении они присутствуют всегда. В теории статистики разработаны специальные методы для оценки величин таких ошибок, на их основе для наблюдаемых показателей строят доверительные интервалы, т.д. эти ошибки вычисляются и находятся как бы «под контролем».
Хуже обстоит дело, если наряду со случайными ошибками имеются и ошибки систематические.
Систематические ошибки репрезентативности возникают, если при несплошном наблюдении кардинально нарушаются технологии отбора единиц из генеральной совокупности объектов, но чаще — если в ходе обследования не удается получить информацию обо всех отобранных для наблюдения единицах, например, вследствие отказа отвечать на вопросы анкеты, или если человека не удалось застать дома и т. п.
Ошибки статистического наблюдения для наглядности можно изобразить в виде схемы (рис. 2.1).
Рис.
2.1.
Виды ошибок статистического наблюдения
Для повышения точности наблюдения необходимо:
- правильно разработать формуляр статистического наблюдения: вопросы должны быть четкими, однозначными, не допускающими двойного толкования;
- иметь хорошо обученный персонал для проведения обследования;
- строго придерживаться выбранной технологии обследования (если проводится несплошное наблюдение) и помнить, что если не удается опросить какую-то конкретную единицу, отобранную для наблюдения, замена ее на другую единицу может привести к возникновению систематической ошибки репрезентативности;
- провести логический анализ данных, основанный на логических взаимосвязях показателей, после сбора всей совокупности анкет или формуляров;
- целесообразно провести и арифметический контроль данных, т.д. заново пересчитать расчетные величины, если какие-либо показатели получаются в результате определенных арифметических действий;
- предпринять определенные меры по восстановлению данных при наличии незаполненных анкет или формуляров либо при получении результатов обследования сделать поправку на неответы респондентов.
Расхождение между действительными значениями изучаемых величин и значениями, установленными в процессе статистического наблюдения, и называют ошибкой наблюдения. Ошибки являются следствием неточности при установлении и регистрации значений изучаемых признаков.
В зависимости от причин возникновения различают следующие виды ошибок:
1) ошибки регистрации;
2) ошибки репрезентативности (представительности);
3) случайные ошибки;
4) систематические ошибки;
5) преднамеренные ошибки;
6) непреднамеренные ошибки.
Ошибки регистрации — это отклонения между значением показателя, полученным в ходе статистического наблюдения, и фактическим, действительным его значением. Этот вид ошибок возникает при сплошном и несплошном наблюдениях.
Ошибки репрезентативности (представительности) — собственное расхождение величины изучаемого признака в отобранной части совокупности и во всей совокупности. Ошибки репрезентативности свойственны только несплошному наблюдению.
Случайная ошибка — это результат действия различных случайных факторов, оговорок при ответах, описок, неправильности измерения. Случайные ошибки действуют как в направлении увеличения, так и в направлении уменьшения значений изучаемых признаков.
При достаточно большой обследуемой совокупности в результате действия закона больших чисел эти ошибки взаимно погашаются.
Систематические ошибки регистрации всегда имеют одинаковую тенденцию либо к увеличению, либо к уменьшению значения показателей по каждой единице наблюдения, и поэтому величина показателя по совокупности в целом будет включать в себя накопленную ошибку. Систематические ошибки могут появляться в результате несовершенства измерительных приборов, неправильности округлений результатов, неясной формулировки программы.
Преднамеренные и непреднамеренные ошибки определяются степенью тенденциозности подхода к установлению факта. Преднамеренные ошибки выражаются в сознательном искажении значений признаков. Непреднамеренные ошибки возникают независимо от сознания людей, участвующих в статистическом наблюдении.
Для выявления ошибок наблюдения применяют следующие виды контроля:
1) счетный контроль. Заключается в проверке итогов подсчета данных, а также в использовании количественных связей между показателями;
2) логический контроль. Осуществляется путем проверки содержательной связи между значениями признаков. При логическом контроле отыскиваются недопустимые отклонения значений признака от наиболее вероятных.
20. Понятие о выборочном наблюдении
Выборочное наблюдение — это такое наблюдение, при котором обследованию подвергается часть единиц изучаемой совокупности, отобранных на основе научно разработанных принципов, обеспечивающих получение достаточного количества достоверных данных для характеристики совокупности в целом.
Основные принципы выборочного наблюдения следующие: случайность отбора наблюдаемого явления; репрезентативность выборки.
В основе принципа случайности лежит равная возможность для каждой единицы попасть в выборку. Репрезентативные выборки обеспечивают достаточным числом отобранных единиц. Средние и относительные показатели, полученные на основе выборочных данных, должны достаточно полно воспроизводить или представлять соответствующие показатели совокупности в целом.
Выборочное наблюдение предполагает проведение таких этапов, как:
1) определение объекта и целей выборочного наблюдения;
2) выбор схемы отбора единиц наблюдения;
3) расчет объема выборки;
4) проведение случайного отбора установленного числа единиц из генеральной совокупности;
5) наблюдение отобранных единиц по установленной программе;
6) расчет выборочных характеристик в соответствии с программой выборочного наблюдения;
7) определение ошибки, ее размера;
распространение выборочных данных на генеральную совокупность;
9) анализ полученных данных.
Выборочное наблюдение имеет следующие основные преимущества и недостатки:
1) преимущества:
а) его можно осуществить по более широкой программе;
б) его требует меньше затрат на проведение;
в) его организуют в тех случаях, когда невозможно воспользоваться отчетностью;
2) недостатки:
а) полученные данные всегда содержат ошибку;
б) о результатах наблюдения можно судить лишь с определенной степенью достоверности.
Вся совокупность единиц, из которых производится отбор, называется генеральной совокупностью. Часть единиц генеральной совокупности, отобранная в случайном порядке, составляет выборочную совокупность. Характеристиками генеральной и выборочной совокупности служат доля и средняя величина, а также дисперсия и среднее квадратическое отклонение. Средняя величина является характеристикой количественных признаков, а дол я — характеристикой альтернативных признаков.
Среднее значение признака генеральной совокупности называется генеральной средней, обозначается , выборочной совокупности — выборочной средней, обозначается .
Доля генеральной совокупности называется генеральной долей и обозначается р, доля выборочной совокупности называется выборочной долей и обозначается w. Численность генеральной совокупности обозначается N, а численность выборочной — n.
12. Ошибки выборочного наблюдения
Ошибка выборки — расхождение между характеристиками выборки и характеристиками генеральной совокупности. Она зависит от ряда факторов: степени вариации изучаемого признака, численности выборки, методов отбора единиц в выборочную совокупность, принятого уровня достоверности результата исследования. Ошибка выборки состоит из ошибки регистрации и ошибки репрезентативности, которые бывают систематическими и случайными.
Конец бесплатного ознакомительного фрагмента