а) Виды ошибок
В процессе исследования явлений может
возникать отклонение исчисленных
показателей от их действительной
величины, то есть могут возникать ошибки
статистического наблюдения.
По источникам происхождения ошибки
наблюдения можно подразделить на
следующие:
-
преднамеренные;
-
непреднамеренные,
которые в свою очередь делятся на:
-
случайные;
-
систематические;
-
репрезентативности
(представительности).
Преднамеренные(сознательные, злостные) получаются в
результате того, что сознательно
сообщаются неправильные данные. Например,
сокрытие фирмами прибыли от налогообложения,
искажение сведений об объеме выпускаемой
продукции, приписки и т. д.
Законом
предусматривается применение экономических
и административных мер к предприятиям
и лицам за злостные ошибки (иногда и
уголовная ответственность).
Непреднамеренные
случайныеошибки чаще связаны с
невнимательностью регистратора,
небрежностью в заполнении документов,
неточностью измерительных приборов,
ошибками в ответах опрашиваемых.
Непреднамеренные
систематическиеошибки возникают
при округлении признака в большую или
меньшую сторону, при использовании ЭВМ.
Ошибки
репрезентативности(представительности)
свойственны несплошному наблюдению,
они возникают вследствие неправильного
выбора единиц для обследования, нарушен
принцип случайного отбора, и выборочная
совокупность не полно характеризует
генеральную.
Б) Способы предотвращения ошибок статистического наблюдения
Чтобы
предупредить возникновение ошибок или
уменьшить их размеры необходимо:
-
обеспечивать
правильный подбор и подготовку кадров; -
вести широкую
разъяснительную работу, применять меры
взыскания за искажение фактов; -
проводить
систематический контроль.
Контроль может
быть: счетным и логическим.
Счетный контроль
заключается в проверке точности
арифметических расчетов.
Логический
контроль проводится путем сопоставления
полученных данных с известными признаками,
логическое осмысление, сопоставление
с данными за прошлый период.
Например, о
заработной плате работников предприятия
можно судить по отчету, по труду и по
отчету о себестоимости продукции.
Сведения о заработной плате должны быть
одинаковыми, сопоставимыми (приведите
примеры).
__________________________________________________________________________________
__________________________________________________________________________________
__________________________________________________________________________________
__________________________________________________________________________________
__________________________________________________________________________________
__________________________________________________________________________________
__________________________________________________________________________________
__________________________________________________________________________________
__________________________________________________________________________________
__________________________________________________________________________________
__________________________________________________________________________________
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
2.4. Точность статистического наблюдения
Под точностью статистического наблюдения понимают степень соответствия значения наблюдаемого показателя, вычисленного по материалам обследования, его действительной величине. Расхождение, или разница, между ними называется ошибкой статистического наблюдения.
Различают две группы ошибок:
- ошибки регистрации;
- ошибки репрезентативности.
Ошибки регистрации присущи любому статистическому наблюдению, как сплошному, так и несплошному. Они делятся на случайные ошибки регистрации и систематические ошибки регистрации.
Случайными ошибками регистрации называют ошибки, возникающие вследствие действия случайных факторов. К ним можно отнести различного рода непреднамеренные описки: например, вместо возраста человека «15 лет» указано «5 лет», у Ивановой Марии Петровны в графе пол отмечен «Мужской» и т. п. Такие ошибки легко выявляются методом логического анализа, например, если человеку 8 лет, но имеется высшее образование, а в графе «Семейное положение» указано «Состоит в браке», то, естественно, следует исправить возраст. Если объем исследуемой совокупности велик или велика доля отбора при выборочном наблюдении, случайные ошибки регистрации имеют тенденцию взаимопогашаться вследствие действия закона больших чисел, поскольку ошибки, как правило, разнонаправлены и искажают статистический показатель как в большую, так и в меньшую сторону. При небольшом объеме наблюдения требуется тщательная выверка его результатов — логический анализ данных.
Систематические ошибки регистрации чаще всего имеют однонаправленные искажения: они либо увеличивают, либо уменьшают статистический показатель, и, что характерно, подобная ситуация повторяется от обследования к обследованию. Так, по результатам переписей (практически всех!) число замужних женщин превышает число женатых мужчин — мужчинам приятнее ощущать себя неженатыми, а для женщины как бы «стыдно» быть не замужем. Другой пример, когда человек округляет свой возраст — вместо 32 лет говорит 30, вместо 79-80 и т. п. (это явление широко известно и даже получило свое название — «аккумуляция возрастов»). Систематические ошибки регистрации могут возникать и из-за неточностей измерительных приборов, если сбор информации проводят путем непосредственного наблюдения.
Ошибки репрезентативности присущи только несплошному обследованию. Они также делятся на случайные и систематические ошибки.
Случайные ошибки репрезентативности возникают из-за того, что обследованию подвергается не вся совокупность в целом, а только ее часть, и, следовательно, при несплошном наблюдении они присутствуют всегда. В теории статистики разработаны специальные методы для оценки величин таких ошибок, на их основе для наблюдаемых показателей строят доверительные интервалы, т.д. эти ошибки вычисляются и находятся как бы «под контролем».
Хуже обстоит дело, если наряду со случайными ошибками имеются и ошибки систематические.
Систематические ошибки репрезентативности возникают, если при несплошном наблюдении кардинально нарушаются технологии отбора единиц из генеральной совокупности объектов, но чаще — если в ходе обследования не удается получить информацию обо всех отобранных для наблюдения единицах, например, вследствие отказа отвечать на вопросы анкеты, или если человека не удалось застать дома и т. п.
Ошибки статистического наблюдения для наглядности можно изобразить в виде схемы (рис. 2.1).
Рис.
2.1.
Виды ошибок статистического наблюдения
Для повышения точности наблюдения необходимо:
- правильно разработать формуляр статистического наблюдения: вопросы должны быть четкими, однозначными, не допускающими двойного толкования;
- иметь хорошо обученный персонал для проведения обследования;
- строго придерживаться выбранной технологии обследования (если проводится несплошное наблюдение) и помнить, что если не удается опросить какую-то конкретную единицу, отобранную для наблюдения, замена ее на другую единицу может привести к возникновению систематической ошибки репрезентативности;
- провести логический анализ данных, основанный на логических взаимосвязях показателей, после сбора всей совокупности анкет или формуляров;
- целесообразно провести и арифметический контроль данных, т.д. заново пересчитать расчетные величины, если какие-либо показатели получаются в результате определенных арифметических действий;
- предпринять определенные меры по восстановлению данных при наличии незаполненных анкет или формуляров либо при получении результатов обследования сделать поправку на неответы респондентов.
Ошибки в наблюдении и способы их преодоления.
Вероятность статистических данных — закон государственной статистики Обеспечивается она должным составлением программы и плана наблюдения, научной организацией сбора, обработки и анализа информации Как к тщательно не было организованное статистическое наблюдение, собранные материалы могут иметь разные по характеру и возникновением неточности: неполный охват единиц наблюдения, подлежащих рег ее; пропуски отдельных записей; ошибки отдельных записей и т.п. Если полноту охвата единиц наблюдения и пропуски отдельных показателей установить нетрудно, то найти допущенные погрешности единичных запись ей, так называемые ошибки наблюдения, дело не из легкиких.
Ошибки в процессе наблюдения приводят к снижению его точности
Точностью статистического наблюдения называют степень соответствия величины какого-либо показателя (признака), установленной с помощью наблюдения, действительной величине Она измеряется разницей или соотнонням этих величинын.
Разница между величиной какого-либо показателя, установленного путем наблюдения и настоящим его размером называютошибками статистического наблюдения Ошибки наблюдения разделяют на два вида: ошибки регистрации и ошибки репрезентативности
Ошибки регистрации возникают вследствие неправильного установления фактов или неправильного их записи в формуляр
Ошибки репрезентативности имеют место лишь при выборочном обследовании и возникают вследствие того, что выборочная совокупность недостаточно полно воспроизводит всю изучаемую совокупность Подробнее ошибки репрезентативности описаны в § 11.4.
Ошибки репрезентативности могут быть как при сплошном, так и при сплошные наблюдении Они могут быть преднамеренными и непреднамереннымиУмышленные ошибки являются следствием сознательного искажения действительности в сторону увеличения или уменьшения истинных размеров исследуемого признака
Непреднамеренные ошибки возникают независимо от желания лиц, сообщающих или регистрируют данные
Непреднамеренные ошибки регистрации могут иметь случайный или систематический характер
Случайные непреднамеренные ошибки регистрации — это ошибки, возникающие вследствие различных случайных причин: описка, оговорка и т др. Они приводят к отклонениям данных наблюдения от фактических размеров признаки с одинаковой вероятностью ю как в сторону увеличения, так и в сторону уменьшения данных При достаточно большом количестве единиц наблюдений случайные ошибки могут взаимно погашаться и не производить существенного влияния на результаты видеонаблюдениЭннння.
Систематические непреднамеренные ошибки регистрации возникают из определенных неслучайных причин и приводят к отклонениям данных наблюдения от фактических размеров признаки в сторону увеличения или уменьшения Причиной таких ошибок может быть несправнисво измерительных приборов, нечеткая формулировка вопросов, несовершенство статистического инструментария, склонность людей к округлению цифр и т иін.
Умышленные ошибки регистрации всегда имеют систематический характер
Логично завершается статистическое наблюдение приемом материалов исследования Когда материал статистического наблюдения получены полностью от всех единиц, подлежащих наблюдению, проверяют полноту (качество) заполнения бланков Если при приеме материала наблюдения выявлено незаполненные (или частично заполненные) бланки, значит при статистическом наблюдении пропущена единица сп выговор Поэтому ответственное лицо, принимая статистические формуляры (бланки) в первую очередь проверяет полноту их заполнения и в случае необходимости принимает меры для их исправленияня. .
Наряду с проверкой полноты заполнения бланков осуществляется контроль за достоверностью и правильностью ответов При приеме материалов наблюдения главное внимание уделяется правильности заполнения соответствующих бланков и проверке достоверности (точности) показательв.
Контроля за достоверностью статистических данных статистические органы уделяют особое внимание Такие функции (обязанности) государственная статистика выполняет в тесном контакте с органами контроля, прокуратуры и гром венных организациями.
С целью выявления и устранения допущенных при регистрации ошибок статистические органы осуществляют арифметический и логический контроль собранного материала
Арифметический контроль заключается в проверке точности арифметических подсчетов и расчетов: проверка итоговых показателей в документах, проверка правильности подсчетов процентов, средних величин и т др.
Логический контроль заключался в сопоставлении ответов на вопросы и выяснения их логической согласованности В процессе логического контроля могут быть установлены нереальные или малоправдоподибни ответа
Рассмотрим общие приемы логического контроля
1 Сопоставление ответов на различные взаимосвязанные вопросы в формулярах Например, запись в формуляре о том, что ребенок дошкольного возраста имеет среднее образование, является ошибочным
2 Сравнение записей в документе, проверяемого с аналогичными записями в других документах
3 Сопоставление отчетных показателей за смежные периоды
4 Применение метода балансовой согласованности показателей
часто используют такую ??балансовую равенство: наличие на начало периода плюс поступления минус выбытия равна наличии на конец отчетного периода
5 Проведение напрямую переписями контрольных проверок — сплошных или выборочных
Указанные приемы проверки статистических данных путем арифметического и логического контроля используют как при проверке материалов специально организованных статистических наблюдений, так и отчетности Можно утверждать, что арифметический контроль четко устанавливает наличие ошибки, а логический — в большинстве случаев лишь выявляет возможность ошибки При этом, если проведение арифметического контроля вы МАГАТЭ от статистика элементарной грамотности, то логический — может осуществляться только высококвалифицированными специалистамми.
Значительная вероятность статистических данных обусловлено действующей системой мер, направленных на уменьшение и избежание ошибок Среди них следует назвать следующие: качественный первичный учет, разработка научных рекомендаций ендаций по вопросам проверки достоверности данных; подбор квалифицированных кадров-статистиков, автоматизация статистических работ и т д.
Источник
Ошибки наблюдения и способы их устранения
Способы наблюдения (получения информации) (слайд 1.2.8)
В т.ч. по способам организации опроса
Непосредственноенаблюдение – это регистрация величин признаков на основе непосредственного осмотра единиц совокупностей путем замеров и подсчетов.
Документальныйспособ – способ регистрации признаков на основе документов первичного или бухгалтерского учета, а также по данным каких- либо публикаций.
На практике это по существу вторичное наблюдение , так как исследование ведется по уже опубликованным материалам исследования по территориям, административным подразделениям, отраслям, выступающим в исследовании единицам совокупности. Это наименее трудоемкий способ формирования баз данных для изучения явлений и процессов.
Опрос- это получение сведений о регистрируемых признаках от опрашиваемых лиц.
При экспедиционном способе опросы ведут специальные счетчики или интервьюеры. (например, при переписях населения)
При корреспондентском способе опрос проводят добровольцы по заранее установленному кругу вопросов.
При саморегистрации опрашиваемые сами заполняют опросные листы или другие документы с вопросами программы наблюдения.
Полученные в результате статистического наблюдения базы данных необходимо оценить на полноту ( отсутствие пропусков) и достоверность величин, то есть установить наличие возможных ошибок. Все ошибки можно классифицировать в зависимости от причин возникновения на следующие группы (слайд
Виды ошибок наблюдения: (слайд 1.2.9)
I. Ошибки регистрации
II. Ошибки репрезентативности
Ошибки регистрации возникают в процессе записи значений признаков в формуляры. Если произошло искажение фактических уровней признака случайно, с силу описок, ошибки следует признать случайными. Их разнотипные отклонения (в большую и меньшую сторону) от реальных данных, как правило, при большом числе наблюдений «взаимопогашаются», и они не вызывают существенные искажения свойств совокупности. Напротив, систематические ошибки приводят к существенному искажению информации об объекте исследования, так как представляют собой однотипные отклонения ( в одну сторону) от реальных данных. Причинами для непреднамеренных систематических ошибок могут быть неисправность приборов, низкий уровень квалификации субъекта наблюдения. Преднамеренное искажение исходных данных, как правило, связано с личной заинтересованностью субъекта в фальсификации данных, что приводит к преднамеренной систематической ошибке регистрации. Ошибки регистрации могут возникнуть как при сплошном, так и несплошном наблюдении.
Ошибки репрезентативности — это ошибки несплошного наблюдения, возникающие в силу того, что не все единицы совокупности подвергаются наблюдению, а только часть их. Наиболее полно изучены ошибки при выборочном наблюдении. Если нарушаются принципы отбора единиц из генеральной совокупности в выборку, возникают систематические ошибки. Случайные ошибки выборки присутствуют в базе данных как результат неполного обследования единиц совокупности.
Результатом контроля за ошибками должно быть полное устранение систематических ошибок любого рода и учет возможных случайных ошибок выборки.
Для устранения ошибок применяют
1) Логический контроль
2) Арифметический контроль
При логическом контроле проверяется соответствие ответа поставленному вопросу и заранее установленным правилам и соотношениям, согласованность ответов между собой, непротиворечивость их друг другу. Не может, например, ребенок 5 лет работать на предприятии и иметь среднее образование, а хронически убыточное предприятие платить налоги на прибыль.
Арифметически проверяют, чтобы сумма частных показателей не превышала общего итога или равнялась ему, чтобы часть не была больше целого, а относительные показатели были рассчитаны правильно как соотношение приведенных в программе наблюдения значений абсолютных величин.
В последние годы широко стало применяться автоматическое редактирование собранных первичных, особенно выборочных, данных наблюдения, когда, с использованием приемов математической статистики оценивается принадлежность признака к данной совокупности и выделяются артефакты. Разрабатываются также расчетные формулы, с помощью которых на основе достоверных данных определяются сомнительные значения признаков. Но в области общественных явлений необходимо быть очень осторожным в исправлении расчетным путем полученных признаков наблюдения и ни в коем случае не изменять по субъективным соображениям их значение без проверки достоверности, поскольку общественные явления очень подвижны и динамичны.
Резюме по модульной единице 2:статистическое наблюдение –первый этап статистического исследования, обеспечивающий получение полной, достоверной, объективной, своевременной информации по изучаемому объекту, реализуется посредством разработки плана и программы наблюдения, непосредственного сбора признаков по единицам статистической совокупности и контроля их с целью выявления ошибок.
Контрольные вопросы:
1.Статистическое наблюдение –это…?
2.С какой целью проводится наблюдение?
3.Какие этапы статистического наблюдения необходимо реализовать при его проведении?
4.Какие вопросы включает план наблюдения ?
5. Программа наблюдения – это…?
6. Какие виды наблюдения Вы знаете?
7. Какое наблюдение называется наблюдением основного массива?
8. Какие способы проведения наблюдения Вы знаете ?
9. Какие формы могут иметь место при организации наблюдения ?
10. Какие ошибки наблюдения называются случайными и систематическими ошибками выборки? Какие методы борьбы с ними?
Тесты для контроля знаний:
1. Статистическое наблюдение-это…
1. Получение показателей по социально-экономическому явлению или процессу.
2.Научно организованный сбор признаков по единицам статистической совокупности.
3.Запись значений признаков в статистические формуляры
4.Опрос с целью получения информации по единице наблюдения
2. План статистического наблюдения — это…
1.формуляр с перечнем признаков, подлежащих наблюдению
2. документ с изложением методологии и организации сбора данных
3.Сбор сведений по формам статистического наблюдения
4.возможные статистические показатели, получаемые в результате обработки информации
3. Составной элемент объекта, являющийся носителем признаков, подлежащих регистрации, называется…
1) единицей наблюдения
2) единицей регистрации
3) статистическим формуляром
Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет
Источник
5. Ошибки статистического наблюдения
В процессе исследования явлений может возникать отклонение исчисленных показателей от их действительной величины, то есть могут возникать ошибки статистического наблюдения.
По источникам происхождения ошибки наблюдения можно подразделить на следующие:
непреднамеренные, которые в свою очередь делятся на:
Преднамеренные(сознательные, злостные) получаются в результате того, что сознательно сообщаются неправильные данные. Например, сокрытие фирмами прибыли от налогообложения, искажение сведений об объеме выпускаемой продукции, приписки и т. д.
Законом предусматривается применение экономических и административных мер к предприятиям и лицам за злостные ошибки (иногда и уголовная ответственность).
Непреднамеренные случайныеошибки чаще связаны с невнимательностью регистратора, небрежностью в заполнении документов, неточностью измерительных приборов, ошибками в ответах опрашиваемых.
Непреднамеренные систематическиеошибки возникают при округлении признака в большую или меньшую сторону, при использовании ЭВМ.
Ошибки репрезентативности(представительности) свойственны несплошному наблюдению, они возникают вследствие неправильного выбора единиц для обследования, нарушен принцип случайного отбора, и выборочная совокупность не полно характеризует генеральную.
Б) Способы предотвращения ошибок статистического наблюдения
Чтобы предупредить возникновение ошибок или уменьшить их размеры необходимо:
обеспечивать правильный подбор и подготовку кадров;
вести широкую разъяснительную работу, применять меры взыскания за искажение фактов;
проводить систематический контроль.
Контроль может быть: счетным и логическим.
Счетный контроль заключается в проверке точности арифметических расчетов.
Логический контроль проводится путем сопоставления полученных данных с известными признаками, логическое осмысление, сопоставление с данными за прошлый период.
Например, о заработной плате работников предприятия можно судить по отчету, по труду и по отчету о себестоимости продукции. Сведения о заработной плате должны быть одинаковыми, сопоставимыми (приведите примеры).
Источник
Добавил:
Upload
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз:
Предмет:
Файл:
Подготовка к Интернет — экзамену, статистика.doc
Скачиваний:
5
Добавлен:
20.11.2019
Размер:
499.2 Кб
Скачать
Оценка точности статистического наблюдения
Точность статистического наблюдения
– степень соответствия значения
наблюдаемого показателя, вычисленного
по материалам обследования, его
действительной величине.
Ошибка статистического наблюдения
– расхождение или разница между значением
наблюдаемого показателя и его
действительной величиной. Различают
две группы ошибок:
1. ошибки регистрации
(присущи любому статистическому
наблюдению: и сплошному и несплошному)
– расхождение между зафиксированным
при наблюдении статистическом значении
признака и действительным его значением
в результате неправильной регистрации
ответа на вопрос формуляра, они делятся:
-
случайные ошибки регистрации –
возникают под действием случайных
факторов -
систематические ошибки регистрации
– это неточности, возникающие в силу
определенных и постоянно действующих
на протяжении всего статистического
наблюдения в одном направлении факторов,
подразделяются на:
-
преднамеренные систематические
ошибки регистрации – это ошибки,
являющиеся результатом того, что
опрашиваемый умышленно сообщает
регистратору неправильные данные, -
непреднамеренные систематические
ошибки регистрации – это ошибки,
которые носят нечаянный характер,
допускаются неумышленно;
2. ошибки репрезентативности
(присущи только несплошному наблюдению)
– это расхождение между значениями
изучаемого признака или показателя в
отобранной и обследованной части
совокупности (выборочной) и его значениями
во всей исходной (генеральной) совокупности,
делятся на:
-
случайные ошибки репрезентативности
– присутствуют всегда, так как
обследованию подвергается не вся
совокупность в целом, а её часть -
систематические ошибки репрезентативности
– возникают, если при несплошном
наблюдении кардинально нарушаются
технологии отбора единиц из генеральной
совокупности или не удается получить
информацию обо всех отобранных для
наблюдения единицах (например, отказ
отвечать на вопросы анкеты, или отсутствие
человека дома и т.п.).
Способы контроля статистического
наблюдения на достоверность:
-
Синтаксический контроль – проверка
правильности структуры документа,
наличия необходимых реквизитов, проверка
оформления документов; -
Логический контроль – сопоставление
ответов на взаимосвязанные вопросы
статистического формуляра или другого
документа обследования с целью выявления
логически несовместимых ответов
(например, мальчик 13 лет, работающий в
строительной фирме, имеющий высшее
образование); -
Арифметический (счетный) контроль
– основан на знании количественных
связей между показателями, которые
могут быть проверены арифметическим
путем.
Сводка и группировка статистических данных
Сводка – обработка первичных данных,
полученных при проведении статистического
наблюдения, с целью их систематизации
и обобщения.
Виды сводки:
По технике выполнения:
-
ручная,
-
механизированная.
По глубине и точности обработки
материала:
-
простая статистическая сводка
– это операция по подсчету общих
итоговых и групповых данных непосредственно
по совокупности единиц наблюдения и
оформление этого материала в таблицу. -
сложная статистическая сводка
– это комплекс операций, включающих
группировку, подсчет промежуточных
итогов (по группам единиц наблюдения)
и общих итогов.
Программа проведения сложной сводки
предусматривает:
-
выбор группировочного признака;
-
определение порядка формирования
групп; -
разработку системы показателей,
характеризующих отдельные группы и
совокупность в целом; -
построение макета статистической
таблицы; -
представление результатов сводки в
таблице.
По форме обработки статистической
информации:
-
децентрализованная статистическая
сводка – обработка данных
производится на местах, затем они
поступают в вышестоящие органы, где
происходит подведение общих итогов в
целом по народному хозяйству; -
централизованная статистическая
сводка – обработка данных
производится от начала и до конца
центральной организацией.
Группировка – это метод, при котором
вся исходная совокупность делится на
группы по какому-то существенному
признаку.
Группировочный
признак
– признак, лежащий
в основании группировки,
изучаемый признак или основание, по
которому производится разбивка единиц
совокупности.
Группировочные
признаки
бывают:
-
количественные
–
числовые (например, группировка
предприятий по среднесписочной
численности работников, объем выпускаемой
продукции, возраст человека, доход
семьи и т.д.); -
атрибутивные
(качественные)
– описательные (например, пол,
семейное положение, политическая
ориентация человека,
принадлежность предприятия к конкретной
форме собственности, производственной
отрасли и т.д.
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
Расхождение между действительными значениями изучаемых величин и значениями, установленными в процессе статистического наблюдения, и называют ошибкой наблюдения. Ошибки являются следствием неточности при установлении и регистрации значений изучаемых признаков.
В зависимости от причин возникновения различают следующие виды ошибок:
1) ошибки регистрации;
2) ошибки репрезентативности (представительности);
3) случайные ошибки;
4) систематические ошибки;
5) преднамеренные ошибки;
6) непреднамеренные ошибки.
Ошибки регистрации — это отклонения между значением показателя, полученным в ходе статистического наблюдения, и фактическим, действительным его значением. Этот вид ошибок возникает при сплошном и несплошном наблюдениях.
Ошибки репрезентативности (представительности) — собственное расхождение величины изучаемого признака в отобранной части совокупности и во всей совокупности. Ошибки репрезентативности свойственны только несплошному наблюдению.
Случайная ошибка — это результат действия различных случайных факторов, оговорок при ответах, описок, неправильности измерения. Случайные ошибки действуют как в направлении увеличения, так и в направлении уменьшения значений изучаемых признаков.
При достаточно большой обследуемой совокупности в результате действия закона больших чисел эти ошибки взаимно погашаются.
Систематические ошибки регистрации всегда имеют одинаковую тенденцию либо к увеличению, либо к уменьшению значения показателей по каждой единице наблюдения, и поэтому величина показателя по совокупности в целом будет включать в себя накопленную ошибку. Систематические ошибки могут появляться в результате несовершенства измерительных приборов, неправильности округлений результатов, неясной формулировки программы.
Преднамеренные и непреднамеренные ошибки определяются степенью тенденциозности подхода к установлению факта. Преднамеренные ошибки выражаются в сознательном искажении значений признаков. Непреднамеренные ошибки возникают независимо от сознания людей, участвующих в статистическом наблюдении.
Для выявления ошибок наблюдения применяют следующие виды контроля:
1) счетный контроль. Заключается в проверке итогов подсчета данных, а также в использовании количественных связей между показателями;
2) логический контроль. Осуществляется путем проверки содержательной связи между значениями признаков. При логическом контроле отыскиваются недопустимые отклонения значений признака от наиболее вероятных.
20. Понятие о выборочном наблюдении
Выборочное наблюдение — это такое наблюдение, при котором обследованию подвергается часть единиц изучаемой совокупности, отобранных на основе научно разработанных принципов, обеспечивающих получение достаточного количества достоверных данных для характеристики совокупности в целом.
Основные принципы выборочного наблюдения следующие: случайность отбора наблюдаемого явления; репрезентативность выборки.
В основе принципа случайности лежит равная возможность для каждой единицы попасть в выборку. Репрезентативные выборки обеспечивают достаточным числом отобранных единиц. Средние и относительные показатели, полученные на основе выборочных данных, должны достаточно полно воспроизводить или представлять соответствующие показатели совокупности в целом.
Выборочное наблюдение предполагает проведение таких этапов, как:
1) определение объекта и целей выборочного наблюдения;
2) выбор схемы отбора единиц наблюдения;
3) расчет объема выборки;
4) проведение случайного отбора установленного числа единиц из генеральной совокупности;
5) наблюдение отобранных единиц по установленной программе;
6) расчет выборочных характеристик в соответствии с программой выборочного наблюдения;
7) определение ошибки, ее размера;
распространение выборочных данных на генеральную совокупность;
9) анализ полученных данных.
Выборочное наблюдение имеет следующие основные преимущества и недостатки:
1) преимущества:
а) его можно осуществить по более широкой программе;
б) его требует меньше затрат на проведение;
в) его организуют в тех случаях, когда невозможно воспользоваться отчетностью;
2) недостатки:
а) полученные данные всегда содержат ошибку;
б) о результатах наблюдения можно судить лишь с определенной степенью достоверности.
Вся совокупность единиц, из которых производится отбор, называется генеральной совокупностью. Часть единиц генеральной совокупности, отобранная в случайном порядке, составляет выборочную совокупность. Характеристиками генеральной и выборочной совокупности служат доля и средняя величина, а также дисперсия и среднее квадратическое отклонение. Средняя величина является характеристикой количественных признаков, а дол я — характеристикой альтернативных признаков.
Среднее значение признака генеральной совокупности называется генеральной средней, обозначается , выборочной совокупности — выборочной средней, обозначается .
Доля генеральной совокупности называется генеральной долей и обозначается р, доля выборочной совокупности называется выборочной долей и обозначается w. Численность генеральной совокупности обозначается N, а численность выборочной — n.
12. Ошибки выборочного наблюдения
Ошибка выборки — расхождение между характеристиками выборки и характеристиками генеральной совокупности. Она зависит от ряда факторов: степени вариации изучаемого признака, численности выборки, методов отбора единиц в выборочную совокупность, принятого уровня достоверности результата исследования. Ошибка выборки состоит из ошибки регистрации и ошибки репрезентативности, которые бывают систематическими и случайными.
Конец бесплатного ознакомительного фрагмента
Важнейшей задачей статистического наблюдения является достоверность и точность собираемой статистической информации.
Любое статистическое наблюдение предполагает получение данных, которые будут полно и точно отражать действительность.
В процессе проведения статистического наблюдения могут возникать погрешности, которые приводят к снижению достоверности статистического наблюдения.
Основное требование, которое предъяввляется к статистическому наблюдению – это точность статистических данных.
Точность – это уровень соответствия значения какого-либо признака или показателя, который был получен вследствие статистического наблюдения, действительному его значению. В процессе подготовки и проведения статистического исследования, чтобы предупредить возможность появления отклонений или разности между исчисленными показателями, нужно предусмотреть и осуществить ряд мероприятий. Если же такие отклонения возникли, их называют ошибками статистического наблюдения.
Материалы, собранные в результате наблюдения, подвергаются всесторонней проверке и контролю. Они проверяются с точки зрения полноты охвата всех единиц совокупности наблюдения и правильности заполнения документов и в порядке логического и арифметического контроля.
Ошибки статистического наблюдения – это ошибки репрезентативности и ошибки регистрации.
Ошибки репрезентативности показывают, в какой степени выборочная совокупность представляет генеральную совокупность. Эти ошибки возникают потому, что наблюдению подвергается только часть единиц изучаемой совокупности, и сведения эти не могут абсолютно точно отобразить свойства всей массы явлений совокупности.
Возникающие в результате неправильного установления фактов ошибки регистрации можно подразделить на:
- случайные – это ошибки, которые могут дать искажения как в одну, так и в другую сторону;
- систематические ошибки, возникающие вследствие нарушения принципов непреднамеренного отбора единиц изучаемой совокупности. Систематические ошибки опасны, потому что они влияют на полученные итоговые показатели;
- преднамеренные ошибки возникают вследствие умышленного искажения фактов.
Для обеспечения достоверности данных статистического наблюдения предусматривают проверку их качества с точки зрения полноты охвата изучаемого объекта статистическим наблюдением, качества и др.
Проверка данных статистического наблюдения на достоверность – это проведение логического, арифметического и синтаксического контроля.
8.1. Понятие выборочного метода. Ошибка выборки
Статистическое исследование может осуществляться по данным несплошного наблюдения. Основная цель несплошного наблюдения – получение характеристик изучаемой совокупности по обследованной её части. Один из наиболее распространённых в статистике методов, применяющий несплошное наблюдение – выборочный метод.
· Под ВЫБОРОЧНЫМ понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой её части (обычно 5 – 10 %, реже 15 – 25 % изучаемой совокупности)на основе случайного отбора.
· Подлежащая изучению статистическая совокупность, из которой часть единиц отбирается для обследования, называется ГЕНЕРАЛЬНОЙ СОВОКУПНОСТЬЮ.
· Некоторая часть единиц, отобранная из генеральной совокупности и подвергающаяся обследованию, называется ВЫБОРОЧНОЙ СОВОКУПНОСТЬЮ (ВЫБОРКОЙ).
Значение выборочного метода состоит в следующем:
1) при минимальной численности обследуемых единиц исследование проводится в более короткие сроки и с минимальными затратами труда и денежных средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации;
2) при проведении ряда исследований выборочный метод является единственно возможным;
3) применяется для проверки данных сплошного учёта.
Выборочный метод имеет важную особенность по сравнению с другими методами несплошного наблюдения: в основу отбора единиц для обследования положен принцип равных возможностей попадания в выборку каждой единицы генеральной совокупности. В результате соблюдения этого принципа исключается возможность образования выборки только за счёт лучших или худших образцов. Это предупреждает возникновение систематических ошибок.
· Поскольку любая статистическая совокупность состоит из единиц с варьирующими признаками, то состав выборочной совокупности может в той или иной мере отличаться от состава генеральной совокупности. Это объективно возникающее расхождение между характеристиками выборки и генеральной совокупности составляет ОШИБКУ ВЫБОРКИ.
Величина ошибки выборки зависит от ряда факторов:
1) степени вариации изучаемого признака;
2) численности выборки;
3) методов отбора единиц в выборочную совокупность;
4) принятого уровня достоверности результата исследования.
ОБЩАЯ ВЕЛИЧИНА ВОЗМОЖНОЙ ОШИБКИ ВЫБОРКИ слагается из ошибок двух видов: ошибки регистрации и ошибки репрезентативности. Первый вид ошибок при выборочном наблюдении практически исключён. Второй вид ошибок присущ только несплошному наблюдению.
Ошибки репрезентативности бывают систематические и случайные.
· СИСТЕМАТИЧЕСКИЕ ОШИБКИ могут возникать в связи с особенностями принятой системы отбора и обработки данных наблюдения, или в связи с нарушениями установленных правил отбора единиц для обследования.
· Возникновение СЛУЧАЙНЫХ ОШИБОК РЕПРЕЗЕНТАТИВНОСТИ объясняется неравномерным распределением единиц в генеральной совокупности. Поэтому распределение отобранной для обследования совокупности единиц (выборки) не вполне точно воспроизводит распределение единиц генеральной совокупности.
Величина ошибки выборки характеризует степень надёжности результатов обследования выборочной совокупности и необходима для оценки параметров генеральной совокупности. Для каждого конкретного выборочного наблюдения величина ошибки выборки может быть определена по соответствующим формулам.
8.2. Основные способы формирования выборочной совокупности
Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности и зависит от степени вариации изучаемого признака в исследуемой совокупности.
В практике выборочных обследований наибольшее распространение получили следующие СПОСОБЫ ФОРМИРОВАНИЯ ВЫБОРКИ.
· СОБСТВЕННО-СЛУЧАЙНАЯ ВЫБОРКА заключается в отборе единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системности. Применяется в случае незначительной вариации изучаемого признака в пределах исследуемой совокупности.
При проведении отбора этим способом следует принять во внимание, что все единицы генеральной совокупности имеют равные шансы попадания в выборку. Следует также установить чёткие границы генеральной совокупности таким образом, чтобы включение или невключение в неё отдельных единиц не вызывало сомнений.
Например, при обследовании студентов, необходимо чётко определиться, будут ли приниматься во внимание лица, находящиеся в академическом отпуске, студенты негосударственных вузов и т. п.
Технически собственно-случайный отбор проводится путём жеребьёвки или с помощью таблиц случайных чисел.
Собственно-случайный отбор может быть как повторным, так и бесповторным (выпавшие жребии обратно в исходную совокупность не возвращаются и в дальнейшем отборе не участвуют).
МЕХАНИЧЕСКАЯ ВЫБОРКА применяется в случаях, когда генеральная совокупность каким-либо образом упорядочена, т. е. имеется определённая последовательность в расположении единиц (например, телефонные номера респондентов, списки избирателей, номера домов, квартир).
Для проведения механической выборки устанавливается пропорция отбора, которая устанавливается соотнесением объёмов выборочной и генеральной совокупности. Например, при пропорции 1:50 (2%-ная выборка) отбирается каждая 50 – я единица; при пропорции 1:20 (5%-ная выборка) – каждая 20 единица и т.д.
ТИПИЧЕСКИЙ ОТБОР используется в тех случаях, когда все единицы генеральной совокупности можно разбить на типические группы; вариация исследуемого признака от группы к группе – значительная.
При обследованиях населения такими группами могу быть, например, районы, социальные, возрастные или образовательные группы; при обследовании предприятий – отрасль и подотрасль, форма собственности и т. д.
Типический отбор предполагает выборку из единиц из каждой типической группы собственно-случайным или механическим способом.
Отбор единиц в типическую выборку может быть организован либо пропорционально объёму типических групп, либо пропорционально внутригрупповой дифференциации признака. При выборке, пропорциональной объёму типических групп, число единиц, подлежащих отбору из каждой группы, определяется следующим образом: ni = n * Ni/N, где ni – объём выборки из i-й группы; Ni – объём i-й группы. n – численность выборочной совокупности.
Отбор, пропорциональный внутригрупповой дифференциации признака, осуществляется на основе использования внутригрупповых дисперсий по каждой типической группе.
СЕРИЙНЫЙ ОТБОР удобен в тех случаях, когда единицы совокупности объединены в небольшие группы или серии.
В качестве таких серий могут рассматриваться упаковки с определённым количеством готовой продукции, партии товара, студенческие группы, бригады и другие объединения.
Сущность серийной выборки заключается в собственно-случайном, либо механическом отборе серий, внутри которых производится сплошное обследование единиц.
КОМБИНИРОВАННЫЙ ОТБОР предполагает применение различных способов формирования выборки в комбинации.
Например, можно комбинировать типическую выборку и серийную: серии отбираются в установленном порядке из нескольких типических групп.
Возможна также комбинация серийного и собственно-случайного отбора: отдельные единицы отбираются внутри серии в собственно-случайном порядке.
8.3. Средняя и предельная ошибки выборки
После проведения отбора для определения возможных границ генеральных характеристик рассчитываются средняя и предельная ошибки выборки.
СРЕДНЯЯ ОШИБКА ВЫБОРКИ показывает величину возможных отклонений характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности.
Ошибки выборки могут быть рассчитаны для среднего значения признака и для доли альтернативного признака (табл.). В математической статистике доказывается, что генеральная средняя будет отличаться от выборочной средней на величину средней ошибки выборки (±m) только в 68,3% случаев. В 95% случаев ошибка выборки не выйдет за пределы ±2m. В 99,7% случаев разность между генеральной и выборочной средней на превзойдёт трёхкратной средней ошибки выборки (±3m) и т.д.
Метод отбора |
Формула для определения средней ошибки выборки |
|
Для средней |
Для доли |
|
Собственно-случайный и механический отбор |
||
Повторный |
||
Бесповторный |
||
Типический отбор |
||
Повторный |
||
Бесповторный |
||
Серийная выборка |
||
Повторный |
, где r – число отобранных серий; R – число серий в генеральной совокупности; — межсерийная дисперсия средних |
, где — межсерийная дисперсия доли |
Бесповторный |
Таким образом, о величине ошибки выборки можно судить с определённой вероятностью, от которой зависит множитель t, называемый коэффициентом доверия.
Логически связь выглядит так: чем больше пределы, в которых допускается возможная ошибка, тем с большей вероятностью судят о её величине.
При заданной вероятности коэффициент доверия t определяют по таблице значений интегральной функции Лапласа j (t).
Величина D = ± tm называется предельной ошибкой выборки.
Зная выборочную среднюю величину признака (долю альтернативного признака в выборочной совокупности) и предельную ошибку выборки (для средней или для доли), можно определить ГРАНИЦЫ, В КОТОРЫХ ЗАКЛЮЧЕНА ГЕНЕРАЛЬНАЯ СРЕДНЯЯ (ГЕНЕРАЛЬНАЯ ДОЛЯ):
для средней или .
для доли или .
8.4 Определение необходимого объёма выборки
При проектировании выборочного наблюдения возникает вопрос о необходимой численности выборки. Эта численность может быть определена на базе допустимой ошибки при выборочном наблюдении исходя из вероятности, с которой гарантируется величина устанавливаемой ошибки, и наконец, на базе способа отбора.
Для определения необходимой численности выборки исследователь должен задать уровень точности характеристики выборочной совокупности с определённой вероятностью.
Необходимый объём выборки для различных способов формирования выборочной совокупности определяется исходя из формул для расчёта предельной ошибки выборки (табл.).
Метод отбора |
Формула для определения необходимой численности выборки |
|
При определении среднего размера признака |
При определении доли признака |
|
Собственно-случайный и механический отбор |
||
Повторный |
||
Бесповторный |
||
Типический отбор |
||
Повторный |
||
Бесповторный |
||
Серийная выборка |
||
Повторный |
||
Бесповторный |
УПРАЖНЕНИЯ
Задача 8.1. В районе А проживает 2500 семей. Для установления среднего числа детей в семье была проведена 2%-ная случайная бесповторная выборка семей, в результате чего были получены следующие данные.
Число детей |
0 |
1 |
2 |
3 |
4 |
5 |
Всего |
Число семей |
10 |
20 |
12 |
4 |
2 |
2 |
50 |
С вероятностью 0,997 определите границы, в которых находится среднее число детей в семье в генеральной совокупности (в районе А). Коэффициент доверия t=2,97.
Задача 8.2. На машиностроительном заводе с численностью рабочих 5000 чел. было проведено 4%-ное выборочное обследование квалификации рабочих методом случайного бесповторного отбора. В результате обследования получены следующие данные:
Квалификация рабочих (тарифный разряд) |
1 |
2 |
3 |
4 |
5 |
6 |
Число рабочих, чел. |
10 |
30 |
40 |
70 |
30 |
20 |
С вероятностью 0,997 определите пределы, в которых находится средний тарифный разряд рабочих завода. Коэффициент доверия t= 2,97.
Задача 8.3. Для изучения производительности труда токарей на машиностроительном заводе было проведено 10%-ное выборочное обследование 100 рабочих методом случайного бесповторного отбора. В результате обследования получены данные о часовой выработке рабочих.
Часовая выработка, шт. |
18 – 20 |
20 – 22 |
22 – 24 |
24 – 26 |
26 – 28 |
28 – 30 |
Число рабочих, чел. |
2 |
8 |
24 |
50 |
12 |
4 |
С вероятностью 0,954 определите пределы, в которых находится средняя выработка одного токаря завода. Коэффициент доверия t=1,99.
Задача 8.4. На предприятии с числом рабочих 2000 чел. было проведено 2%-ное обследование возраста рабочих методом случайного бесповторного отбора. В результате обследования получены следующие данные.
Возраст рабочих, лет |
До 20 |
20 – 30 |
30 – 40 |
40 – 50 |
50 – 60 |
Старше 60 |
Число рабочих |
2 |
18 |
10 |
6 |
3 |
1 |
С вероятностью 0,990 определите пределы, в которых находится средний возраст рабочих предприятия. Коэффициент доверия t=2,58.