ГБОУ ВПО «Казанский государственный медицинский университет» Минздравсоцразвития России
Кафедра общественного здоровья и организации здравоохранения с курсом медицинской информатики
Методы оценки достоверности результатов статистического
исследования
Учебно-методическое пособие для студентов
Казань 2011
Оглавление |
|
Цель занятия …………………………………………………………………………………………… |
3 |
Студент должен уметь …………………………………………………………………………….. |
3 |
Студент должен знать:…………………………………………………………………………….. |
3 |
Информационный материал…………………………………………………………………….. |
4 |
Параметрические методы оценки достоверности …………………………………….. |
4 |
Непараметрические методы оценки достоверности …………………………………. |
4 |
Применение параметрических методов……………………………………………………. |
5 |
Ошибка репрезентативности …………………………………………………………………… |
5 |
Определение доверительных границ средних и относительных величин ….. |
5 |
Оценка достоверности разности результатов исследования ……………………… |
7 |
Типичные ошибки, допускаемые исследователями при применении способа |
|
оценки достоверности разности результатов исследования ……………………… |
9 |
Контрольные вопросы: ……………………………………………………………………………. |
9 |
Тестовые задания: …………………………………………………………………………………. |
10 |
Контрольные задания ……………………………………………………………………………. |
11 |
Хронология занятия
1.Формулировка и обоснования цели занятия (10 мин.);
2.Изложение основных вопросов темы (60 мин.);
3.Перерыв (20 мин.)
4.Самостоятельная работа студентов с методическим материалом — (30 мин.)
5.Разбор типовых задач по изучаемой теме (20 мин.)
6.Самостоятельное решение задач (40 мин.)
7.Тестовый контроль на ПК (15 мин.)
8.Общая продолжительность занятия – 195 минут.
Тема занятия
Параметрические методы оценки достоверности результатов статистического исследования: определение ошибок репрезентативности, доверительных границ, оценка достоверности разности результатов статистического исследования по критерию Стьюдента. Использование MS Excel при оценке достоверности статистических показателей.
Цель занятия
на основе применения метода оценки достоверности результатов исследования уметь перенести результаты выборочного исследования общественного здоровья, деятельности врачей и учреждений здравоохранения на генеральную совокупность.
Студент должен уметь
—определять достоверность результатов исследования с помощью ошибки репрезентативности интенсивного показателя и средней величины;
—определять доверительные границы средних и относительных вели-
чин,
—определять достоверность разности между двумя средними величинами, относительными показателями;
—выбирать способ оценки достоверности результатов исследования при решении ситуационной задачи, определять достоверность и делать соответствующие выводы.
Студент должен знать:
—определение «достоверность результатов исследования»;
—параметрические и непараметрические способы оценки достоверности результатов исследования;
—условия применения параметрического и непараметрических способов оценки достоверности результатов исследования;
—определение ошибки репрезентативности средней величины и интенсивного показателя, ее вычисление;
—понятие о критерии «t», его выбор в способе определения доверительных границ и оценку в способе достоверности разности результатов исследования.
Место проведения: аудитория кафедры общественного здоровья и организации здравоохранения с курсом медицинской информатики, дисплейный класс.
Оснащение занятия
Мультимедийный проектор Ноутбук
Наглядный материал в виде мультимедийной презентации Персональный компьютер
Информационный материал
В практической и научно-практической работе врачи обобщают результаты, полученные как правило на выборочных совокупностях. Для более широкого распространения и применения, полученных при изучении репрезентативной выборочной совокупности данных и выводов надо уметь по части явления судить о явлении и его закономерностях в целом.
Учитывая, что врачи, как правило, проводят исследования на выборочных совокупностях, теория статистики позволяет с помощью математического аппарата (формул) переносить данные с выборочного исследования на генеральную совокупность. При этом врач должен уметь не только воспользоваться математической формулой, но сделать вывод, соответствующий каждому способу оценки достоверности полученных данных. С этой целью врач должен знать способы оценки достоверности.
Применяя метод оценки достоверности результатов исследования для изучения общественного здоровья и деятельности учреждений здравоохранения, а также в своей научной деятельности, исследователь должен уметь правильно выбрать способ данного метода. Среди методов оценки достоверности различают параметрические и непараметрические.
Параметрические методы оценки достоверности
называют количественные методы статистической обработки данных, применение которых требует обязательного знания закона распределения изучаемых признаков в совокупности и вычисления их основных параметров.
Непараметрические методы оценки достоверности
являются количественные методы статистической обработки данных, применение которых не требует знания закона распределения изучаемых признаков в совокупности и вычисления их основных параметров.
Как параметрические, так и непараметрические методы, используемые для сравнения результатов исследований, т.е. для сравнения выборочных совокупностей, заключаются в применении определенных формул и расчете определенных показателей в соответствии с предписанными алгоритмами. В конечном результате высчитывается определенная числовая величина, которую сравнивают с табличными пороговыми значениями. Критерием достоверности будет результат сравнения полученной величины и табличного значения при данном числе наблюдений (или степеней свободы) и при заданном уровне безошибочного прогноза.
Таким образом, в статистической процедуре оценки основное значение имеет полученный критерий достоверности, поэтому сам способ оценки дос-
товерности в целом иногда называют тем или иным критерием по фамилии автора, предложившего его в качестве основы метода.
Применение параметрических методов
При проведении выборочных исследований полученный результат не обязательно совпадает с результатом, который мог бы быть получен при исследовании всей генеральной совокупности. Между этими величинами существует определенная разница, называемая ошибкой репрезентативности, т.е. это погрешность, обусловленная переносом результатов выборочного исследования на всю генеральную совокупность.
Ошибка репрезентативности
Средняя ошибка средней |
где σ — среднеквадра- |
арифметической величины опреде- |
тическое отклонение |
ляется по формуле: |
n — число наблюдений |
Ошибка относительного пока- |
где p — показатель, вы- |
зателя определяется по формуле: |
раженный в %, ‰, %оо и т.д. |
q = (100 — р), при p выраженном |
|
в %; |
|
или (1000 — р), при p выражен- |
|
ном в ‰ |
|
или (10000 — р), при p выра- |
|
женном в %оо и т.д. |
При числе наблюдений меньше 30 ошибки репрезентативности определяются соответственно по формулам:
Определение доверительных границ средних и относительных величин
Формулы определения доверительных границ представлены следующим образом:
для средних величин (М): Мген = Мвыб ± tm
для относительных показателей (Р): Рген = Рвыб ± tm
где Мген и Рген — соответственно, значения средней величины и относительного показателя генеральной совокупности;
Мвы6 и Рвы6 — значения средней величины и относительного показателя выборочной совокупности;
m — ошибка репрезентативности;
t — критерий достоверности (доверительный коэффициент).
Данный способ применяется в тех случаях, когда по результатам выборочной совокупности необходимо судить о размерах изучаемого явления (или признака) в генеральной совокупности.
Обязательным условием для применения способа является репрезентативность выборочной совокупности. Для переноса результатов, полученных при выборочных исследованиях, на генеральную совокупность необходима степень вероятности безошибочного прогноза (Р), показывающая, в каком
проценте случаев результаты выборочных исследований по изучаемому признаку (явлению) будут иметь место в генеральной совокупности.
При определении доверительных границ средней величины или относительного показателя генеральной совокупности, исследователь сам задает определенную (необходимую) степень вероятности безошибочного прогноза
(Р).
Для большинства медико-биологических исследований считается достаточной степень вероятности безошибочного прогноза, равная 95%, а число случаев генеральной совокупности, в котором могут наблюдаться отклонения от закономерностей, установленных при выборочном исследовании, не будут превышать 5%. При ряде исследований, связанных, например, с применением высокотоксичных веществ, вакцин, оперативного лечения и т.п., в результате чего возможны тяжелые заболевания, осложнения, летальные исходы, применяется степень вероятности Р = 99,7%, т.е. не более чем у 1% случаев генеральной совокупности возможны отклонения от закономерностей, установленных в выборочной совокупности.
Заданной степени вероятности (Р) безошибочного прогноза соответствует определенное, подставляемое в формулу, значение критерия t, зависящее также и от числа наблюдений.
При n>30 степени вероятности безошибочного прогноза Р = 99,7% — соответствует значение t = 3, а при Р = 95,5% — значение t = 2.
При п<30 величина t при соответствующей степени вероятности безошибочного прогноза определяется по специальной таблице (Н.А. Плохинского).
Задача — эталон
на определение ошибок репрезентативности (m) и доверительных границ средней величины генеральной совокупности (Мген) при числе наблюдений больше 30
Условие задачи: при изучении комбинированного воздействия шума и низкочастотной вибрации на организм человека было установлено, что средняя частота пульса у 36 обследованных водителей сельскохозяйственных машин через 1 ч работы составила 80 ударов в 1 минуту; σ = ± 6 ударов в минуту.
Задание: определить ошибку репрезентативности (mM) и доверительные границы средней величины генеральной совокупности (Мген).
Решение.
1.Вычисление средней ошибки средней арифметической (ошибки репрезентативности) (m):
m = σ / √n = 6 / √36 = ±1 удар в минуту
2.Вычисление доверительных границ средней величины генераль-
ной совокупности (Мген). Для этого необходимо:
o а) задать степень вероятности безошибочного прогноза (Р = 95
%);
o б) определить величину критерия t. При заданной степени вероятности (Р=95%) и числе наблюдений меньше 30 величина критерия t, опре-
деляемого по таблице, равна 2 (t = 2). Тогда Мген = Мвыб ± tm = 80 ± 2×1 = 80 ± 2 удара в минуту.
Вывод. Установлено с вероятностью безошибочного прогноза Р = 95%, что средняя частота пульса в генеральной совокупности, т.е. у всех водителей сельскохозяйственных машин, через 1 ч работы в аналогичных условиях будет находиться в пределах от 78 до 82 ударов в минуту, т.е. средняя частота пульса менее 78 и более 82 ударов в минуту возможна не более, чем у 5% случаев генеральной совокупности.
Задача — эталон
на определение ошибок репрезентативности (m) и доверительных границ относительного показателя генеральной совокупности (Рген)
Условие задачи: при медицинском осмотре 164 детей 3 летнего возраста, проживающих в одном из районов городе Н., в 18% случаев обнаружено нарушение осанки функционального характера.
Задание: определить ошибку репрезентативности (mp) и доверительные границы относительного показателя генеральной совокупности (Рген).
Решение.
1.Вычисление ошибки репрезентативности относительного
показателя:
m = √P x q / n = √18 x (100 — 18) / 164 = ± 3%
2.Вычисление доверительных границ средней величины генеральной совокупности (Рген) производится следующим образом:
o необходимо задать степень вероятности безошибочного прогноза (Р=95%);
o при заданной степени вероятности и числе наблюдений больше 30, величина критерия t равна 2 (t = 2). Тогда Рген =
Рвыб± tm = 18% ± 2 х 3 = 18% ± 6%.
Вывод. Установлено с вероятностью безошибочного прогноза Р=95%, что частота нарушения осанки функционального характера у детей 3 летнего возраста, проживающих в городе Н., будет находиться в пределах от 12 до 24% случаев.
Оценка достоверности разности результатов исследования
Данный способ применяется в тех случаях, когда необходимо определить, случайны или достоверны (существенны), т.е. обусловлены какой-то причиной, различия между двумя средними величинами или относительными показателями.
Обязательным условием для применения данного способа является репрезентативность выборочных совокупностей, а также наличие причинноследственной связи между сравниваемыми величинами (показателями) и факторами, влияющими на них.
Формулы определения достоверности разности представлены следующим образом:
для средних величин
для относительных показателей
где t — критерий достоверности, m1 и m2 — ошибки репрезентативности, М1 и М2 — средние величины, Р1 и Р2 — относительные показатели.
Если вычисленный критерий t более или равен 2 (t ≥ 2), что соответствует вероятности безошибочного прогноза Р равном или более 95% (Р ≥ 95%), то разность следует считать достоверной (существенной), т.е. обусловленной влиянием какого-то фактора, что будет иметь место и в генеральной совокупности.
При t < 2, вероятность безошибочного прогноза Р < 95%, это означает, что разность недостоверна, случайна, т.е. не обусловлена какой-то закономерностью (не обусловлена влиянием какого-то фактора).
Поэтому полученный критерий должен всегда оцениваться по от-
ношению к конкретной цели исследования.
Задача — эталон
на оценку достоверности разности средних величин
Условие задачи: при изучении комбинированного воздействия шума и низкочастотной вибрации на организм человека было установлено, что средняя частота пульса у водителей сельскохозяйственных машин через 1 ч после начала работы составила 80 ударов в минуту; m = ± 1 удар в мин. Средняя частота пульса у этой же группы водителей до начала работы равнялась 75 ударам в минуту; m = ± 1 удар в минуту.
Задание: оценить достоверность различий средних значений пульса у водителей сельскохозяйственных машин до и после 1 ч работы.
Решение.
Вывод. Значение критерия t = 3,5 соответствует вероятности безошибочного прогноза Р > 99,7%, следовательно можно утверждать, что различия в средних значениях пульса у водителей сельскохозяйственных машин до и после 1 ч работы не случайно, а достоверно, существенно, т.е. обусловлено влиянием воздействия шума и низкочастотной вибрации.
Задача — эталон
на оценку достоверности разности относительных показателей
Условие задачи: при медицинском осмотре детей 3 летнего возраста в 18% (m = ± 3%) случаях обнаружено нарушение осанки функционального характера. Частота аналогичных нарушений осанки при медосмотре детей 4- летнего возраста составила 24% (m = ± 2,64%).
В практической и научно-практической работе
врачи обобщают результаты, полученные как правило на выборочных
совокупностях.
Для более широкого распространения и применения полученных при изучении
репрезентативной выборочной совокупности данных и выводов
надо уметь по части явления судить о явлении и его закономерностях в
целом.
Учитывая, что врачи, как правило, проводят исследования на
выборочных совокупностях, теория статистики позволяет с помощью
математического аппарата (формул) переносить данные с выборочного
исследования на генеральную совокупность. При этом врач должен
уметь не только воспользоваться математической формулой, но сделать
вывод, соответствующий каждому способу оценки достоверности
полученных данных. С этой целью врач должен знать способы оценки
достоверности.
Применяя метод оценки достоверности результатов исследования для изучения общественного здоровья и деятельности учреждений
здравоохранения, а также в своей научной деятельности, исследователь должен уметь правильно выбрать способ данного метода.
Среди методов оценки достоверности различают параметрические и непараметрические.
Параметрическими называют количественные методы статистической обработки данных, применение которых требует обязательного
знания закона распределения изучаемых признаков в совокупности и вычисления их основных параметров.
Непараметрическими являются количественные методы статистической обработки данных, применение которых не требует знания
закона распределения изучаемых признаков в совокупности и вычисления их основных параметров.
Как параметрические, так и непараметрические методы, используемые
для сравнения результатов исследований, т.е. для сравнения
выборочных совокупностей, заключаются в применении определенных формул и
расчете определенных показателей в соответствии с
предписанными алгоритмами. В конечном результате высчитывается
определенная числовая величина, которую сравнивают с табличными
пороговыми значениями. Критерием достоверности будет результат сравнения
полученной величины и табличного значения при данном числе
наблюдений (или степеней свободы) и при заданном уровне безошибочного
прогноза.
Таким образом, в статистической процедуре оценки основное
значение имеет полученный критерий достоверности, поэтому сам способ
оценки достоверности в целом иногда называют тем или иным критерием по
фамилии автора, предложившего его в качестве основы метода.
Применение параметрических методов
При проведении выборочных исследований полученный результат не обязательно совпадает с результатом, который мог бы быть получен
при исследовании всей генеральной совокупности. Между этими величинами существует определенная разница, называемая ошибкой
репрезентативности, т.е. это погрешность, обусловленная переносом результатов выборочного исследования на всю генеральную
совокупность.
Определение доверительных границ средних
и относительных величин
Формулы определения доверительных границ представлены следующим образом:
- для средних величин (М): Мген = Мвыб ± tm
- для относительных показателей (Р): Рген = Рвыб ± tm
где Мген и Рген — соответственно, значения средней величины и относительного показателя генеральной
совокупности;
Мвы6 и Рвы6 — значения средней величины и относительного показателя выборочной совокупности;
m — ошибка репрезентативности;
t — критерий достоверности (доверительный коэффициент).
Данный способ применяется в тех случаях, когда по результатам выборочной совокупности необходимо судить о размерах изучаемого
явления (или признака) в генеральной совокупности.
Обязательным условием для применения способа является репрезентативность выборочной совокупности. Для переноса результатов,
полученных при выборочных исследованиях, на генеральную совокупность необходима степень вероятности безошибочного прогноза (Р),
показывающая, в каком проценте случаев результаты выборочных исследований по изучаемому признаку (явлению) будут иметь место в
генеральной совокупности.
При определении доверительных границ средней величины или относительного показателя генеральной совокупности, исследователь сам
задает определенную (необходимую) степень вероятности безошибочного прогноза (Р).
Для большинства медико-биологических исследований считается
достаточной степень вероятности безошибочного прогноза, равная 95%,
а число случаев генеральной совокупности, в котором могут наблюдаться
отклонения от закономерностей, установленных при выборочном
исследовании, не будут превышать 5%. При ряде исследований, связанных,
например, с применением высокотоксичных веществ, вакцин,
оперативного лечения и т.п., в результате чего возможны тяжелые
заболевания, осложнения, летальные исходы, применяется степень
вероятности Р = 99,7%, т.е. не более чем у 1% случаев генеральной
совокупности возможны отклонения от закономерностей,
установленных в выборочной совокупности.
Заданной степени вероятности (Р) безошибочного прогноза соответствует определенное, подставляемое в формулу, значение критерия
t, зависящее также и от числа наблюдений.
При n>30 степени вероятности безошибочного прогноза Р = 99,7% — соответствует значение t = 3, а при Р = 95,5% — значение
t = 2.
При п<30 величина t при соответствующей степени вероятности безошибочного прогноза определяется по специальной таблице
(Н.А. Плохинского).
на определение ошибок репрезентативности (m) и доверительных границ средней величины генеральной совокупности (Мген)
при числе наблюдений больше 30
Условие задачи: при изучении комбинированного воздействия шума и низкочастотной вибрации на организм человека было
установлено, что средняя частота пульса у 36 обследованных водителей сельскохозяйственных машин через 1 ч работы составила 80
ударов в 1 минуту; σ = ± 6 ударов в минуту.
Задание: определить ошибку репрезентативности (mM) и доверительные границы средней величины генеральной
совокупности (Мген).
Решение.
- Вычисление средней ошибки средней арифметической (ошибки репрезентативности) (m):
m = σ / √n =
6 / √36 =
±1 удар в минуту - Вычисление доверительных границ средней величины генеральной совокупности (Мген). Для этого необходимо:
- а) задать степень вероятности безошибочного прогноза (Р = 95 %);
- б) определить величину критерия t. При заданной степени вероятности (Р=95%) и числе наблюдений меньше 30 величина критерия t,
определяемого по таблице, равна 2 (t = 2). Тогда Мген = Мвыб ± tm = 80 ± 2×1 = 80 ± 2
удара в минуту.
Вывод. Установлено с вероятностью безошибочного прогноза Р =
95%, что средняя частота пульса в генеральной совокупности,
т.е. у всех водителей сельскохозяйственных машин, через 1 ч работы в
аналогичных условиях будет находиться в пределах от 78 до 82
ударов в минуту, т.е. средняя частота пульса менее 78 и более 82 ударов в
минуту возможна не более, чем у 5% случаев генеральной
совокупности.
на определение ошибок репрезентативности (m) и доверительных границ относительного показателя генеральной совокупности
(Рген)
Условие задачи: при медицинском осмотре 164 детей 3 летнего возраста, проживающих в одном из районов городе Н., в 18%
случаев обнаружено нарушение осанки функционального характера.
Задание: определить ошибку репрезентативности (mp) и доверительные границы относительного показателя
генеральной совокупности (Рген).
Решение.
- Вычисление ошибки репрезентативности относительного показателя:
m = √P x q / n =
√18 x (100 — 18) / 164 =
± 3% - Вычисление доверительных границ средней величины генеральной совокупности (Рген) производится следующим образом:
- необходимо задать степень вероятности безошибочного прогноза (Р=95%);
- при заданной степени вероятности и числе наблюдений больше 30, величина критерия t равна 2 (t = 2).
Тогда Рген = Рвыб± tm = 18% ± 2 х 3 = 18% ± 6%.
Вывод. Установлено с вероятностью безошибочного прогноза Р=95%, что частота нарушения осанки функционального характера у
детей 3 летнего возраста, проживающих в городе Н., будет находиться в пределах от 12 до 24% случаев.
Оценка достоверности разности результатов исследования
Данный способ применяется в тех случаях, когда необходимо определить, случайны или достоверны (существенны), т.е. обусловлены
какой-то причиной, различия между двумя средними величинами или относительными показателями.
Обязательным условием для применения данного способа является репрезентативность выборочных совокупностей, а также наличие
причинно-следственной связи между сравниваемыми величинами (показателями) и факторами, влияющими на них.
Формулы определения достоверности разности представлены следующим образом:
Если вычисленный критерий t более или равен 2 (t ≥ 2), что соответствует вероятности безошибочного прогноза Р равном или
более 95% (Р ≥ 95%), то разность следует считать достоверной (существенной), т.е. обусловленной влиянием какого-то фактора, что
будет иметь место и в генеральной совокупности.
При t < 2, вероятность безошибочного прогноза Р < 95%, это означает, что разность недостоверна, случайна, т.е. не
обусловлена какой-то закономерностью (не обусловлена влиянием какого-то фактора).
Поэтому полученный критерий должен всегда оцениваться по отношению к конкретной цели исследования.
на оценку достоверности разности средних величин
Условие задачи: при изучении комбинированного воздействия шума
и низкочастотной вибрации на организм человека было
установлено, что средняя частота пульса у водителей сельскохозяйственных
машин через 1 ч после начала работы составила 80 ударов в
минуту; m = ± 1 удар в мин. Средняя частота пульса у этой же группы
водителей до начала работы равнялась 75 ударам в минуту;
m = ± 1 удар в минуту.
Задание: оценить достоверность различий средних значений пульса у водителей сельскохозяйственных машин до и после 1 ч
работы.
Решение.
Вывод. Значение критерия t = 3,5 соответствует вероятности безошибочного прогноза Р > 99,7%, следовательно можно
утверждать, что различия в средних значениях пульса у водителей сельскохозяйственных машин до и после 1 ч работы не случайно, а
достоверно, существенно, т.е. обусловлено влиянием воздействия шума и низкочастотной вибрации.
на оценку достоверности разности относительных показателей
Условие задачи: при медицинском осмотре детей 3 летнего возраста в 18% (m = ± 3%) случаях обнаружено нарушение
осанки функционального характера. Частота аналогичных нарушений осанки при медосмотре детей 4-летнего возраста составила 24%
(m = ± 2,64%).
Задание: оценить достоверность различий в частоте нарушения осанки у детей 2 возрастных групп.
Решение.
Вывод. Значение критерия t=1,5 соответствует вероятности безошибочного прогноза Р<95%. Следовательно, различие в
частоте нарушений осанки среди детей, сравниваемых возрастных групп случайно, недостоверно, несущественно, т.е. не обусловлено
влиянием возраста детей.
Типичные ошибки, допускаемые исследователями при
применении способа оценки достоверности разности результатов исследования
- При оценке достоверности разности результатов исследования по критерию t часто делается вывод о достоверности (или
недостоверности) самих результатов исследования. В действительности же этот способ позволяет судить только о достоверности
(существенности) или случайности различий между результатами исследования. - При полученном значении критерия t<2 часто делается вывод о необходимости увеличения числа наблюдений. Если же
выборочные совокупности репрезентативны, то нельзя делать вывод о необходимости увеличения числа наблюдений, т.к. в данном
случае значение критерия t<2 свидетельствует о случайности, недостоверности различия между двумя сравниваемыми результатами
исследования.
Применение методов статистического анализа для изучения общественного здоровья и здравоохранения.
Под ред. чл.-корр. РАМН, проф. В.З.Кучеренко. М., «Гэотар-Медиа», 2007, учебное пособие для вузов
- Власов В.В. Эпидемиология. — М.: ГЭОТАР-МЕД, 2004. — 464 с.
- Лисицын Ю.П. Общественное здоровье и здравоохранение. Учебник для вузов. — М.: ГЭОТАР-МЕД, 2007. — 512 с.
- Медик В.А., Юрьев В.К. Курс лекций по общественному здоровью
и здравоохранению: Часть 1. Общественное здоровье. — М.: Медицина,
2003. — 368 с. - Миняев В.А., Вишняков Н.И. и др. Социальная медицина и организация здравоохранения (Руководство в 2 томах). — СПб, 1998. -528 с.
- Кучеренко В.З., Агарков Н.М. и др.Социальная гигиена и организация здравоохранения (Учебное пособие) — Москва, 2000. — 432 с.
- С. Гланц. Медико-биологическая статистика. Пер с англ. — М., Практика, 1998. — 459 с.
Выполнение любого исследования сопровождается различными нюансами, сложностями, порождающими небольшую погрешность. Несмотря на это, каждый исследователь стремится получить максимально точные и надежные результаты научной работы. Но чтобы обосновать свою позицию и правоту, доказать состоятельность выдвинутой гипотезы, важно убедиться в качестве и достоверности изыскания. В этом деле на помощь приходит статистическая оценка достоверности НИР.
Что это такое?
Статистическое подтверждение достоверности исследования представляет собой «проверочный этап», призванный убедиться в корректности и правильности полученных результатов, возможности их дальнейшего применения. Как уже стало ясно из определения, он реализуется после проведения изыскания и получения конкретных финальных данных.
Для начала давайте разберемся с такими важными понятиями, как достоверность и обоснованность. Указанные категории взаимосвязаны и важны для каждого автора. Под достоверностью следует понимать степень соответствия полученных результатов с действительностью, реальными условиями и параметрами. То есть это то самое сравнение «ощущение и реальность», но в научном русле.
Обоснованность исследования предполагает наличие четкой и точной доказательной базы, подчеркивающей конкретную тенденцию или симптоматику.
Оценка достоверности научной работы предполагает определение перспектив и ответ на такие вопросы, как:
- Насколько точны результаты исследования?
- Можно ли полагаться на них в перспективе, как и где применять?
- Можно ли расширить «спектр действия» полученных результатов, то есть расширить масштабы результативности с рассмотренной узкой плоскости на более значимую выборку или всю совокупность в целом?
Таким образом, показатель достоверности позволяет судить о корректности реализованной научной работы и возможности применения полученных результатов в дальнейшем. Миссия столь важного этапа состоит в определении следующего момента: возможно ли судить по части исследования (выборке) о всем явлении в целом?
Возникли сложности?
Нужна помощь преподавателя?
Мы всегда рады Вам помочь!
Проверка НИР на достоверность позволяет автору убедиться в отсутствии грубейших ошибок и нарушений существующих научных канонов, норм и минимизировать риск дальнейших ошибок и сомнений. Чем выше уровень достоверности, тем выше качество проекта и степень компетентности исследователя.
Среди ключевых признаков достоверности научного исследования (и его результатов) можно отметить:
- Полученные результаты должны быть сугубо однозначными и обоснованными с научной точки зрения;
- Итоги научной работы должны оценить конкретную проблему и тему, т есть соответствовать критериям валидности и адекватности, целенаправленности;
- Результаты исследования должны быть нейтральными и оценивать явление с одного ракурса, позиции , при одинаковых или максимально схожих условиях (для большей точности и убедительности);
- Итоги научной мысли должны полностью охватывать все намеченные задачи и наиболее важные характеристики, соответствовать научному аппарату и в целом изучаемому процессу.
Таким образом, достоверность результатов научной работы проявляется в таких принципах, как точность, актуальность, целенаправленность и однозначность (однонаправленность).
Способы проверки достоверности исследования
Оценить степень достоверности научной работы не так просто. Существуем масса вариантов для проведения столь важной проверки. Студенты чаще всего прибегают к следующим видам:
- Сравнительный или содержательный анализ. В данном случае автору или эксперту предстоит внимательно изучить текст научной работы и констатировать значимые показатели, тенденции, а затем сравнить с аналогичными исследованиями. Согласитесь, если суждение верно или наблюдается од на и та же проблема-тенденция, то и результаты будут как минимум схожими, очерчивать тот же характер. В данном случае на выручку исследователю приходят актуальные аналогичные изыскания, реализованные иными авторами, то есть достаточно оценить степень разработанности тем, сопоставить результаты и понять: чем отличаются проекты, в чем их сходства, о чем свидетельствуют общие результаты (тенденция и пр.).
Обратите внимание, что точных совпадений в целом быть не должно. Главное, чтобы совпадали общие моменты, тенденции, характер доказательной базы и изменений и пр. Но даже если некоторые моменты кардинально разнятся, это не означает, что что-то выполнено неверно. Важно взять данный момент на заметку и учесть в дальнейшем;
- Аналитический метод. В данном случае автор исследования или квалифицированный эксперт анализирует полученные результаты и сравнивает их с общепринятыми нормами, устоявшимися научными фактами и законами, отраслевыми показателями и правовыми регламентами, результатами аналогичных исследований и пр. Чем больше совпадений (по характеру), тем выше точность итогов.
- Апробация результатов. Данный прием считается самым надежным и достоверным, позволяющим оценить полученные результаты, рекомендации и выводы на практике. В данном случае предстоит провести повторно эксперимент или проследовать по описанному автором пути и сравнить полученные результаты, а заодно оценить посильность, корректность и достоверность исследования;
- Статистическая проверка данных. Данный метод предполагает проведение ряда математических операций с целью определения наличия отклонений, наличие случайных моментов и отклонений, стабильных показателей и пр. О данной комбинации приемов мы поговорим подробнее.
Последняя группа методов по проверке результатов научного исследования на достоверность в целом может заменить (по роли и значимости, корректности и объективности) апробация результатов. Предлагаем рассмотреть ее детальнее.
Возникли сложности?
Нужна помощь преподавателя?
Мы всегда рады Вам помочь!
Специфика статистической оценки достоверности результатов научно-исследовательской работы
Статистические приемы по проверке результатов НИР на объективность, обоснованность и достоверность применимы преимущественно к прикладным изысканиям. Также допустимо использовать их в отношении тех проектов которые можно преобразовать в математическую, статистическую или иную числовую модель, то есть оценить с количественной стороны посредством применения простейших математических операций, специальных методик и формул.
Статистические методы по проверке достоверности результатов НИР применимы преимущественно к прикладным или экспериментальным изысканиям, где явление или проблема оценивалась в рамках конкретной выборки. Чтобы распространить действие полученного результата на «проблему в целом» (то есть вынести за пределы выборки), важно убедиться в достоверности итогов (то есть совпадении данных с реальностью).
На практике применяют два вида статистической оценки достоверности изыскания: параметрические и непараметрические. К первой группе относят специфические приемы, основанные на законах распределения и предполагают изучение всего механизма в целом с выделением основных признаков из общей совокупности. Ко второй – методы, не требующие понимания и владения законом распределения. То есть ключевое отличие между данными приемами будут формулы и порядок расчета, учета отдельных показателей. Без математических и статистических подходов в этом деле не обойтись.
Применение параметрических и непараметрических методов статистической оценки достоверности исследования предполагает расчет определенных показателей и выведение единого (самого важного) коэффициента, который будет сравниваться с существующими нормами. Если итоговое значение выпадает на «допустимый диапазон», где отклонение незначительно, то НИР считается достоверной.
Основные параметрические показатели, необходимые для оценки достоверности исследования
На практике действует два основных параметра, позволяющих определить возможности использования результаты реализованного исследования. К ним относят среднее значение и дисперсию. Именно эти показатели лежат в основе самых популярных и признанных среди исследователей методик, о которых мы писали ранее: критерий Стьюдента и критерий Фишера.
Оценивание достоверности исследования на базе указанных подходов основывается на таких показателях, как:
- Средние ошибки средних арифметических и относительных величин (ошибка репрезентативности). Данный показатель позволяет установить тот самый промежуток действия результатов при заданном количестве наблюдений. Этот параметр всегда точен и способствует установлению конкретных границ для переноса частных результатов на всю совокупность в целом. Показатель рассчитывается в тех случаях, когда проблема оценивалась по частям, а для общей оценки необходимо убедиться в корректности и достоверности итогов, их общего действия. С помощью ошибок репрезентативности можно установить, на сколько отличаются результаты выборочного исследования от результатов, полученных при реализации сплошного изыскания.
- Оценка достоверности разности результатов исследования. Данный подход уместен при оценке возникновения проблемного фактора: результаты случайны или достоверны. В это деле на подмогу приходит сравнение средних и относительных показателей. Для использования данного приема важно соблюдение конкретных условий: выборка должна быть репрезентативной, наличие причинно-следственных связей между основными сравниваемыми данными, понимание провоцирующих изменения факторов.
Возникли сложности?
Нужна помощь преподавателя?
Мы всегда рады Вам помочь!
Непараметрические подходы к оценке достоверности результатов исследования
Непараметрические критерии действуют в отношении таких ситуаций, когда исследователь не имеет четких представлений или фактов относительно изучаемого явления, проблемы. В данном случае не требуется расчет средних или стандартных отклонений для описания исследуемого явления или величины.
Непараметрические методики применимы в отношении исследований, где действует небольшая выборка и нет четких данных в отношении изучаемой проблемы. Для использования данной группы приемов полагаются на следующий принцип: в отношении любого параметрического критерия можно подобрать аналогичный непараметрический аналог, который будет относиться к одной из категорий:
- Критерии различия между независимыми выборками. В этом случае уместны описанные нами ранее U-методика Манна-Уитни, критерий Краскела-Уоллиса, тест Спирмена и пр.;
- Критерии различия между зависимыми выборками. Наиболее популярными подходами данного плана выступают критерий Вилкоксона, анализ Фридмана, Q-критерий Кохрена и пр.
Как выбрать статистический способ проверки достоверности результатов исследования: параметрический или непараметрический?
Непараметрические приемы по оценке степени достоверности результатов научного исследования применимы лишь к тем работам, где исследуется небольшая по численности выборка. Если исследуется большая совокупность данных и критериев, то подключают параметрические методики (считающиеся более обоснованными и точными).
Параметрические подходы предполагают установление конкретных границ и точек соприкосновения, зависимостей. Поэтому здесь преобладают более точные расчеты, необходимо соблюдение конкретных правил и законов и пр. Все это требуется для проверки конкретной гипотезы или предположений о характере или особенностях распределения полученных данных.
В любом случае применение статистической оценки результатов исследования будет основываться на проведении конкретных математических расчетов и аналитических операций, сопоставлений, владении научными канонами, критическом мышлении автора и его представлениями по теме (как он ее понимает и видит). Притом изобретать велосипед для перепроверки итогов НИР не потребуется: достаточно лишь воспользоваться уже ранее утвержденным алгоритмом, грамотно подставив в него имеющиеся параметры и сравнив их с измерительной шкалой.
Как обеспечить достоверность проводимого исследования?
Статистические способы проверки достоверности результатов исследования считаются одними из точных. Но чтобы повысить эффективность проводимого изыскания и расширить спектр применения полученных итогов можно позаботиться об обеспечении достоверности НИР следующим образом:
- Важно установить четкие границы исследования и утвердить максимально точный научный аппарат: что автор будет исследовать, какие факторы учитывать, по возможности конкретизировать все нюансы;
- Подходить к подбору данных с максимальной ответственностью и вниманием: учитывать научные законы и ограничения, возможности и особенности объекта, обосновывать каждый шаг и пр.;
- В идеале исследователю следует полагаться только на апробированный материал, то есть не просто данные полученные в ходе первичного эксперимента. Чтобы исследование было более точным и достоверным, следует убедиться в корректности и эффективности итогов. Нередко в этом случае приходится пользоваться повторным проведением эксперимента или апробацией (для сопоставления итогов и анализа данных, определения погрешностей, общего направления и характера результатов и пр.);
- Важно грамотно сочетать теоретические моменты и категории с программой исследования, в ходе реализации эксперимента. Для этого автору НИР предстоит разобраться в правилах, терминах, научных законах и подходах, а затем на основе располагаемых данных (относительно выборки или исследуемом объекте) правильно использовать их. То есть еще на начальном этапе (в ходе планирования исследования) важно уточнить уместность, целесообразность и посильность намеченного подхода, пути.
В целом, при проведении научных исследований экспериментального характера важно убедиться в правильности суждений, точности полученных результатов и возможностей их применения в перспективе. В этом деле на помощь приходит классический принцип «доверяй, но проверяй» на основе математических и статистических моделей.
Применение методов статистической оценки достоверности НИР основывается математических (порой сложных) операциях: расчеты в рамках конкретных формул, корреляция, дисперсия, разница величин (относительных и абсолютных) и пр. Чтобы успешно ими пользоваться, автору изыскания важно владеть основными категориями и понятиями, хорошо знать математические законы и быть предельно внимательным (во избежание банальных «расчетных» ошибок).
Статистическая оценка достоверности результатов исследования позволяет перепроверить и обосновать авторскую позицию, повысить точность полученных итогов, сделать проект более аргументированным и приближенным к реалиям, определить возможности использования полученных итогов в больших масштабах или иных сферах деятельности. При проведении подобной поверки важно учитывать все нюансы, характер изыскания и располагаемые автором данные, их достаточность и надежность.
В
статистике выделяют два основных метода
исследования — сплошной и выборочный.
При проведении выборочного исследования
обязательным является соблюдение
следующих требований: репрезентативность
выборочной совокупности и достаточное
число единиц наблюдений. При выборе
единиц наблюдения возможны ошибки
смещения,
т.е. такие события, появление которых
не может быть точно предсказуемым. Эти
ошибки являются объективными и
закономерными. При определении степени
точности выборочного исследования
оценивается величина ошибки, которая
может произойти в процессе выборки
— случайная
ошибка репрезентативности (m)
— является
фактической разностью между средними
или относительными величинами, полученными
при проведении выборочного исследования
и аналогичными величинами, которые были
бы получены при проведении исследования
на генеральной совокупности.
Оценка
достоверности результатов исследования
предусматривает определение:
1.
ошибки репрезентативности
2.
доверительных границ средних (или
относительных) величин в генеральной
совокупности
3.
достоверности разности средних (или
относительных) величин (по критерию t)
Расчет
ошибки репрезентативности
(mм)
средней арифметической величины
(М):
,
где σ
— среднее квадратическое отклонение; n
— численность выборки (>30).
Расчет
ошибки репрезентативности (mР)
относительной величины (Р):
,
где Р — соответствующая относительная
величина (рассчитанная, например, в %);
q
=100 — Ρ%
— величина, обратная Р; n
— численность выборки (n>30)
В
клинических и экспериментальных работах
довольно часто приходится использовать
малую
выборку, когда
число наблюдений меньше или равно 30.
При малой выборке для расчета ошибок
репрезентативности, как средних, так
и относительных величин,
число
наблюдений уменьшается на единицу,
т.е.
;
.
Величина
ошибки репрезентативности зависит от
объема выборки: чем больше число
наблюдений, тем меньше ошибка. Для оценки
достоверности выборочного показателя
принят следующий подход: показатель
(или средняя величина) должен в 3 раза
превышать свою ошибку, в этом случае он
считается достоверным.
83. Определение доверительных границ средних и относительных величин.
Знание
величины ошибки недостаточно для того,
чтобы быть уверенным в результатах
выборочного исследования, так как
конкретная ошибка выборочного
исследования может быть значительно
больше (или меньше) величины средней
ошибки репрезентативности. Для
определения точности, с которой
исследователь желает получить результат,
в статистике используется такое понятие,
как вероятность безошибочного
прогноза, которая является характеристикой
надежности результатов выборочных
медико-биологических статистических
исследований. Обычно, при проведении
медико-биологических статистических
исследований используют вероятность
безошибочного прогноза 95% или 99%. В
наиболее ответственных случаях, когда
необходимо сделать особенно важные
выводы в теоретическом или практическом
отношении, используют вероятность
безошибочного прогноза 99,7%
Определенной
степени вероятности безошибочного
прогноза соответствует определенная
величина предельной
ошибки случайной выборки (Δ
— дельта),
которая определяется по формуле:
Δ=t
* m
, где t
— доверительный коэффициент, который
при большой выборке при вероятности
безошибочного прогноза 95% равен 2,6;
при вероятности безошибочного
прогноза 99% — 3,0; при вероятности
безошибочного прогноза 99,7% — 3,3, а при
малой выборке определяется по специальной
таблице значений t
Стьюдента.
Используя
предельную ошибку выборки (Δ),
можно определить доверительные
границы,
в которых с определенной вероятностью
безошибочного прогноза заключено
действительное значение статистической
величины,
характеризующей
всю генеральную совокупность (средней
или относительной).
Для
определения доверительных границ
используются следующие формулы:
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ И НАУКИ ГОРОДА МОСКВЫ
Государственное бюджетное профессиональное образовательное учреждение города Москвы
«ЮРИДИЧЕСКИЙ КОЛЛЕДЖ»
(ГБПОУ Юридический колледж)
ПЛАН-КОНСПЕКТ учебного занятия
по ОП.11 Статистика
учебной дисциплине/междисциплинарному курсу
для обучающихся 2 курса
специальность 40.02.01 Право и организация социального обеспечения
(набор 2016 г.)
(углубленная подготовка)
дата проведения занятия по расписанию
Тема 3.1. Выборочное наблюдение
Занятие 15. ПЗ №8 Определение ошибки репрезентативности.
Определение объема выборочной совокупности
Цель занятия: отработать практические навыки по определению доверительных пределов и исчислению ошибок выборки
Задачи занятия:
Обучающая: Обеспечить усвоение обучающимися материала о понятиях: ошибки репрезентативности, выборка, выборочная совокупность;
Воспитательная: воспитывать навыки самостоятельной работы, чувство ответственности за порученный участок работы, дисциплину умственного труда, уверенность в своих силах, стремление к достижению результата;
Развивающая: создавать условия для развития самостоятельности мышления, способности высказывания собственной точки зрения, систематизировать необходимую информацию, анализировать, сравнивать и обобщать информацию, развивать монологическую речь.
Основная литература:
Глава 11. Выборочное наблюдение. (211-220) Статистика: учебник / И.В. Гладун. – 2-е издание, стер. – М.: КНОРУС, 2014. – 232 с. – СПО
Дополнительная литература:
Савюк Л.К. Правовая статистика: Учебник. — М.: Юрист, 2016
Интернет-ресурсы:
- Информационно-издательский центр «Статистика России» http://www.statbook.ru
- Электронный фонд правовой и технической документации http://docs.cntd.ru
- Информационно правовой портал http://www.garant.ru/
Междисциплинарные связи: Право социальное обеспечение
Внутридисциплинарные связи: Тема 2.1. Сводка и группировка статистических данных
1. Актуализация знаний по ранее пройденному материалу учебного курса
(ответить на вопросы (тестовые задания) и провести самооценку усвоенного материала)
Таблица 1.
Вопрос (тестовое задание) |
Ответ |
|
|
|
|
|
|
|
|
|
2. Изучаемые вопросы занятия
1. Определение ошибки репрезентативности. |
2. Определение объема выборочной совокупности. |
Вопрос 1. Определение ошибки репрезентативности
В статистике выделяют два основных метода исследования – сплошной и выборочный. При проведении выборочного исследования обязательным является соблюдение следующих требований: репрезентативность выборочной совокупности и достаточное число единиц наблюдений. При выборе единиц наблюдения возможны Ошибки смещения, т. е. такие события, появление которых не может быть точно предсказуемым. Эти ошибки являются объективными и закономерными. При определении степени точности выборочного исследования оценивается величина ошибки, которая может произойти в процессе выборки – Случайная ошибка репрезентативности (M) – Является фактической разностью между средними или относительными величинами, полученными при проведении выборочного исследования и аналогичными величинами, которые были бы получены при проведении исследования на генеральной совокупности.
Оценка достоверности результатов исследования предусматривает определение:
1. ошибки репрезентативности
2. доверительных границ средних (или относительных) величин в генеральной совокупности
3. достоверности разности средних (или относительных) величин (по критерию t)
Расчет ошибки репрезентативности (mм) средней арифметической величины (М):
, где σ – среднее квадратическое отклонение; n – численность выборки (>30).
Расчет ошибки репрезентативности (mР) относительной величины (Р):
, где Р – соответствующая относительная величина (рассчитанная, например, в %);
Q =100 – Ρ% – величина, обратная Р; n – численность выборки (n>30)
В клинических и экспериментальных работах довольно часто приходится использовать Малую выборку, Когда число наблюдений меньше или равно 30. При малой выборке для расчета ошибок репрезентативности, как средних, так и относительных величин, Число наблюдений уменьшается на единицу, т. е.
; .
Величина ошибки репрезентативности зависит от объема выборки: чем больше число наблюдений, тем меньше ошибка. Для оценки достоверности выборочного показателя принят следующий подход: показатель (или средняя величина) должен в 3 раза превышать свою ошибку, в этом случае он считается достоверным.
Знание величины ошибки недостаточно для того, чтобы быть уверенным в результатах выборочного исследования, так как конкретная ошибка выборочного исследования может быть значительно больше (или меньше) величины средней ошибки репрезентативности. Для определения точности, с которой исследователь желает получить результат, в статистике используется такое понятие, как вероятность безошибочного прогноза, которая является характеристикой надежности результатов выборочных медико-биологических статистических исследований. Обычно, при проведении медико-биологических статистических исследований используют вероятность безошибочного прогноза 95% или 99%. В наиболее ответственных случаях, когда необходимо сделать особенно важные выводы в теоретическом или практическом отношении, используют вероятность безошибочного прогноза 99,7%
Определенной степени вероятности безошибочного прогноза соответствует определенная величина Предельной ошибки случайной выборки (Δ – дельта), которая определяется по формуле:
Δ=t * m, где t – доверительный коэффициент, который при большой выборке при вероятности безошибочного прогноза 95% равен 2,6; при вероятности безошибочного прогноза 99% – 3,0; при вероятности безошибочного прогноза 99,7% – 3,3, а при малой выборке определяется по специальной таблице значений t Стьюдента.
Используя предельную ошибку выборки (Δ), можно определить Доверительные границы, в которых с определенной вероятностью безошибочного прогноза заключено действительное значение статистической величины, Характеризующей всю генеральную совокупность (средней или относительной).
Для определения доверительных границ используются следующие формулы:
- для средних величин:
,где Мген – доверительные границы средней величины в генеральной совокупности;
Мвыб – средняя величина, Полученная при проведении исследования на выборочной совокупности; t – доверительный коэффициент, значение которого определяется степенью вероятности безошибочного прогноза, с которой исследователь желает получить результат; mM – ошибка репрезентативности средней величины.
2) для относительных величин:
, где Рген – доверительные границы относительной величины в генеральной совокупности; Рвыб – относительная величина, полученная при проведении исследования на выборочной совокупности; t – доверительный коэффициент; mP – ошибка репрезентативности относительной величины.
Доверительные границы показывают, в каких пределах может колебаться размер выборочного показателя в зависимости от причин случайного характера.
При малом числе наблюдений (n<30), для вычисления доверительных границ значение коэффициента t находят по специальной таблице Стьюдента. Значения t расположены в таблице на пересечении с избранной вероятностью безошибочного прогноза и строки, Указывающей на имеющееся число степеней свободы (n), Которое равно n-1.
на определение ошибок репрезентативности (m) и доверительных границ средней величины генеральной совокупности (Мген) при числе наблюдений больше 30
Условие задачи: при изучении комбинированного воздействия шума и низкочастотной вибрации на организм человека было установлено, что средняя частота пульса у 36 обследованных водителей сельскохозяйственных машин через 1 ч работы составила 80 ударов в 1 минуту; σ = ± 6 ударов в минуту.
Задание: определить ошибку репрезентативности (mM) и доверительные границы средней величины генеральной совокупности (Мген).
Решение.
- Вычисление средней ошибки средней арифметической (ошибки репрезентативности) (m): m = σ / √n = 6 / √36 = ±1 удар в минуту
- Вычисление доверительных границ средней величины генеральной совокупности (Мген). Для этого необходимо:
- а) задать степень вероятности безошибочного прогноза (Р = 95 %);
- б) определить величину критерия t. При заданной степени вероятности (Р=95%) и числе наблюдений меньше 30 величина критерия t, определяемого по таблице, равна 2 (t = 2). Тогда Мген = Мвыб ± tm = 80 ± 2×1 = 80 ± 2 удара в минуту.
Вывод. Установлено с вероятностью безошибочного прогноза Р = 95%, что средняя частота пульса в генеральной совокупности, т.е. у всех водителей сельскохозяйственных машин, через 1 ч работы в аналогичных условиях будет находиться в пределах от 78 до 82 ударов в минуту, т.е. средняя частота пульса менее 78 и более 82 ударов в минуту возможна не более, чем у 5% случаев генеральной совокупности.
на определение ошибок репрезентативности (m) и доверительных границ относительного показателя генеральной совокупности (Рген)
Условие задачи: при медицинском осмотре 164 детей 3 летнего возраста, проживающих в одном из районов городе Н., в 18% случаев обнаружено нарушение осанки функционального характера.
Задание: определить ошибку репрезентативности (mp) и доверительные границы относительного показателя генеральной совокупности (Рген).
Решение.
- Вычисление ошибки репрезентативности относительного показателя: m = √P x q / n = √18 x (100 — 18) / 164 = ± 3%
- Вычисление доверительных границ средней величины генеральной совокупности (Рген) производится следующим образом:
- необходимо задать степень вероятности безошибочного прогноза (Р=95%);
- при заданной степени вероятности и числе наблюдений больше 30, величина критерия t равна 2 (t = 2). Тогда Рген = Рвыб± tm = 18% ± 2 х 3 = 18% ± 6%.
Вывод. Установлено с вероятностью безошибочного прогноза Р=95%, что частота нарушения осанки функционального характера у детей 3 летнего возраста, проживающих в городе Н., будет находиться в пределах от 12 до 24% случаев.
на оценку достоверности разности средних величин
Условие задачи: при изучении комбинированного воздействия шума и низкочастотной вибрации на организм человека было установлено, что средняя частота пульса у водителей сельскохозяйственных машин через 1 ч после начала работы составила 80 ударов в минуту; m = ± 1 удар в мин. Средняя частота пульса у этой же группы водителей до начала работы равнялась 75 ударам в минуту; m = ± 1 удар в минуту.
Задание: оценить достоверность различий средних значений пульса у водителей сельскохозяйственных машин до и после 1 ч работы.
Решение.
Вывод. Значение критерия t = 3,5 соответствует вероятности безошибочного прогноза Р > 99,7%, следовательно можно утверждать, что различия в средних значениях пульса у водителей сельскохозяйственных машин до и после 1 ч работы не случайно, а достоверно, существенно, т.е. обусловлено влиянием воздействия шума и низкочастотной вибрации.
на оценку достоверности разности относительных показателей
Условие задачи: при медицинском осмотре детей 3 летнего возраста в 18% (m = ± 3%) случаях обнаружено нарушение осанки функционального характера. Частота аналогичных нарушений осанки при медосмотре детей 4-летнего возраста составила 24% (m = ± 2,64%).
Задание: оценить достоверность различий в частоте нарушения осанки у детей 2 возрастных групп.
Решение.
Вывод. Значение критерия t=1,5 соответствует вероятности безошибочного прогноза Р<95%. Следовательно, различие в частоте нарушений осанки среди детей, сравниваемых возрастных групп случайно, недостоверно, несущественно, т.е. не обусловлено влиянием возраста детей.
Источники информации по 1 вопросу |
Автор и наименование |
Страницы (форма доступа для Интернет-ресурсов) |
Основная литература |
Глава 11. Выборочное наблюдение. Статистика: учебник / И.В. Гладун. – 2-е издание, стер. – М.: КНОРУС, 2014. – 232 с. – СПО |
стр. 211-220 |
Интернет ресурсы |
|
http://www.statbook.ru |
|
http://docs.cntd.ru |
|
|
http://www.garant.ru/ |
Контрольное задание по Вопросу 1
- Записать в тетрадь конспект (1-2 стр.)
Вопрос 2. Определение объема выборочной совокупности
Социологические исследования редко бывают сплошными, как, например, перепись населения. Обычно сплошное исследование проводится при небольшой генеральной совокупности.
Чаще всего исследования носят выборочный характер, при котором наиболее важным основанием является возможность распространения полученных результатов и выводов на всю генеральную совокупность. В таком случае сплошное исследование нецелесообразно. Обеспечение этой нецелесообразности — вопрос о репрезентативности выборки, т.е. достаточной количественной и качественной представительности генеральной совокупности в выборке.
Условиями соблюдения репрезентативности выборки являются:
1) равная возможность каждого члена генеральной совокупности попасть в выборку;
2) отбор необходимо проводить независимо от изучаемого признака (иначе в выборку могут попасть, например, только спортсмены);
3) отбор по возможности должен производиться из однородных совокупностей;
4) величина выборки должна быть достаточно большой.
Далее возникает вопрос: как определить достаточный объем выборки? Для этого необходимо иметь характеристики генеральной совокупности по важнейшим (с точки зрения исследования) признакам. К ним, например, можно отнести сведения о количестве желающих заниматься физической культурой и спортом, о числе занимающихся и т.д. Но, как правило, такие характеристики (или многие из них) не известны. Пилотажные исследования как раз и направлены на их выявление.
Приведем пример определения объема выборочной совокупности. В ходе подготовки к проведению конкретно-социологического исследования на основании теоретических посылок были выделены характеристики и признаки, подлежащие изучению. Например, желание заниматься физической культурой, спортом, величина потребности, участие в видах деятельности и др.
На основании результатов изучения этих признаков в пробном исследовании (30 и более респондентов) определяется объем выборки.
Предположим, что в пробном исследовании опрошено 147 студентов 4-х курсов в четырех вузах Республики Беларусь.
Для желания заниматься физической культурой получены следующие распределения:
1.«Нет, не хочу» — 5 человек;
2.«Скорее не хочу, чем хочу» — 3 человека;
3.«Безразлично» — 11 человек;
4.«Скорее хочу, чем не хочу» — 34 человека;
5.«Да, хочу» — 72 человека.
Для расчета объема выборки используются формулы:
t — 1,96 — распределение Стьюдента для вероятности 0,95 или 95% (т.е., если требуемая вероятность соответствия характеристик выборки и характеристик генеральной совокупности 95%, всегда = 1,96. Их соответствие на 95% — общепринятое требование в социологических исследованиях.
Для нашего распределения:
При условии, что выборка в пробном исследовании представляла бы собой модель генеральной совокупности, величина выборочной совокупности для изучения желания заниматься физической культурой должна быть не меньше 147 человек. Тогда с вероятностью 95% можно утверждать, что генеральное среднее лежит в пределах 4,39+0,155.
Поскольку модель выборки в пробном исследовании во вузам не представляет собой модели генеральной совокупности (опрос был в четырех вузах из 30), то увеличиваем полученное n (30/4) в 7,5 раза. Тогда необходимый объем выборки — 1102 респондента.
Качественная представительность полученной выборки оценивается сравнением существенных характеристик (либо связанных с существенными) генеральной совокупности и выборки. Для студенчества, например, такими характеристиками являются: соотношение по полу, охват учебными занятиями по физическому воспитанию, соотношение форм занятий и др.
Когда информация о признаках элементов генеральной совокупности отсутствует, исключается возможность определения объема выборочной совокупности при помощи формул. В этом случае можно опереться на многолетний опыт социологов — практиков, свидетельствующий о том, что для пробных опросов достаточна выборка объемом 100-250 человек. При массовых опросах, если величина генеральной совокупности 5000 человек, достаточный объем выборочной совокупности — не менее 500 человек, если же величина генеральной совокупности 5000 человек и более, то — 10% ее состава (но не более 2000-2500 человек). Это характеризует достаточно достоверные результаты исследования.
ПРИМЕР 1
При проверке импортирования груза на таможне методом случайной выборки было обработано 200 изделий. В результате был установлен средний вес изделия 30г., при СКО=4г с вероятностью 0,997. Определите пределы в которых находится средний вес изделий генеральной совокупности.
Решение.
В данном примере – случайный повторный отбор.
n=200
=30г
=4г — СКО
p=0,997, тогда t=3
Формула средней ошибки для случайного повторного отбора:
=0,84 г
г
Определяем величину средней ошибки.
Ответ: пределы в которых находится средний вес изделий: г
ПРИМЕР 2
В городе проживает 250тыс. семей. Для определения среднего числа детей в семье была организована 2%-я бесповторная выборка семей. По ее результатам было получено следующее распространение семей по числу детей:
P=0,954. Найти пределы в которых будет находится среднее число детей в генеральной совокупности.
Число детей в семье, xi |
0 |
1 |
2 |
3 |
4 |
5 |
Кол-во детей в семье |
1000 |
2000 |
1200 |
400 |
200 |
200 |
Решение
2%-я выборка означает: n=250000*0,02= 5000 семей было исследовано.
Т.к. выборка бесповторная, используем следующую формулу для определения средней величины ошибки:
Найдем среднее число детей в выборочной совокупности:
ребенка
Определим дисперсию
ребенка – средняя величина ошибки
Т.к p = 0,954, то t = 2
ребенка
ребенка
Вывод: из-за слишком малой величины ошибки, среднее число детей в генеральной совокупности можно принять за 1,5 ребенка.
Источники информации по 2 вопросу |
Автор и наименование |
Страницы (форма доступа для Интернет-ресурсов) |
Основная литература |
Глава 11. Выборочное наблюдение. Статистика: учебник / И.В. Гладун. – 3-е издание, стер. – М.: КНОРУС, 2019. – 232 с. – СПО |
стр. 211-220 |
Интернет ресурсы |
|
http://www.statbook.ru |
|
http://docs.cntd.ru |
|
|
http://www.garant.ru/ |
Контрольное задание по Вопросу 2
- Записать в тетрадь конспект (1-2 стр.)
3. Подведение итогов учебного занятия
(ответить на вопросы (тестовые задания) и провести самооценку усвоенного материала)
Таблица 2.
Наименование изученного вопроса учебного занятия |
Контрольное задание по изученному вопросу |
Ответ |
Определение ошибки репрезентативности. |
ЗАДАНИЕ 1 Условие задачи: при медицинском осмотре 126 детей 6 летнего возраста, проживающих в одном из районов городе А., в 12% случаев обнаружено нарушение осанки функционального характера. Задание: определить ошибку репрезентативности (mp) и доверительные границы относительного показателя генеральной совокупности (Рген). |
|
Определение ошибки репрезентативности. |
ЗАДАНИЕ 2. Условие задачи: при медицинском осмотре детей 6 летнего возраста в 15% (m = ± 3%) случаях обнаружено нарушение осанки функционального характера. Частота аналогичных нарушений осанки при медосмотре детей 7-летнего возраста составила 24% (m = ± 2,64%). Задание: оценить достоверность различий в частоте нарушения осанки у детей 2 возрастных групп. |
|
Определение объема выборочной совокупности |
ЗАДАНИЕ 3. В городе проживает 300 тыс. семей. Для определения среднего числа детей в семье была организована 2%-я бесповторная выборка семей. По ее результатам было получено следующее распространение семей по числу детей: P=0,954. Найти пределы в которых будет находится среднее число детей в генеральной совокупности |
|
Определение объема выборочной совокупности |
Сформулируйте понятие генеральной совокупности |
|
Определение объема выборочной совокупности |
Перечислите способы отбора единиц для выборочного наблюдения |
- Домашнее задание на следующее занятие
- Выучить основные понятия. Глава 11. Выборочное наблюдение. Статистика: учебник / И.В. Гладун. – 2-е издание, стер. – М.: КНОРУС, 2014. – 232 с. – СПО (стр. 211-220)
- Выполнить задание 11.1. в тетради (стр. 224) учебник / И.В. Гладун. – 2-е издание, стер. – М.: КНОРУС, 2014. – 232 с. – СПО
Преподаватель Ю.В. Древаль
СОГЛАСОВАНО Протокол заседания ЦК дисциплин профессионального цикла специальности «Право и организация социального обеспечения» ГБПОУ Юридический колледж от ____________ 2017 г. № ___ |