Некоторые из этой статьи перечисленные источники может и не быть надежный. Пожалуйста, помогите этой статье поиском более надежных источников. Ненадежные цитаты могут быть оспорены или удалены. (Ноябрь 2014 г.) (Узнайте, как и когда удалить этот шаблон сообщения) |
В статистика, систематическая ошибка выборки это предвзятость в котором образец собирается таким образом, что некоторые члены предполагаемого численность населения иметь более низкий или более высокий вероятность выборки чем другие. Это приводит к предвзятая выборка, неслучайная выборка[1] популяции (или нечеловеческих факторов), в которой не все люди или экземпляры были отобраны с одинаковой вероятностью.[2] Если это не учитывать, результаты могут быть ошибочно отнесены к изучаемому явлению, а не к методу исследования. отбор проб.
Медицинские источники иногда называют систематическую ошибку выборки предвзятость установления.[3][4] Предвзятость установления имеет в основном то же определение:[5][6] но все же иногда классифицируется как отдельный вид систематической ошибки.[5]
Отличие от систематической ошибки отбора
Систематическая ошибка выборки обычно классифицируется как подтип критерий отбора,[7] иногда специально называемый смещение выборки,[8][9][10] но некоторые относят это к отдельному виду предвзятости.[11]Различие, хотя и не общепринятое, смещения выборки состоит в том, что оно подрывает внешняя валидность теста (возможность обобщения его результатов на всю популяцию), а критерий отбора в основном адреса внутренняя валидность на предмет различий или сходств, обнаруженных в данном образце. В этом смысле ошибки, возникающие в процессе сбора выборки или когорты, вызывают смещение выборки, тогда как ошибки в любом последующем процессе вызывают смещение выборки.
Однако систематическая ошибка выборки и систематическая ошибка выборки часто используются как синонимы.[12]
Типы
- Выбор из конкретная реальная площадь. Например, опрос старшеклассников для измерения употребления незаконных наркотиков подростками будет предвзятым, поскольку он не включает учащихся, обучающихся на дому, или бросивших школу. Выборка также является смещенной, если одни члены недопредставлены или перепредставлены по сравнению с другими в генеральной совокупности. Например, интервью «с улицы», в ходе которого отбираются люди, проходящие мимо определенного места, будет иметь слишком большое количество здоровых людей, которые с большей вероятностью будут находиться вне дома, чем люди с хроническими заболеваниями. Это может быть крайней формой смещенной выборки, потому что некоторые члены совокупности полностью исключены из выборки (то есть у них есть нулевая вероятность быть выбранными).
- Самостоятельный выбор предвзятость (см. также Ошибка отсутствия ответа ), что возможно в тех случаях, когда изучаемая группа людей имеет какую-либо форму контроля над тем, участвовать ли в ней (как действующие стандарты этика исследований между людьми требуется для многих форм обучения в реальном времени и некоторых продольных форм обучения). Решение участников об участии может быть коррелировано с характеристиками, которые влияют на исследование, что делает участников нерепрезентативной выборкой. Например, люди, у которых есть твердое мнение или существенные знания, могут с большей готовностью тратить время на ответы на вопросы опроса, чем те, у кого их нет. Другой пример онлайн-опросы и опросы по телефону, которые являются предвзятыми выборками, поскольку респонденты выбираются самостоятельно. Те люди, которые имеют высокую мотивацию к ответу, обычно люди, которые придерживаются твердого мнения, перепредставлены, а люди, которые безразличны или апатичны, с меньшей вероятностью ответят. Это часто приводит к поляризации ответов, когда крайним точкам зрения придается непропорциональный вес в резюме. В результате такие опросы считаются ненаучными.
- Предварительная проверка участников исследования, или Реклама для волонтеров в определенных группах. Например, исследование с целью «доказать», что курение не влияет на физическую форму, может набираться в местном фитнес-центре, но рекламироваться для курильщиков во время продвинутых занятий аэробикой и для некурящих во время сеансов похудания.
- Исключение систематическая ошибка возникает в результате исключения определенных групп из выборки, например исключение субъектов, у которых недавно мигрировал в исследуемую область (это может произойти, когда новоприбывшие отсутствуют в регистре, используемом для идентификации исходного населения). Исключение субъектов, которые покидают изучаемую зону во время последующего наблюдения, скорее эквивалентно выбыванию или отсутствию ответа, критерий отбора в том, что это скорее влияет на внутреннюю валидность исследования.
- Предвзятость здорового пользователя, когда изучаемая популяция, вероятно, более здорова, чем население в целом. Например, человек со слабым здоровьем вряд ли будет работать физическим мастером.
- Заблуждение Берксона, когда исследуемая популяция выбрана из больницы и поэтому менее здорова, чем население в целом. Это может привести к ложной отрицательной корреляции между заболеваниями: больной без диабета более вероятно иметь другое заболевание, такое как холецистит, так как у них должна была быть причина попасть в больницу.
- Превышение, соответствие для очевидного смущающий это на самом деле результат воздействия[требуется разъяснение ]. Контрольная группа становится более похожей на пациенты в отношении воздействия, чем на население в целом.
- Предубеждение в отношении выживаемости, в котором выбираются только «уцелевшие» предметы, игнорируя выпавшие из поля зрения. Например, при использовании данных о текущих компаниях в качестве индикатора делового климата или экономики игнорируются предприятия, которые потерпели неудачу и больше не существуют.
- Предвзятость Мальмквиста, эффект в наблюдательной астрономии, который приводит к предпочтительному обнаружению действительно ярких объектов.
Выборка на основе симптомов
Изучение медицинских условий начинается с анекдотических отчетов. По своему характеру такие отчеты включают только те, которые направлены для диагностики и лечения. Ребенку, который не может учиться в школе, чаще ставят диагноз: дислексия чем ребенок, который борется, но проходит. Ребенок, обследованный на одно состояние, с большей вероятностью будет проверен и диагностирован с другими состояниями, коморбидность статистика. Поскольку определенные диагнозы становятся связаны с проблемами поведения или Интеллектуальная недееспособность родители пытаются предотвратить стигматизацию своих детей с помощью этих диагнозов, что вносит дополнительную предвзятость. Исследования, тщательно отобранные из целых популяций, показывают, что многие состояния встречаются гораздо чаще и обычно намного мягче, чем считалось ранее.
Обрезать выборку в племенных исследованиях
Простой пример родословной смещения выборки
Генетики ограничены в способах получения данных о человеческих популяциях. В качестве примера рассмотрим человеческую характеристику. Мы заинтересованы в том, чтобы определить, наследуется ли характеристика как простой менделевский черта. Следуя законам Менделирующее наследование, если родители в семье не имеют характеристики, но несут ее аллель, они являются носителями (например, невыразительный гетерозигота ). В этом случае у каждого из детей будет 25% шанс показать характеристику. Проблема возникает из-за того, что мы не можем сказать, в каких семьях есть оба родителя в качестве носителей (гетерозиготные), если в них нет ребенка, который проявляет эту характеристику. Описание следует из учебника Саттона.[13]
На рисунке показаны родословные всех возможных семей с двумя детьми, когда родители являются носителями (Аа).
- Неусеченный выбор. В идеальном мире мы должны быть в состоянии обнаружить все такие семьи с геном, включая тех, которые являются просто носителями. В этой ситуации анализ был бы свободен от предвзятости установления, а родословные были бы в рамках «неуклонного отбора». На практике большинство исследований выявляют и включают семьи в исследование на основании того, что они имели затронутых лиц.
- Обрезать выделение. Когда страдает отдельные лица имеют равные шансы быть включенными в исследование, это называется усеченным отбором, означающим непреднамеренное исключение (усечение) семей, которые являются носителями гена. Поскольку отбор осуществляется на индивидуальном уровне, семьи с двумя или более затронутыми детьми будут иметь более высокую вероятность включения в исследование.
- Полный выбор усечения это частный случай, когда каждый семья с больным ребенком имеет равные шансы быть отобранным для исследования.
Вероятность каждой из выбранных семей представлена на рисунке, а также дана частота выборки затронутых детей. В этом простом случае исследователь будет искать частоту4⁄7 или5⁄8 для характеристики, в зависимости от используемого типа усечения.
Эффект пещерного человека
Пример смещения отбора называется «эффектом пещерного человека». Большая часть нашего понимания доисторический народов происходит из пещер, таких как наскальные рисунки сделано почти 40 000 лет назад. Если бы существовали современные картины на деревьях, шкурах животных или склонах холмов, их бы давно смыло. Точно так же свидетельства костров, кучи, места захоронения и т.д., скорее всего, останутся нетронутыми до современной эпохи в пещерах. Доисторические люди ассоциируются с пещерами, потому что там до сих пор существуют данные, не обязательно потому, что большинство из них прожили в пещерах большую часть своей жизни.[14]
Проблемы из-за смещения выборки
Смещение выборки проблематично, потому что возможно, что статистика вычисление выборки систематически ошибочно. Систематическая ошибка выборки может привести к систематической переоценке или недооценке соответствующих параметр в населении. Систематическая ошибка выборки возникает на практике, поскольку практически невозможно гарантировать абсолютную случайность выборки. Если степень искажения невелика, то выборку можно рассматривать как разумное приближение к случайной выборке. Кроме того, если выборка не отличается заметно по измеряемой величине, то смещенная выборка все же может быть разумной оценкой.
Слово предвзятость имеет сильный негативный оттенок. Действительно, предубеждения иногда возникают из-за преднамеренного намерения ввести в заблуждение или других научное мошенничество. В статистическом использовании систематическая ошибка представляет собой просто математическое свойство, независимо от того, является ли оно преднамеренным или бессознательным, или вызвано несовершенством инструментов, используемых для наблюдения. Хотя некоторые люди могут намеренно использовать предвзятую выборку для получения вводящих в заблуждение результатов, чаще предвзятая выборка является просто отражением трудности получения действительно репрезентативной выборки или незнания предвзятости в их процессе измерения или анализа. Примером того, как может существовать игнорирование предвзятости, является широко распространенное использование соотношения (также известного как «коэффициент»). сложить изменение ) как мера различия в биологии. Поскольку легче достичь большого отношения с двумя маленькими числами с заданной разницей и относительно труднее достичь большого отношения с двумя большими числами с большей разницей, при сравнении относительно больших числовых измерений могут быть упущены большие существенные различия. Некоторые называют это «предвзятостью демаркации», потому что использование соотношения (деления) вместо разницы (вычитания) переводит результаты анализа из науки в псевдонауку (см. Проблема демаркации ).
В некоторых выборках используется предвзятый статистический план, который, тем не менее, позволяет оценивать параметры. Соединенные штаты. Национальный центр статистики здравоохранения например, преднамеренное превышение выборки среди меньшинств во многих своих общенациональных обследованиях, чтобы получить достаточную точность для оценок внутри этих групп.[15] Эти обследования требуют использования весов выборки (см. Ниже) для получения правильных оценок по всем этническим группам. При соблюдении определенных условий (главным образом, при правильном вычислении и использовании весов) эти выборки позволяют точно оценить параметры совокупности.
Исторические примеры
Пример необъективной выборки: по состоянию на июнь 2008 г. 55% веб-браузеров (Internet Explorer ) в использовании не прошел Кислота2 тест. Из-за характера теста выборка состояла в основном из веб-разработчиков.[16]
Классический пример предвзятости выборки и вводящих в заблуждение результатов произошел в 1936 году. На заре опросов общественного мнения американцы Литературный дайджест журнал собрал более двух миллионов почтовых опросов и предсказал, что республиканский кандидат в Президентские выборы в США, Альф Лэндон, победил бы действующего президента, Франклин Рузвельт, с большим отрывом. Результат был прямо противоположным. Обзор «Литературный дайджест» представляет собой выборку, собранную среди читателей журнала, дополненную записями зарегистрированных владельцев автомобилей и пользователей телефонов. Эта выборка включала чрезмерное представительство людей, которые были богатыми, которые как группа с большей вероятностью проголосовали бы за кандидата от республиканцев. Напротив, опрос только 50 тысяч граждан, выбранных Джордж Гэллап организация успешно предсказала результат, что привело к популярности Gallup опрос.
Другой классический пример произошел в 1948 президентские выборы. В ночь выборов Чикаго Трибьюн напечатал заголовок ДЬЮИ ПОБЕЖДАЕТ ТРУМЭНА, что оказалось ошибкой. Утром ухмылка избранный президент, Гарри С. Трумэн, был сфотографирован с газетой с таким заголовком. Причина, по которой Tribune ошиблась, заключается в том, что их редактор доверял результатам телефонный опрос. Опросные исследования были тогда в зачаточном состоянии, и лишь немногие ученые осознавали, что выборка пользователей телефонов не является репрезентативной для населения в целом. Телефоны еще не получили широкого распространения, а те, у кого они были, обычно были зажиточными и имели стабильные адреса. (Во многих городах Bell System телефонный справочник содержит те же имена, что и Социальный регистр ). Кроме того, опросу Gallup, на котором основывалась заголовок Tribune, было более двух недель на момент публикации.[17]
Более свежий пример — COVID-19 пандемия, где вариации смещения выборки в COVID-19 тестирование было показано, что они объясняют широкие различия в обоих показатели летальности и возрастное распределение случаев в разных странах.[18][19]
Статистические поправки для смещенной выборки
Если из выборки исключаются целые сегменты населения, то корректировки, которые могут дать оценки, репрезентативные для всего населения, отсутствуют. Но если некоторые группы недопредставлены и степень недопредставленности может быть определена количественно, то веса выборки могут исправить смещение. Однако успех исправления ограничен выбранной моделью выбора. Если некоторые переменные отсутствуют, методы, используемые для исправления смещения, могут быть неточными.[20]
Например, гипотетическая популяция может включать 10 миллионов мужчин и 10 миллионов женщин. Предположим, что необъективная выборка из 100 пациентов включала 20 мужчин и 80 женщин. Исследователь может исправить этот дисбаланс, добавив гирю 2,5 для каждого мужчины и 0,625 для каждой женщины. Это приведет к корректировке любых оценок для достижения того же ожидаемого значения, что и для выборки, в которую входят ровно 50 мужчин и 50 женщин, если только мужчины и женщины не различаются по вероятности участия в опросе.
Смотрите также
- Цензурированная регрессионная модель
- Сбор вишни (заблуждение)
- Проблема с ящиком для файлов
- Парадокс дружбы
- Предвзятость сообщения
- Вероятность выборки
- Критерий отбора
- Смещение спектра
- Модель усеченной регрессии
Рекомендации
- ^ Медицинский словарь — «Смещение выборки» Проверено 23 сентября, 2009 г. В архиве 10 марта 2016 г. Wayback Machine
- ^ TheFreeDictionary — предвзятый образец Проверено 23 сентября 2009. Сайт в свою очередь цитирует: Медицинский словарь Мосби, 8-е издание.
- ^ Вайзинг, Курт (2005). ДНК-фингерпринтинг растений: принципы, методы и применение. Лондон: Taylor & Francis Group. п.180. ISBN 978-0-8493-1488-9.
- ^ Страница 34 в: Отбор и тесты на нарушение равновесия при сложных демографических данных и предвзятости установления Франческ Калафель и Майо, Анна Рамирес и Сориано. Июль 2008 г.
- ^ а б Паначек: Ошибка в исследовании В архиве 2016-08-17 в Wayback Machine Общество академической неотложной медицины. Проверено 14 ноября, 2009 г.
- ^ Медицинский словарь medilexicon — «Установление предвзятости» В архиве 2016-08-06 в Wayback Machine Проверено 14 ноября, 2009 г.
- ^ Словарь терминов по раку — предвзятость при выборе В архиве 2009-06-09 на Wayback Machine Проверено 23 сентября, 2009 г.
- ^ Ардс, Шейла; Чанг, Чанджин; Майерс, Сэмюэл Л. (1998). «Влияние смещения выборки на расовые различия в сообщениях о жестоком обращении с детьми». Жестокое обращение с детьми и пренебрежение. 22 (2): 103–115. Дои:10.1016 / S0145-2134 (97) 00131-2. PMID 9504213.
- ^ Кортес, Коринна; Мохри, Мехриар; Райли, Майкл; Ростамизаде, Афшин (2008). Теория коррекции смещения выборки (PDF). Теория алгоритмического обучения. Конспект лекций по информатике. 5254. С. 38–53. arXiv:0805.2775. CiteSeerX 10.1.1.144.4478. Дои:10.1007/978-3-540-87987-9_8. ISBN 978-3-540-87986-2.
- ^ Кортес, Коринна; Мохри, Мехриар (2014). «Теория адаптации предметной области и коррекции смещения выборки и алгоритм регрессии» (PDF). Теоретическая информатика. 519: 103–126. CiteSeerX 10.1.1.367.6899. Дои:10.1016 / j.tcs.2013.09.027.
- ^ Фадем, Барбара (2009). Поведенческая наука. Липпинкотт Уильямс и Уилкинс. п. 262. ISBN 978-0-7817-8257-9.
- ^ Уоллес, Роберт (2007). Максси-Розенау-Ласт Общественное здравоохранение и профилактическая медицина (15-е изд.). McGraw Hill Professional. п. 21. ISBN 978-0-07-159318-2.
- ^ Саттон, Гарри Элдон (1988). Введение в генетику человека (4-е изд.). Харкорт Брейс Йованович. ISBN 978-0-15-540099-3.
- ^ Берк, Ричард А. (июнь 1983 г.). «Введение в предвзятость выборки в социологических данных». Американский социологический обзор. 48 (3): 386–398. Дои:10.2307/2095230. JSTOR 2095230.
- ^ Национальный центр статистики здравоохранения (2007 г.). Здоровье меньшинств.
- ^ «Статистика браузера». Refsnes Data. Июнь 2008 г.. Получено 2008-07-05.
- ^ На основе http://www.uh.edu/engines/epi1199.htm получено 29 сентября 2007 г.
- ^ Уорд, Д. (апрель 2020 г.) «Ошибка выборки: объяснение широких различий в показателях летальности от COVID-19». Технический отчет. WardEnvironment. https://doi.org/10.13140/RG.2.2.24953.62564/1
- ^ Уорд, Дэн. (Май 2020 г.). «Ошибка выборки: объяснение различий в возрастном распределении случаев COVID-19». https://doi.org/10.13140/RG.2.2.27321.19047/2. Технический отчет. WardEnvironment.
- ^ Cuddeback, Гэри; Уилсон, Орм, Комбс-Орм (2004). «Обнаружение и статистическое исправление систематической ошибки при выборе образца» (PDF). Журнал исследований социальных служб. 30 (3): 19–33. Дои:10.1300 / J079v30n03_02. Получено 2016-09-20.CS1 maint: несколько имен: список авторов (связь)
Систематическая ошибка отбора — статистическое понятие, показывающее, что выводы, сделанные применительно к какой-либо группе, могут оказаться неточными вследствие неправильного отбора в эту группу.
Содержание
- 1 Ошибки отбора результатов
- 2 Типы систематических ошибок
- 2.1 Пространство
- 2.2 Данные
- 2.3 Участники
- 3 Устранение систематической ошибки
- 4 См. также
Ошибки отбора результатов
Могут включать предварительный или последующий отбор с превалированием или исключением некоторых видов. Это может быть, конечно, разновидностью научного мошенничества, манипуляцией данными, но гораздо чаще является добровольным заблуждением, например, вследствие использования неподходящего инструмента.
Например, в эпоху использования плёнки для фотографирования неба независимый наблюдатель определённо пришёл бы к выводу, что количество голубых галактик явно больше, чем количество красных. Не потому, что голубые галактики более распространены, но лишь вследствие того, что большинство плёнок более чувствительны к голубой части спектра. Тот же независимый наблюдатель сделал бы прямо противоположный вывод сейчас, в эпоху цифровой фотографии, потому что матрицы цифровых фотоаппаратов более чувствительны к красной части спектра.
Типы систематических ошибок
Существует большое количество возможных систематических ошибок, основные типы:
Пространство
- Выбор первой и последней точки в серии. К примеру, для того, чтобы максимизировать заявленный тренд, можно начать серию с года с необычно низкими показателями и закончить годом с самыми высокими показателями.
- «Своевременное» окончание, то есть тогда, когда результаты укладываются в желаемую теорию.
- Отделение части данных на основе знаний обо всей выборке и затем применение математического аппарата к этой части как к слепой (случайной) выборке. См. Районированная выборка, en:cluster sampling, Ошибка меткого стрелка.
- Изучение процесса на интервале (во времени или пространстве) длиной заведомо меньшей, чем требуется для полного представления о явлении.
Данные
- Вычёркивание неких «плохих» данных в соответствии с правилами, хотя бы эти правила и шли вразрез с предварительно объявленными правилами для этой выборки.
Участники
- Предварительный отбор участников, или, к примеру, размещение объявления о наборе добровольцев для участия в испытаниях среди определённой группы людей. К примеру, для доказательства, что курение никак не вредит результатам фитнеса, можно разместить в местном фитнесцентре объявление для набора добровольцев, но курящих набирать в мастерклассе, а некурящих среди начинающих или в секции желающих сбросить вес.
- Выбрасывание из выборки участников, не дошедших до конца теста. В программе похудения мы рассматриваем подробные графики сброса веса как доказательство правильности методики, но в эти графики не включены не дошедшие до конца участники, посчитавшие, что на них эта методика не работает (так называемая систематическая ошибка выжившего).
- Систематическая ошибка самоотбора. То есть группа людей для изучения формируется частично по собственной воле, так как не все опрошенные пожелают участвовать в тесте.
Устранение систематической ошибки
В общем случае невозможно выделить систематическую ошибку выборки только на основе статистических методов, хотя, как показано в работе нобелевского лауреата Джеймса Хекмана (англ. James Heckman), в некоторых специальных случаях существуют работающие стратегии.
Известной является фраза — рассказы об уме и доброте дельфинов основаны на рассказах уставших пловцов, которых они толкали к берегу, но мы лишены возможности услышать рассказ тех, кого они толкали в другую сторону.
См. также
- Парадокс Берксона
- Проверка статистических гипотез
- Систематическая ошибка выжившего
Когда исследователи рассматривают вопросы, представляющие интерес для аналитиков или портфельных менеджеров, они могут исключить из анализа определенные акции, облигации, портфели, или периоды времени, по разным причинам — возможно, из-за недоступности данных.
Когда недоступность данных приводит к исключению из анализа определенных активов, мы называем эту проблему систематической ошибкой или смещением выборки (англ. ‘sample selection bias’ или ‘sampling bias’).
Например, вы можете сделать выборку из базы данных, которая отслеживает только компании, существующие в настоящее время. Например, многие базы данных взаимных фондов предоставляют историческую информацию только о тех фондах, которые существуют в настоящее время.
Базы данных, в которых хранятся балансовые отчеты и отчеты о прибылях и убытках страдают от той же систематической ошибки, что и базы данных фондов: в них нет фондов или компаний, которые прекратили деятельность.
Исследование, которое использует подобные базы данных, подвержено разновидности систематической ошибки выборки, известной как систематическая ошибка выжившего (англ. ‘survivorship bias’).
Исследователи Димсон, Марш и Стонтон (Dimson, Marsh, and Staunton, 2002) подняли вопрос о систематической ошибке выжившего в международных финансовых индексах:
Известной проблемой является влияние выживания рынков на долгосрочную оценку доходности. Рынки могут испытывать не только разочаровывающие результаты, но и полную потерю стоимости за счет конфискации, гиперинфляции, национализации и кризисов.
При оценке результатов рынков, которые выживают в течение длительных интервалов времени, мы сделали выводы о том, чем обусловлено выживание. Тем не менее, как отметили в исследовании Браун, Готцман и Росс (Brown, Goetzmann, и Ross) в 1995 г. и Готцман и Джорион (Goetzmann and Jorion) в 1999 г., человек не способен заранее определить, какие рынки выживут, а какие нет. (стр. 41)
Систематическая ошибка выжившего иногда появляется, когда мы используем совместно цены акций и данные бухгалтерского учета.
Например, многие исследования в области финансов использовали соотношение рыночной стоимости компании к бухгалтерской стоимости компании на одну акцию (т.е. коэффициент котировки акций, англ. P/B, от ‘price-to-book ratio’ или ‘market-to-book ratio’) и обнаружили, что коэффициент P/B обратно пропорционален доходности компании (см. Fama and French 1992, 1993).
Коэффициент P/B также используется для многих популярных индексов стоимости и роста.
Если база данных, которую мы используем для сбора данных бухгалтерского учета, исключает обанкротившиеся компании, это может привести к систематической ошибке выжившего.
Котхари, Шанкен и Слоун (Kothari, Shanken, and Sloan) в 1995 г. исследовали именно этот вопрос, и оспорили то, что акциям обанкротившихся компаний свойственна самая низкая доходность и коэффициент P/B.
Если мы исключаем из выборки акции обанкротившихся компаний, то акции с низким P/B, которые включены в выборку, будут иметь в среднем более высокую доходность, по сравнению со средней доходностью при включении в выборку всех акций с низким P/B. Котхари, Шанкен и Слоун предположили, что эта систематическая ошибка привела к выводу об обратной связи между средней доходностью и P/B.
См. Fama and French (1996, стр. 80) о интеллектуальном анализе данных и систематической ошибке выжившего в их тестах.
Единственный совет, который мы можем предложить в этой ситуации, — это быть в курсе каких-либо смещений, потенциально присущих в выборке. Очевидно, что смещения выборки могут затуманить результаты любого исследования.
Выборка также может быть смещена из-за удаления (или делистинга) акций компании.
Делистинг (англ. ‘delisting’), т.е. исключение акций компании из котировального списка биржи, может происходить по разным причинам: слияние, банкротство, ликвидация, или переход на другую биржу.
Например, Центр исследований котировок ценных бумаг (CRSP, от англ. Center for Research in Security Prices) в Университете Чикаго является основным поставщиком данных о доходности, используемых в научных исследованиях. Когда происходит делистинг, CRSP пытается собрать данные о доходности исключенной компании, но во многих случаях он не может сделать этого из-за связанных с делистингом трудностях. CRSP вынужден просто указать значение доходности исключенной компании как отсутствующее.
Исследование, опубликованное в Финансовом журнале (см. The Journal of Finance) Шумвеем и Вортером (Shumway and Warther) в 1999 году, задокументировало смещение данных доходности NASDAQ в CRSP, вызванное делистингом.
Авторы показали, что делистинг, связанный с плохой работой компании (например, банкротством) исключается из данных чаще, чем делистинг, связанный с хорошей или нейтральной эффективностью компании (например, слиянием или перемещением на другой рынок). Кроме того, делистинг чаще происходит с небольшими компаниями.
Систематическая ошибка выборки встречается даже на рынках, где качество и согласованность данных весьма высоки. Новые классы активов, такие как хедж-фонды могут представлять еще большие проблемы смещения выборки.
Хедж-фонды (англ. ‘hedge funds’) представляют собой гетерогенную группу инвестиционных инструментов, как правило, организованных таким образом, чтобы быть свободными от регулирующего контроля. В целом, хедж-фонды не обязаны публично раскрывать свою эффективность (в отличие, скажем, от взаимных фондов). Хедж-фонды сами решают, нужно ли им включаться в какую-либо базу данных хедж-фондов.
Хедж фонды с плохой репутацией явно не желают, чтобы их результаты публиковались в базе данных, создавая проблему смещения самовыборки (англ. ‘self-selection bias’) в базах данных хедж-фондов.
Кроме того, как отметили Фанг и Хсие (Fung and Hsieh) в исследовании 2002 г., поскольку только хедж-фонды с хорошими показателями добровольно попадают в базу данных, в целом, историческая эффективность отрасли хедж-фондов имеет тенденцию казаться лучше, чем она есть на самом деле.
Кроме того, многие базы данных хедж-фондов исключают фонды, которые выходят из бизнеса, создавая в базе данных систематическую ошибку выжившего. Даже если база данных не удаляет несуществующие хедж-фонды, в попытке устранить ошибку выжившего, остается проблема хедж-фондов, которые перестают отчитываться об эффективности из-за плохих результатов.
См. Fung and Hsieh (2002) и Horst and Verbeek (2007) для более подробной информации о проблемах интерпретации эффективности хедж-фондов.
Обратите внимание, что систематическая ошибка также возможна, когда успешные фонды перестают отчитываться об эффективности, поскольку они больше не нуждаются в новых потоках денежных средств.
Систематическая ошибка опережения.
Процесс тестирования также подвержен систематической ошибке опережения (англ. ‘look-ahead bias’), если он использует информацию, которая не была доступна на момент тестирования.
Например, тесты правил биржевой торговли, которые используют ставки доходности фондового рынка и данные бухгалтерских балансов должны учитывать систематическую ошибку опережения.
В таких тестах, балансовая стоимость компании на акцию обычно используются для расчета коэффициента P/B.
Хотя рыночная цена акции доступна для всех участников рынка на заданный момент времени, балансовая стоимость на акцию на конец финансового года может стать общедоступной только в будущем — когда-то в следующем квартале.
Систематическая ошибка временного периода.
Тесты также подвержены систематической ошибке или смещению временного периода (англ. ‘time-period bias’), если они основаны на временном периоде, для которого результаты тестирования будут специфичными (т.е., характерными только для данного периода).
Ряды коротких временных периодов, скорее всего, дадут результаты, специфичные для определенного периода, которые могут не отражать более длительный период.
Ряды длительных временных периодов могут дать более точную картину истинной эффективности инвестиций. Недостаток длительных периодов заключается в потенциальных структурных изменениях, происходящих в течение периода, что приведет к двум различным распределениям доходности.
В этой ситуации, распределение, отражающее условия до изменений, будет отличаться от распределения, которые описывают условия после изменений.
Пример (7) систематических ошибок в инвестиционных исследованиях.
Финансовый аналитик рассматривает эмпирические данные об исторической доходности акций США.
Она выясняет, что недооцененные акции (то есть, акции с низким P/B) превзошли по эффективности растущие акции (то есть, акции с высоким P/B) в некоторых последних периодах времени.
После изучения американского рынка, аналитик задается вопросом, могут ли недооцененные акции быть привлекательными в Великобритании. Она исследует эффективность недооцененных и растущих акций на британском рынке за 14-летний период с января 2000 года по декабрь 2013 года.
Для проведения этого исследования, аналитик делает следующее:
- Получает текущий состав компаний Индекса всех акций FTSE (Financial Times Stock Exchange All Share Index), который является взвешенным индексом рыночной капитализации;
- Исключает несколько компаний, у которых финансовый год не заканчивается в декабре;
- Использует балансовую и рыночную стоимость компаний на конец года, чтобы ранжировать остальные пространство компаний по коэффициенту P/B на конец года;
- На основе этих рейтингов, она делит пространство ценных бумаг на 10 портфелей, каждый из которых содержит одинаковое количество акций;
- Вычисляет равновзвешенную доходность каждого портфеля и доходность FTSE All Share Index за 12 месяцев после даты расчета каждого рейтинга; а также
- Вычитает доходность FTSE из доходности каждого портфеля, чтобы получить избыточную доходность для каждого портфеля.
Опишите и обсудите каждую из следующих систематических ошибок, которым подвержен план исследований аналитика:
- систематическую ошибку выжившего;
- систематическую ошибку опережения; а также
- систематическую ошибку временного периода.
Систематическая ошибка выжившего.
План тестирования подвержен систематической ошибке выжившего, если он не принимает в расчет обанкротившиеся компании, слившиеся компании, а также компании, иным образом покинувшие базу.
В этом примере, аналитик использовала текущий список акций FTSE, а не фактический список акций на начало каждого года. В той степени, в которой расчет доходности не учитывает компании, исключенные из индекса, эффективность портфелей с наименьшим P/B подвершена систематической ошибке выжившего и, соответственно, может быть завышена.
В какой-то момент периода тестирования, эти ныне не существующие компании, были исключены из тестирования. У них, вероятно, были низкие цены на акции (и низкий P/ B) и плохая доходность.
Систематическая ошибка опережения.
План тестирования подвержен систематической ошибке опережения, если он использует информацию, недоступную на момент тестирования.
В этом примере, аналитик провела тест, сделав допущение о том, что необходимая бухгалтерская информация была доступна в конце финансового года.
Например, аналитик предположила, что балансовая стоимость на акцию за 2 000 финансовый года был известна на 31 декабря 2000 года. Поскольку эта информация, как правило, не публикуется в течение нескольких месяцев после завершения финансового года, тест, возможно, содержал систематическую ошибку опережения.
Эта ошибка может привести к стратегии, которая окажется успешной, но при этом потребуется идеальная способность прогнозировать бухгалтерские результаты.
Систематическая ошибка временного периода.
План тестирования подвержен систематической ошибке временного периода, если он основан на периоде, для которого результаты будут специфичны.
Хотя тестирование охватывает период более 10 лет, этот период может оказаться слишком коротким для тестирования аномалии.
В идеале, аналитик должна протестировать рыночные аномалии в течение нескольких бизнес-циклов, чтобы гарантировать, что результаты не являются специфичными для рассматриваемого периода.
Эта систематическая ошибка может способствовать предлагаемой стратегии, если выбрать временной период, благоприятный для стратегии.
Систематическая ошибка отбора — это систематическая ошибка, вызванная отбором лиц, групп или данных для анализа таким образом, что не достигается надлежащая рандомизация, что гарантирует, что полученная выборка не является репрезентативной для популяции, предназначенной для анализа. Иногда это называют эффектом выбора . Фраза «систематическая ошибка отбора» чаще всего относится к искажению статистического анализа , вызванному методом сбора образцов. Если не учитывать систематическую ошибку отбора, то некоторые выводы исследования могут быть ложными.
Типы
Смещение выборки
Отбор проб смещения является систематической ошибкой из — за не- случайной выборки из популяции, в результате чего некоторые членов населения, менее вероятно, будет включены , чем другие, что приводит к смещенной выборке , определяются как статистическая выборка из в популяции (или не- человеческий фактор), в котором не все участники одинаково сбалансированы или объективно представлены. Это в основном классифицируется как подтип смещения выборки, иногда конкретно называемый смещением выборки , но некоторые классифицируют его как отдельный тип смещения.
Отличие систематической ошибки выборки (хотя и не общепризнанной) состоит в том, что она подрывает внешнюю валидность теста (способность обобщать его результаты для остальной совокупности), в то время как систематическая ошибка выборки в основном касается внутренней валидности различий или сходства, обнаруженные в представленном образце. В этом смысле ошибки, возникающие в процессе сбора выборки или когорты, вызывают смещение выборки, тогда как ошибки в любом последующем процессе вызывают смещение выборки.
Примеры систематической ошибки выборки включают в себя самостоятельный выбор , предварительный отбор участников исследования, дисконтирование субъектов исследования / тестов, которые не были завершены, и систематическую ошибку миграции путем исключения субъектов, которые недавно переехали в исследуемую область или покинули ее , систематическая ошибка продолжительности и продолжительности. где обнаруживается медленно развивающееся заболевание с лучшим прогнозом, и систематическая ошибка заблаговременности , когда заболевание диагностируется у участников раньше, чем в сравниваемых популяциях, хотя среднее течение болезни такое же.
Интервал времени
- Досрочное прекращение исследования в тот момент, когда его результаты подтверждают желаемый вывод.
- Испытание может быть прекращено досрочно при достижении экстремального значения (часто по этическим причинам), но экстремальное значение, вероятно, будет достигнуто переменной с наибольшей дисперсией , даже если все переменные имеют одинаковое среднее значение .
Экспозиция
-
Ошибка восприимчивости
- Смещение клинической восприимчивости , когда одно заболевание предрасполагает ко второму заболеванию, а лечение первого заболевания ошибочно предрасполагает ко второму заболеванию. Например, постменопаузальный синдром дает более высокую вероятность развития рака эндометрия , поэтому эстрогены, назначаемые для лечения постменопаузального синдрома, могут получить более высокую, чем реальную, вину за возникновение рака эндометрия.
- Протопатическая предвзятость , когда кажется , что лечение первых симптомов заболевания или другого исхода приводит к исходу. Это потенциальная ошибка, когда до постановки диагноза проходит время от первых симптомов и начала лечения. Его можно смягчить за счет запаздывания , то есть исключения воздействий, имевших место в определенный период времени до постановки диагноза.
- Смещение показаний , потенциальное смешение причин и следствий, когда воздействие зависит от показаний, например, лечение проводится людям с высоким риском заражения заболеванием, потенциально вызывая преобладание пролеченных людей среди заболевших. Это может вызвать ошибочный вид лечения, являющегося причиной заболевания.
Данные
- Разбиение (разделение) данных на разделы с учетом содержимого разделов, а затем их анализ с помощью тестов, разработанных для слепо выбранных разделов.
-
Постфактум изменение включения данных по произвольным или субъективным причинам, включая:
- Выбор вишни , который на самом деле является не смещением выбора, а смещением подтверждения , когда для подтверждения вывода выбираются определенные подмножества данных (например, приводятся примеры авиакатастроф как свидетельство того, что рейс авиакомпании небезопасен, но игнорируется гораздо более распространенный пример полетов, которые завершено безопасно. См. эвристику доступности )
- Отказ от неверных данных на (1) произвольных основаниях вместо того, чтобы соответствовать ранее заявленным или общепринятым критериям, или (2) отбрасывание « выбросов » на основании статистических данных, которые не принимают во внимание важную информацию, которая может быть получена из «диких» наблюдений.
Исследования
- Выбор исследований для включения в метаанализ (см. Также комбинаторный метаанализ ).
- Проведение повторных экспериментов и предоставление отчетов только о наиболее благоприятных результатах, возможно, переименование лабораторных записей других экспериментов как «калибровочных тестов», «ошибок приборов» или «предварительных обследований».
- Представление наиболее значимого результата рывка данных, как если бы это был единственный эксперимент (который логически совпадает с предыдущим элементом, но считается менее нечестным).
Потертость
Систематическая ошибка отсева — это своего рода систематическая ошибка отбора, вызванная отсевом (потерей участников), не считая субъектов испытаний / тестов, которые не были завершены. Это тесно связано с систематической ошибкой выживаемости , когда в анализ включаются только субъекты, которые «пережили» процесс, или с ошибкой , когда включаются только субъекты, которые «потерпели неудачу» в процессе. Он включает в себя отсев , неполучение ответов (более низкий процент ответов ), отказ от участия и отклонения от протокола . Он дает предвзятые результаты, если они не одинаковы в отношении воздействия и / или результата. Например, при испытании программы диеты исследователь может просто отклонить всех, кто выбывает из испытания, но большинство выбывших составляют те, для кого она не работает. Различные потери субъектов в группе вмешательства и в группе сравнения могут изменить характеристики этих групп и результаты независимо от исследуемого вмешательства .
Потерянные для последующего наблюдения — это еще одна форма систематической ошибки истощения, которая проявляется в основном в медицинских исследованиях в течение длительного периода времени. Предвзятость отсутствия ответа или удержания может зависеть от ряда как материальных, так и нематериальных факторов, таких как: богатство, образование, альтруизм, начальное понимание исследования и его требований. Исследователи также могут быть неспособны провести последующий контакт из-за неадекватной идентифицирующей информации и контактных данных, собранных на начальном этапе набора и исследования.
Выбор наблюдателя
Философ Ник Бостром утверждал, что данные фильтруются не только по плану исследования и измерениям, но и по необходимому предварительному условию, что должен быть кто-то, проводящий исследование. В ситуациях, когда существование наблюдателя или исследования коррелирует с данными, возникают эффекты выбора наблюдения и требуется антропное обоснование .
Примером может служить история столкновений с Землей в прошлом : если крупные столкновения вызывают массовые вымирания и экологические нарушения, исключающие эволюцию разумных наблюдателей в течение длительного времени, никто не будет наблюдать никаких свидетельств крупных столкновений в недавнем прошлом (поскольку они предотвратили бы появление разумных наблюдателей). наблюдатели от эволюционирующих). Следовательно, есть потенциальная погрешность в данных о столкновении с Землей. Астрономические риски существования также могут быть недооценены из-за систематической ошибки отбора, и необходимо ввести антропную поправку.
Волонтерский уклон
Предвзятость самоотбора или предвзятость добровольцев в исследованиях создают дополнительные угрозы для валидности исследования, поскольку эти участники могут иметь характеристики, по сути отличающиеся от целевой группы исследования. Исследования показали, что волонтеры, как правило, имеют более высокий социальный статус, чем люди с более низким социально-экономическим положением. Кроме того, другое исследование показывает, что женщины более склонны участвовать в исследованиях, чем мужчины. Предвзятость волонтеров очевидна на протяжении всего жизненного цикла исследования, от набора до наблюдения. В более общем смысле реакцию добровольцев можно объяснить индивидуальным альтруизмом, желанием одобрения, личным отношением к теме исследования и другими причинами. Как и в большинстве случаев, смягчением последствий в случае предвзятости добровольцев является увеличение размера выборки.
Смягчение
В общем случае ошибки отбора не могут быть преодолены только статистическим анализом существующих данных, хотя поправка Хекмана может использоваться в особых случаях. Оценка степени систематической ошибки отбора может быть сделана путем изучения корреляций между экзогенными (фоновыми) переменными и показателем лечения. Однако в регрессионных моделях именно корреляция между ненаблюдаемыми детерминантами результата и ненаблюдаемыми детерминантами отбора в выборку приводит к смещению оценок, и эта корреляция между ненаблюдаемыми факторами не может быть напрямую оценена наблюдаемыми детерминантами лечения.
Когда данные выбираются для целей подгонки или прогноза, можно настроить коалиционную игру, чтобы функция подгонки или точности прогноза могла быть определена для всех подмножеств переменных данных.
Систематическая ошибка отбора тесно связана с:
- предвзятость публикации или предвзятость сообщения , искажение восприятия сообщества или метаанализа из-за отказа от публикации неинтересных (обычно отрицательных) результатов или результатов, которые идут вразрез с предубеждениями экспериментатора, интересами спонсора или ожиданиями сообщества.
- предвзятость подтверждения , общая тенденция людей уделять больше внимания тому, что подтверждает нашу ранее существовавшую точку зрения; или, в частности, в экспериментальной науке, искажение, вызванное экспериментами, которые предназначены для поиска подтверждающих доказательств вместо попытки опровергнуть гипотезу.
- систематическая ошибка исключения, возникает в результате применения различных критериев к случаям и средствам контроля в отношении права на участие в исследовании / различных переменных, служащих основанием для исключения.
Смотрите также
- Парадокс Берксона — Тенденция неверно истолковывать статистические эксперименты с условными вероятностями
- Теория черного лебедя — теория реакции на неожиданные события
- Сбор вишни — Заблуждение о неполных доказательствах
- Предвзятость в отношении финансирования — тенденция научного исследования поддерживать интересы спонсора.
- Список когнитивных предубеждений — систематические модели отклонения от нормы или рациональности в суждениях
- Предвзятость участия
- Предвзятость публикации — более высокая вероятность публикации результатов, указывающих на важный вывод.
- Предвзятость сообщения
- Смещение выборки — смещение, при котором выборка собирается таким образом, что некоторые члены предполагаемой совокупности с меньшей вероятностью будут включены, чем другие.
- Вероятность выборки
- Теория избирательного воздействия — теория в психологии, относящаяся к тенденции отдавать предпочтение информации, которая подкрепляет ранее существовавшие взгляды.
- Самоисполняющееся пророчество — предсказание, которое само сбылось.
- Смещение выживаемости — логическая ошибка, форма смещения отбора
- Иллюзия частоты
использованная литература
Систематическая ошибка отбора
- Систематическая ошибка отбора — статистическое понятие, показывающее, что выводы, сделанные применительно к какой-либо группе, могут оказаться неточными вследствие неправильного отбора в эту группу.
Источник: Википедия
Связанные понятия
Шкала Ликерта, или (неверно) Лайкерта (англ. Likert scale (/ˈlɪkərt/ ), шкала суммарных оценок) — психометрическая шкала, которая часто используется в опросниках и анкетных исследованиях (разработана в 1932 году Ренсисом Ликертом). При работе со шкалой испытуемый оценивает степень своего согласия или несогласия с каждым суждением, от «полностью согласен» до «полностью не согласен». Сумма оценок каждого отдельного суждения позволяет выявить установку испытуемого по какому-либо вопросу. Предполагается…
Надёжностью называется один из критериев качества теста, его устойчивость по отношению к погрешностям измерения. Различают два вида надёжности — надёжность как устойчивость и надёжность как внутреннюю согласованность.
Подробнее: Надёжность психологического теста
Тест стандартными прогрессивными матрицами Равена (Рейвена) — тест, предназначенный для дифференцировки испытуемых по уровню их интеллектуального развития. Авторы теста Джон Рейвен и Л. Пенроуз. Предложен в 1936 году. Тест Равена известен как один из наиболее «чистых» измерений фактора общего интеллекта g, выделенного Ч.Э. Спирменом. Успешность выполнения теста SPM интерпретируется как показатель способности к научению на основе обобщения собственного опыта и создания схем, позволяющих обрабатывать…
Репрезентати́вность — соответствие характеристик выборки характеристикам популяции или генеральной совокупности в целом. Репрезентативность определяет, насколько возможно обобщать результаты исследования с привлечением определённой выборки на всю генеральную совокупность, из которой она была собрана.
Слепо́й ме́тод — процедура проведения исследования реакции людей на какое-либо воздействие, заключающаяся в том, что испытуемые не посвящаются в важные детали проводимого исследования. Метод применяется для исключения субъективных факторов, которые могут повлиять на результат эксперимента.
Нулевая гипотеза — принимаемое по умолчанию предположение о том, что не существует связи между двумя наблюдаемыми событиями, феноменами. Так, нулевая гипотеза считается верной до того момента, пока нельзя доказать обратное. Опровержение нулевой гипотезы, то есть приход к заключению о том, что связь между двумя событиями, феноменами существует, — главная задача современной науки. Статистика как наука даёт чёткие условия, при наступлении которых нулевая гипотеза может быть отвергнута.
Иллюзорная корреляция (англ. illusory correlation) — когнитивное искажение преувеличенно тесной связи между переменными, которая в реальности или не существует, или значительно меньше, чем предполагается. Типичным примером могут служить приписывание группе этнического меньшинства отрицательных качеств. Иллюзорная корреляция считается одним из способов формирования стереотипов.
Автокорреляция — статистическая взаимосвязь между последовательностями величин одного ряда, взятыми со сдвигом, например, для случайного процесса — со сдвигом по времени.
Долгосрочное иссле́дование (англ. Longitudinal study от longitude — долговременный) — научный метод, применяемый, в частности, в социологии и психологии, в котором изучается одна и та же группа объектов (в психологии — людей) в течение времени, за которое эти объекты успевают существенным образом поменять какие-либо свои значимые признаки. В самом широком смысле является синонимом панельного исследования, а в более узком смысле — выборочное панельное исследование любой возрастной или образовательной…
Исследование случай-контроль (ИСК) – это тип обсервационного наблюдения, в котором две исследуемые группы, различающиеся по полученному результату, сравниваются на основе предполагаемого влияющего фактора. Исследования с контрольной группой часто используются для определения факторов, которые могут повлиять на состояние здоровья, путем сравнения участников, у которых есть заболевание («случаи») и участников, у которых оно отсутствует («контроли»).
Доверительный интервал — термин, используемый в математической статистике при интервальной оценке статистических параметров, более предпочтительной при небольшом объёме выборки, чем точечная. Доверительным называют интервал, который покрывает неизвестный параметр с заданной надёжностью.
Генеральная совокупность (от лат. generis — общий, родовой) — совокупность всех объектов (единиц), относительно которых предполагается делать выводы при изучении конкретной задачи.
Эмпирические исследования – наблюдение и исследование конкретных явлений, эксперимент, а также обобщение, классификация и описание результатов исследования эксперимента, внедрение их в практическую деятельность человека.
Выявление аномалий (также обнаружение выбросов) — это опознавание во время интеллектуального анализа данных редких данных, событий или наблюдений, которые вызывают подозрения ввиду существенного отличия от большей части данных. Обычно аномальные данные превращаются в некоторый вид проблемы, такой как мошенничество в банке, структурный дефект, медицинские проблемы или ошибки в тексте. Аномалии также упоминаются как выбросы, необычности, шум, отклонения или исключения.
Робастность (англ. robustness, от robust — «крепкий», «сильный», «твёрдый», «устойчивый») — свойство статистического метода, характеризующее независимость влияния на результат исследования различного рода выбросов, устойчивости к помехам. Выбросоустойчивый (робастный) метод — метод, направленный на выявление выбросов, снижение их влияния или исключение их из выборки.
Системати́ческая оши́бка вы́жившего (англ. survivorship bias) — разновидность систематической ошибки отбора, когда по одной группе («выжившим») есть много данных, а по другой («погибшим») — практически нет, в результате чего исследователи пытаются искать общие черты среди «выживших» и упускают из вида, что не менее важная информация скрывается среди «погибших».
Фактор общего интеллекта (англ. general factor, g factor) является распространённым, но противоречивым конструктом, используемым в психологии (см. также психометрию) для выявления общего в различных тестах интеллекта. Словосочетание «теория g» имеет дело с гипотезой и полученными из неё результатами о биологической природе g, постоянством/податливостью, уместностью его применения в реальной жизни и другими исследованиями.
В когнитивной науке под когнити́вными искаже́ниями понимаются систематические ошибки в мышлении или шаблонные отклонения, которые возникают на основе дисфункциональных убеждений, внедрённых в когнитивные схемы, и легко обнаруживаются при анализе автоматических мыслей. Существование большинства когнитивных искажений было описано учёными, а многие были доказаны в психологических экспериментах.
Подробнее: Список когнитивных искажений
Эксперимент Ричарда Лазаруса — известный эксперимент в психологии, проведенный Ричардом Лазарусом и группой исследователей для изучения влияния когнитивной оценки ситуации угрозы на формирование стрессовой реакции. На основе результатов данного исследования Ричардом Лазарусом и его коллегами была разработана теория психологического стресса, которая стоит на одном уровне значимости для науки с концепцией стресса Ганса Селье.
Испыту́емый — участник эксперимента в психологии и других отраслях науки. В психолингвистике, этот термин — в отличие от информанта — предполагает, что собирается ещё и информация о носителе языка как языковой и речевой личности. Испытуемые могут быть специально отобраны для эксперимента, либо же являться имеющимися в наличии представителями изучаемой популяции.
Коэффициент инбридинга может быть вычислен для отдельной персоны и является мерой степени редукции предков в родословии конкретной личности.
Тест Айзенка — тест коэффициента интеллекта (IQ), разработанный английским психологом Гансом Айзенком. Известно восемь различных вариантов теста Айзенка на интеллект.
Статистический вывод (англ. statistical inference), также называемый индуктивной статистикой (англ. inferential statistics, inductive statistics) — обобщение информации из выборки для получения представления о свойствах генеральной совокупности.
Гетероскедастичность (англ. heteroscedasticity) — понятие, используемое в прикладной статистике (чаще всего — в эконометрике), означающее неоднородность наблюдений, выражающуюся в неодинаковой (непостоянной) дисперсии случайной ошибки регрессионной (эконометрической) модели. Гетероскедастичность противоположна гомоскедастичности, означающей однородность наблюдений, то есть постоянство дисперсии случайных ошибок модели.
Статистический критерий — строгое математическое правило, по которому принимается или отвергается та или иная статистическая гипотеза с известным уровнем значимости. Построение критерия представляет собой выбор подходящей функции от результатов наблюдений (ряда эмпирически полученных значений признака), которая служит для выявления меры расхождения между эмпирическими значениями и гипотетическими.
Дисперсионный анализ — метод в математической статистике, направленный на поиск зависимостей в экспериментальных данных путём исследования значимости различий в средних значениях. В отличие от t-критерия, позволяет сравнивать средние значения трёх и более групп. Разработан Р. Фишером для анализа результатов экспериментальных исследований. В литературе также встречается обозначение ANOVA (от англ. ANalysis Of VAriance).
В психологии фиксирование установки (эффект предшествования, прайминг) (англ. priming) — это явление имплицитной памяти, при котором обработка воздействия заданного стимула определяется предшествующим действием того же самого или подобного стимула. Реакция на действие данного стимула оказывает влияние на реакцию, возникающую в ответ на последующие стимулы. Действие предшествующего стимула может осознаваться человеком, но также фиксирование установки стимула происходит и при неосознаваемом воздействии…
Причинность по Грэнджеру (англ. Granger causality) — понятие, используемое в эконометрике (анализе временных рядов), формализующее понятие причинно-следственной связи между временными рядами. Причинность по Грэнджеру является необходимым, но не достаточным условием причинно-следственной связи.
Системати́ческий обзо́р — научное исследование ряда опубликованных отдельных однородных оригинальных исследований с целью их критического анализа и оценки. Систематический обзор проводится с использованием методологии, позволяющей исключить случайные и систематические ошибки, а также для обеспечения полного отчета о всех имеющихся исследований по данной теме, включая серую литературу с целью избежания предвзятости. В систематическом обзоре используются стандартизированные методы отбора и проверки…
Метод балльных оценок — один из методов одномерного шкалирования, используемых в психологии, процедура которого заключается в построении шкал на основе балльных оценок, получаемых из суждений испытуемых. Из всех методов психологических измерений, использующих оценочные суждения человека, шкалирование, основанное на балльных оценках, является наиболее популярным в виду своей простоты. Метод распространен как в прикладных, так и в академических разделах психологии, например, при психологической оценке…
Статистика — измеримая числовая функция от выборки, не зависящая от неизвестных параметров распределения элементов выборки.
Закон Парето (принцип Парето, принцип 80/20) — эмпирическое правило, названное в честь экономиста и социолога Вильфредо Парето, в наиболее общем виде формулируется как «20 % усилий дают 80 % результата, а остальные 80 % усилий — лишь 20 % результата». Может использоваться как базовая установка в анализе факторов эффективности какой-либо деятельности и оптимизации её результатов: правильно выбрав минимум самых важных действий, можно быстро получить значительную часть от планируемого полного результата…
Фа́кторный анализ — многомерный метод, применяемый для изучения взаимосвязей между значениями переменных. Предполагается, что известные переменные зависят от меньшего количества неизвестных переменных и случайной ошибки.
В математической статистике семплирование — обобщенное название методов манипулирования начальной выборкой при известной цели моделирования, которые позволяют выполнить структурно-параметрическую идентификацию наилучшей статистической модели стационарного эргодического случайного процесса.
Алекситимия (от др.-греч. ἀ- — приставка с отрицательным значением, λέξις — слово, θυμός — чувство, буквально «без слов для чувств») — затруднения в передаче, словесном описании своего состояния.
Приня́тие жела́емого за действи́тельное — формирование убеждений и принятие решений в соответствии с тем, что является приятным человеку, вместо апелляции к имеющимся доказательствам, рациональности или реальности.
Двоичная, бинарная или дихотомическая классификация — это задача классификации элементов заданного множества в две группы (предсказание, какой из групп принадлежит каждый элемент множества) на основе правила классификации. Контекст, в котором требуется решение, имеет ли объект некоторое качественное свойство, некоторые специфичные характеристики или некоторую типичную двоичную классификацию, включает…
Независимая переменная — в эксперименте переменная, которая намеренно манипулируется или выбирается экспериментатором с целью выяснить её влияние на зависимую переменную.
Метод анкети́рования — психологический вербально-коммуникативный метод, в котором в качестве средства для сбора сведений от респондента используется специально оформленный список вопросов — анкета. В социологии анкетирование — это метод опроса, используемый для составления статических (однократное анкетирование) или динамических (при многократном анкетировании) статистических представлений о состоянии общества, общественного мнения, состояния политической, социальной и прочей напряжённости с целью…
Выброс (англ. outlier), промах — в статистике результат измерения, выделяющийся из общей выборки.
Байесовская вероятность — это интерпретация понятия вероятности, используемая в байесовской теории. Вероятность определяется как степень уверенности в истинности суждения. Для определения степени уверенности в истинности суждения при получении новой информации в байесовской теории используется теорема Байеса.
Теория обнаружения сигнала (ТОС) — современный психофизический метод, учитывающий вероятностный характер обнаружения стимула, в котором наблюдатель рассматривается как активный субъект принятия решения в ситуации неопределённости. Теория обнаружения сигнала описывает сенсорный процесс как двухступенчатый: процесс отображения физической энергии стимула в интенсивность ощущения и процесс принятия решения субъектом.
Регрессия прошлой жизни (англ. past life regression, PLR) — техника использования гипноза для обнаружения того, что практикующие эту технику считают воспоминаниями людей о прошлых жизнях или реинкарнациях. Используется в парапсихологии в связи с попытками подтвердить гипотезу существования феномена реинкарнации.
Частотное распределение — метод статистического описания данных (измеренных значений, характерных значений). Математически распределение частот является функцией, которая в первую очередь определяет для каждого показателя идеальное значение, так как эта величина обычно уже измерена. Такое распределение можно представить в виде таблицы или графика, моделируя функциональные уравнения. В описательной статистике частота распределения имеет ряд математических функций, которые используются для выравнивания…
У́мственный во́зраст — понятие в психологии, предложено Альфредом Бине и Т. Симоном в 1908 году. За основу взят уровень умственного развития человека по сравнению с этим уровнем у людей такого же возраста. То есть возраст, в котором — по среднестатистическим данным, — люди могут решить испытательные задания такого же уровня сложности. Таким образом, основное назначение понятия «умственного возраста» в психологии — характеристика интеллектуального развития личности, в основе которой лежит сравнение…
Эмпирические данные (от др.-греч. εμπειρία «опыт») — данные, полученные через органы чувств, в частности, путём наблюдения или эксперимента. В философии после Канта полученное таким образом знание принято называть апостериорным. Оно противопоставляется априорному, доопытному знанию, доступному через чисто умозрительное мышление.
Групповáя поляризáция — психологический феномен расхождения по разным полюсам мнений участников дискуссии во время принятия группового решения. Величина разброса конечных вариантов напрямую зависит от первоначальных позиций участников. То есть, чем дальше от середины находились их мнения в начале дискуссии, тем сильней будет проявляться феномен. Важно разделять «поляризацию» и «экстремизацию». Поляризация — явление, при котором решение члена группы смещается к ранее выбранному им полюсу; при экстремизации…
Подробнее: Групповая поляризация
То́чечная оце́нка в математической статистике — это число, оцениваемое на основе наблюдений, предположительно близкое к оцениваемому параметру.
Рандомизированное контролируемое испытание (рандомизированное контролируемое исследование, РКИ) — тип научного (часто медицинского) эксперимента, при котором его участники случайным образом делятся на группы, в одной из которых проводится исследуемое вмешательство, а в другой (контрольной) применяются стандартные методики или плацебо.
Тест отноше́ния правдоподо́бия (англ. likelihood ratio test, LR) — статистический тест, используемый для проверки ограничений на параметры статистических моделей, оценённых на основе выборочных данных. Является одним из трёх базовых тестов проверки ограничений наряду с тестом множителей Лагранжа и тестом Вальда.