Пару дней назад я опубликовал в группе RationalAnswer ВКонтакте несложную, казалось бы, задачку. Привожу ее здесь целиком:
Давайте представим, что в вашей инвестиционной вселенной есть только два доступных инструмента – условно безрисковые облигации и условно рискованные акции. Облигации каждый год гарантированно приносят доходность 5%. Акции же обычно приносят доход в размере 30%, но не всегда: в 5% случаев (то есть, примерно раз в 20 лет) наступает кризис, и акции падают в цене на те же 30%.
Перед вами стоит выбор – в какой из инструментов вложить накопленный миллион рублей. Внезапно вам звонит друг – известный финансовый аналитик – и говорит, что по его прогнозу в этом году ожидается крах рынка акций. Вы знаете, что ваш друг – умный человек, но на всякий случай решаете проверить точность его прогнозов (к счастью, их архив доступен аж за сто последних лет). Проверив все его предыдущие предсказания, вы обнаруживаете, что средняя их точность составляет 80%: то есть, если взять все годы, когда рынок в итоге падал, то он правильно предсказал 80% из них; аналогично, если рассмотреть все годы роста рынка акций, то из них аналитик предугадал так же 80%.
Внимание, вопрос: в какой из двух инструментов вы вложитесь в этом году? В дополнение к этому, посчитайте пожалуйста ожидаемую доходность рынка акций на год вперед, исходя из всей имеющейся информации.
Прежде чем читать дальше, потратьте одну-две минуты на то, чтобы прикинуть, какой ответ вам кажется наиболее логичным.
Парадокс незадачливого предсказателя
На первый взгляд, правильное решение кажется очевидным. Если эксперт предсказывает крах фондового рынка, и он оказывается прав в 80% случаев – то от акций нужно держаться как можно дальше. В конце концов, математическое ожидание их доходности получается отрицательным: –30% х 0,8 + 30% х 0,2 = –18%. Несмотря на то, что в целом рынок акций по условиям задачи является довольно стабильным (падает всего в 5% случаев), новая полученная информация про конкретный год заставляет нас предпочесть более безопасный (хоть и гораздо менее доходный в среднем) актив. Логично?
Не совсем. Давайте разбираться на примере исторического «послужного списка» нашего аналитика. По условиям задачи, за прошедшие 100 лет должно было произойти 5 крахов и 95 успешных для акций лет. Из 5 крахов аналитик предсказал 4 (80%), и для 1 случая ошибся. Из 95 доходных лет эксперт предсказал 76 (тоже 80%), и для 19 доходных периодов он ошибочно предрекал падение рынка. Чуете, куда дует ветер? Если сложить вместе все периоды, когда аналитик предсказывал падение рынка (4 + 19 = 23), то правильными из этих предсказаний окажется всего 17% (4 из 23).
То есть, аналитик легко мог добиться точности своих предсказаний в 95%, если все 100 лет всегда предсказывал бы неизменную доходность рынка на уровне +30%. Но это показалось ему неинтересным, поэтому он периодически пытался спрогнозировать крах – он действительно смог поймать большинство из них (4 из 5), но ценой того, что множество раз (19) предсказывал крах, которого не происходило. Общая же совокупная точность всех его прогнозов в результате снизилась с 95% до 80%.
Таким образом, даже зная отрицательный прогноз нашего «умного» аналитика, вероятность убыточного ближайшего года поднимается с 5% до всего лишь 17%, а не 80%, как хочется предположить интуитивно. И ожидаемая доходность рынка акций составляет –30% х 0,17 + 30% х 0,83 = 20%. В четыре раза больше, чем доходность по облигациям в размере 5%! Мне кажется, выбор инвестиционного актива в данном случае напрашивается довольно однозначный.
Что такое ошибка базового уровня
Если вы решили задачу выше неправильно, не расстраивайтесь: человеческий мозг очень плохо интуитивно понимает статистику и вероятности, поэтому большинство людей ошибаются в подобных ситуациях. Даже среди практикующих врачей (уж точно проходивших курс статистики в колледже) согласно некоторым исследованиям только примерно 20% могут найти правильный ответ.
В общем случае ошибка базового уровня формулируется следующим образом: это ошибка в мышлении, когда сталкиваясь с общей информацией о частоте некоторого события (базовый уровень) и специфической информацией об этом событии, человек имеет склонность игнорировать первое и фокусироваться на втором.
Мы этого чаще всего не замечаем, но ошибка базового уровня может мешать вам принимать правильные решения в целом ряде областей, которые так или иначе связаны со случайностью и вероятностями. Назову лишь несколько примеров:
- Медицина: если вы проходили скрининг на выявление какого-либо заболевания, которое встречается примерно в 1% случаев (базовый уровень), и тест с точностью 90% показал положительный результат (наличие болезни), то еще не все пропало. Вероятность того, что вы действительно больны, составляет всего 10% (необходимо делать дополнительные, более точные тесты).
- ЗОЖ: если курение сокращает продолжительность жизни в среднем на 10 лет, то не стоит считать, что к вам это не будет относиться, так как ваш дед «курил до 80 лет, и ему всё было нипочем».
- Азартные игры: игрок в рулетку, который выиграл несколько раз подряд, начинает верить в свою «полосу везения» – вместо того, чтобы действовать в соответствии с базовой вероятностью выиграть у казино (увы, крайне невысокой).
- Инвестиции: люди склонны игнорировать тот факт, что акции приносят наибольшую долгосрочную доходность, и вкладывают деньги либо в то, что росло в последние несколько лет (биткоины?), либо в более безопасные, но низкодоходные активы («в этом году рынок акций упадет, уж лучше пусть мои деньги на депозите полежат»).
Как избежать ошибки?
Жизнь, к сожалению, гораздо сложнее любых задач – вам практически никогда не выдадут в разделе «дано» все необходимые данные, чтобы «вычислить» правильный ответ исходя из теории вероятностей. Поэтому я не буду советовать вам изучать статистику, учиться применять теорему Байеса и всякие другие вещи (делать которые вы все равно, конечно, не будете).
Но попробовать немного поменять свое мышление, мне кажется, будет полезным. В следующий раз, когда вы будете рассматривать какую-либо ситуацию, требующую принятия решения в условиях неопределенности, начните с другого конца: не со специфической информации, а с базового уровня. Попробуйте выяснить, чего стоит ожидать по данному вопросу на очень больших выборках, на очень длинных промежутках времени. И примите это как базовую точку прогноза того, чего стоит ожидать лично вам.
Если у вас есть какая-либо дополнительная специфическая информация – ее тоже можно учесть, но чаще всего она не должна кардинально поменять ситуацию по сравнению с базовым уровнем. Помните, что люди всегда склонны переоценивать влияние специфических факторов – поэтому, если вам хочется на их основании не чуть-чуть сдвинуть чашу весов, а полностью поменять их баланс, то в этот момент нужно проявить особую ментальную бдительность.
(Visited 4 228 times, 1 visits today)
Ошибка базового процента
- Ошибка базового процента (другие названия: заблуждение базового процента или игнорирование базового уровня) — это ошибка в мышлении, когда сталкиваясь с общей информацией о частоте некоторого события (базовый процент) и специфической информацией об этом событии, человек имеет склонность игнорировать первое и фокусироваться на втором.
Источник: Википедия
Связанные понятия
Байесовская игра (англ. Bayesian game) или игра с неполной информацией (англ. incomplete information game) в теории игр характеризуются неполнотой информации о соперниках (их возможных стратегиях и выигрышах), при этом у игроков есть веры относительно этой неопределённости. Байесовскую игру можно преобразовать в игру полной, но несовершенной информации, если принять допущение об общем априорном распределении. В отличие от неполной информации, несовершенная информация включает знание стратегий и выигрышей…
Машина вероятности – математическая модель вычислительного устройства, в работе которого участвует некоторый случайный процесс. Различные варианты понятия «Машины вероятности» являются обобщениями понятий «автомата детерминированного», «Тьюринга машина», «автомата бесконечного». Рассматривались, например, такие понятия «машины вероятности», как: 1)Машина Тьюринга (или другой детерминированный автомат) с входом, к которому присоединен бернуллиевский датчик, выдающий символ 1 и 0 с вероятностью p и…
Парадокс мальчика и девочки также известен в теории вероятностей как «Парадокс девочки и мальчика», «Дети мистера Смита» и «Проблемы миссис Смит». Впервые задача была сформулирована в 1959 году, когда Мартин Гарднер опубликовал один из самых ранних вариантов этого парадокса в журнале Scientific American под названием «The Two Children Problem», где привёл следующую формулировку…
Ложный вызов, ложная тревога — обман или ошибочное сообщение о чрезвычайной ситуации, в результате чего возникает ненужная паника и / или вызов аварийных служб (например скорой медицинской помощи, полиции) к месту, где они не нужны. Ложные вызовы могут возникать также в результате срабатывания сигнализации в жилище, детектора дыма, аварийной сигнализации на предприятии и в теории обнаружения сигнала. Ложные тревоги отвлекают аварийные службы от истинных чрезвычайных ситуаций, которые могли бы в конечном…
Тест на следующий бит (англ. next-bit test) — тест, служащий для проверки генераторов псевдо-случайных чисел на криптостойкость. Тест гласит, что не должно существовать полиномиального алгоритма, который, зная первые k битов случайной последовательности, сможет предсказать k+1 бит с вероятностью, неравной ½.
Эффект социальной желательности (social desirability bias, SDB) — термин в социологических исследованиях, описывающий тип предвзятости в ответах респондентов, что является тенденцией опрашиваемых давать такие ответы, которые, с их точки зрения, выглядят предпочтительнее в глазах окружающих. Такая тенденция может выражается в преувеличении положительных и желательных качеств и поведения и преуменьшении негативных, нежелательных. Этот феномен создает множество проблем в исследованиях, основанных на…
Причинность по Грэнджеру (англ. Granger causality) — понятие, используемое в эконометрике (анализе временных рядов), формализующее понятие причинно-следственной связи между временными рядами. Причинность по Грэнджеру является необходимым, но не достаточным условием причинно-следственной связи.
Безопасность информационных потоков — набор требований и правил, направленных на определение того, какие информационные потоки в системе являются разрешёнными, а какие нет. Данная модель не является самостоятельной, и используется в дополнение к мандатной или дискреционной модели управления доступа.
Теорема о конце света (англ. Doomsday argument, буквально «Аргумент судного дня» — сокращённо далее DA, нет устоявшегося перевода на русский язык, обычно используют английское название или сокращение DA) — это вероятностное рассуждение, которое претендует на то, чтобы предсказывать будущее время существования человеческой расы, исходя только из оценки числа живших до сих пор людей. Исходя из предположения, что живущие сейчас люди находятся в случайном месте всей хронологии человеческой истории, велики…
Теория обнаружения сигнала (ТОС) — современный психофизический метод, учитывающий вероятностный характер обнаружения стимула, в котором наблюдатель рассматривается как активный субъект принятия решения в ситуации неопределённости. Теория обнаружения сигнала описывает сенсорный процесс как двухступенчатый: процесс отображения физической энергии стимула в интенсивность ощущения и процесс принятия решения субъектом.
Социа́льное доказа́тельство (англ. Social proof), или информационное социальное влияние (англ. informational social influence) — психологическое явление, происходящее, когда некоторые люди не могут определить предпочтительный способ поведения в сложных ситуациях. Предполагая, что окружающие лучше знакомы с ситуацией, такие люди считают их поведение предпочтительным. Это явление часто используется для сознательной манипуляции поведением других.
Лемма разветвления (англ. Forking lemma) — лемма в области криптографических исследований.
Эффект Валинса — осознаваемое ощущение физиологических изменений при актуализации эмоциональной реакции.
Системати́ческая оши́бка вы́жившего (англ. survivorship bias) — разновидность систематической ошибки отбора, когда по одной группе («выжившим») есть много данных, а по другой («погибшим») — практически нет, в результате чего исследователи пытаются искать общие черты среди «выживших» и упускают из вида, что не менее важная информация скрывается среди «погибших».
Демпстера-Шафера теория — математическая теория очевидностей (свидетельств) (), основанная на функции доверия (belief functions) и функции правдоподобия (plausible reasoning), которые используются, чтобы скомбинировать отдельные части информации (свидетельства) для вычисления вероятности события. Теория была развита Артуром П. Демпстером и Гленном Шафером.
Эффект опознаваемой жертвы — разновидность когнитивного искажения, суть которого в том, что среди людей существует тенденция оказывать более щедрую помощь отдельному индивиду (жертве), чьи затруднительные жизненные обстоятельства можно наблюдать напрямую, нежели неопределённой группе лиц с аналогичными проблемами. По подобному принципу этот эффект также наблюдается при присвоении большей меры ответственности правонарушителю, чья личность была установлена, даже если его личность не несёт никакой значимой…
Эффект интервьюера — в современной социологии все погрешности, которые связаны с влиянием интервьюера на качество получаемых от респондента данных.
Эффект спящего — психологический феномен, связанный с убеждением. Это отсроченный рост влияния сообщения, которое сопровождалось обесценивающим стимулом (например, контраргументом или получением сообщения из источника, не вызывающего доверия). Суть феномена в отсроченном разделении содержания сообщения и источника информации.
Оккамово обучение в теории вычислительного обучения является моделью алгоритмического обучения, где целью обучения является получение сжатого представления имеющихся тренировочных данных. Метод тесно связан с почти корректным обучением (ПК обучение, англ. Probably Approximately Correct learning, PAC learning), где учитель оценивает прогнозирующую способность тестового набора.
Модель бинарного выбора — применяемая в эконометрике модель зависимости бинарной переменной (принимающей всего два значения — 0 и 1) от совокупности факторов. Построение обычной линейной регрессии для таких переменных теоретически некорректно, так как условное математическое ожидание таких переменных равно вероятности того, что зависимая переменная примет значение 1, а линейная регрессия допускает и отрицательные значения и значения выше 1. Поэтому обычно используются некоторые интегральные функции…
В психологии эвристика беглости — это ментальная эвристика, в которой, если один объект обрабатывается плавнее или быстрее другого,то этот объект имеет более высокое значение в отношении рассматриваемого вопроса. Другими словами, чем более умело или изящно идея передается, тем вероятней, что её следует рассматривать серьезно, независимо от того, логична она или нет.
Субъективная вероятность — степень личной веры агента (субъекта) в возможность наступления некоторого события.
Модель отказов (англ. fault model) представляет собой инженерную модель конструкции или оборудования, которое может работать неправильно. Исходя из модели, разработчик или пользователь могут предсказать последствия конкретных отказов. Модели отказов могут быть использованы практически во всех видах инженерной деятельности.
Робастность (англ. robustness, от robust — «крепкий», «сильный», «твёрдый», «устойчивый») — свойство статистического метода, характеризующее независимость влияния на результат исследования различного рода выбросов, устойчивости к помехам. Выбросоустойчивый (робастный) метод — метод, направленный на выявление выбросов, снижение их влияния или исключение их из выборки.
Приня́тие жела́емого за действи́тельное — формирование убеждений и принятие решений в соответствии с тем, что является приятным человеку, вместо апелляции к имеющимся доказательствам, рациональности или реальности.
Эффект свидетеля, эффект постороннего, синдром Дженовезе — психологический эффект, проявляющийся в том, что люди, оказавшиеся свидетелями чрезвычайной ситуации (ДТП, преступления или других), не пытаются помочь пострадавшим. Установлено, что вероятность того, что кто-нибудь из свидетелей начнёт помогать пострадавшим, тем меньше, чем больше людей станут просто стоять и смотреть. Другими словами, каждый из очевидцев считает, что помочь пострадавшим должен не он, а кто-то другой. Наоборот, единственный…
Эвристика доступности (англ. availability heuristic) — это интуитивный процесс, в котором человек «оценивает частоту или возможность события по легкости, с которой примеры или случаи приходят на ум», т. е. легче вспоминаются. При подобной оценке человек полагается на ограниченное количество примеров или случаев. Это упрощает комплексную задачу оценки вероятности и прогнозирования значимости события до простых суждений, основанных на собственных воспоминаниях, поэтому такой процесс является необъективным…
Шкала Ликерта, или (неверно) Лайкерта (англ. Likert scale (/ˈlɪkərt/ ), шкала суммарных оценок) — психометрическая шкала, которая часто используется в опросниках и анкетных исследованиях (разработана в 1932 году Ренсисом Ликертом). При работе со шкалой испытуемый оценивает степень своего согласия или несогласия с каждым суждением, от «полностью согласен» до «полностью не согласен». Сумма оценок каждого отдельного суждения позволяет выявить установку испытуемого по какому-либо вопросу. Предполагается…
Слепота́ невнима́ния (англ. Inattentional Blindness) или Перцепти́вная слепота (англ. Perceptual blindness), также часто неточно переводится как ложная слепота) — это психологическая неспособность обращать внимание на какой-либо объект, которая не относится к проблемам со зрением и носит исключительно психологический характер. Явление также может быть определено как неспособность индивида увидеть неожиданно возникший в поле зрения раздражитель.
Случайность имеет множество применений в области науки, искусства, статистики, криптографии, игр, азартных игр, и других областях. Например, случайное распределение в рандомизированных контролируемых исследованиях помогает ученым проверять гипотезы, а также случайные и псевдослучайные числа находят применение в видео-играх, таких как видеопокер.
Подробнее: Применения случайности
Коэффициент Байеса — это байесовская альтернатива проверке статистических гипотез. Байесовское сравнение моделей — это метод выбора моделей на основе коэффициентов Байеса. Обсуждаемые модели являются статистическими моделями. Целью коэффициента Байеса является количественное выражение поддержки модели по сравнению с другой моделью, независимо от того, верны модели или нет. Техническое определение понятия «поддержка» в контексте байесовского вывода дано ниже.
Склонность к подтверждению своей точки зрения или предвзятость подтверждения (англ. confirmation bias) — тенденция человека искать и интерпретировать такую информацию или отдавать предпочтение такой информации, которая согласуется с его точкой зрения, убеждением или гипотезой.
Дифференциальная приватность — совокупность методов, которые обеспечивают максимально точные запросы в статистическую базу данных при одновременной минимизации возможности идентификации отдельных записей в ней.
Пять почему — техника, используемая для изучения причинно-следственных связей, лежащих в основе той или иной проблемы. Основной задачей техники является поиск первопричины возникновения дефекта или проблемы с помощью повторения одного вопроса — «Почему?». Каждый последующий вопрос задаётся к ответам на предыдущий вопрос. Количество «5» подобрано эмпирическим путём и считается достаточным для нахождения решения типичных проблем.
Выявленное предпочтение — предпочтение, информация о котором получена в результате наблюдения за поведением экономического агента. Концепция выявленных предпочтений — это один из методов моделирования потребительского поведения в условиях определённости, который был предложен в 1938 году американским экономистом Полом Самуэльсоном. Метод основан на том, что у агентов имеются определённые устойчивые предпочтения, в соответствии с которыми они осуществляют выбор.
Подробнее: Выявленные предпочтения
Задача о разорении игрока — задача из области теории вероятностей. Подробно рассматривалась российским математиком А. Н. Ширяевым в монографии «Вероятность».
Семплирование по Гиббсу — алгоритм для генерации выборки совместного распределения множества случайных величин. Он используется для оценки совместного распределения и для вычисления интегралов методом Монте-Карло. Этот алгоритм является частным случаем алгоритма Метрополиса-Гастингса и назван в честь физика Джозайи Гиббса.
Закон необходимого разнообразия (англ. The Law of Requisite Variety) — кибернетический закон, сформулированный Уильямом Россом Эшби и формально доказанный в работе «Введение в кибернетику».
Нулевая гипотеза — принимаемое по умолчанию предположение о том, что не существует связи между двумя наблюдаемыми событиями, феноменами. Так, нулевая гипотеза считается верной до того момента, пока нельзя доказать обратное. Опровержение нулевой гипотезы, то есть приход к заключению о том, что связь между двумя событиями, феноменами существует, — главная задача современной науки. Статистика как наука даёт чёткие условия, при наступлении которых нулевая гипотеза может быть отвергнута.
В теории информации теорема Шеннона об источнике шифрования (или теорема бесшумного шифрования) устанавливает предел максимального сжатия данных и числовое значение энтропии Шеннона.
Эффе́кт телеско́па — это понятие в когнитивной психологии, означающее временное смещение события, при котором люди воспринимают события, произошедшие недавно более отдаленными, а события, которые случились давно — более близкими. Вначале этот эффект был известен, как «обратный телескоп» (события, являющиеся новыми для определённого периода времени) и уже позже — «прямой телескоп» (события, являющиеся старыми для определённого периода времени). Между «обратным» и «прямым» телескопом существует точка…
Отношение шансов — характеристика, применяемая в математической статистике (на русском обозначается аббревиатурой «ОШ», на английском «OR» от odds ratio) для количественного описания тесноты связи признака А с признаком Б в некоторой статистической популяции.
Игровое заблуждение (англ. Ludic fallacy) — когнитивное искажение, которое выражается как злоупотребление играми и моделями для моделирования реальных ситуаций. Термин введен американским экономистом ливанского происхождения Нассимом Талебом в изданной в 2007 году книге «Чёрный лебедь. Под знаком непредсказуемости». Название ошибки происходит от латинского слова ludus — «игра».
Новостные ценности, также называемые новостными критериями, определяют охват освещения новости средствами массовой информации, а также интерес, проявляемый к новости аудиторией. Новостные ценности не универсальны и могут значительно отличаться в зависимости от культур. На Западе решения о выборе и приоритете тех или иных событий для освещения принимаются редакторами, которые, в свою очередь, опираются на опыт и интуицию. Однако исследования, проведенные Дж. Галтунг и М. Руж показали: существуют факторы…
Реактивное сопротивление — мотивационное состояние, возникающее в ситуации, когда какое-либо внешнее условие (другой человек, предложение, или правило) ограничивает свободу или создает угрозу ограничения проявлений индивида. Главная задача такого поведения — восстановление утраченной или ограниченной свободы.
«Проклятие знания» (англ. curse of knowledge) — одно из когнитивных искажений в мышлении человека (см. их список); термин, предложенный психологом Робином Хогартом для обозначения психологического феномена, заключающегося в том, что более информированным людям чрезвычайно сложно рассматривать какую-либо проблему с точки зрения менее информированных людей.
Алгоритм Петерсона — алгоритм параллельного программирования для взаимного исключения потоков исполнения кода, разработанный Гарри Петерсоном в 1981 г. Хотя изначально был сформулирован для 2-поточного случая, алгоритм может быть обобщён для произвольного количества потоков. Алгоритм условно называется программным, так как не основан на использовании специальных команд процессора для запрета прерываний, блокировки шины памяти и т. д., используются только общие переменные памяти и цикл для ожидания…
Двоичная, бинарная или дихотомическая классификация — это задача классификации элементов заданного множества в две группы (предсказание, какой из групп принадлежит каждый элемент множества) на основе правила классификации. Контекст, в котором требуется решение, имеет ли объект некоторое качественное свойство, некоторые специфичные характеристики или некоторую типичную двоичную классификацию, включает…
Фидуциальный вывод (от лат. fides: вера, доверие), как разновидность статистического вывода, был впервые предложен сэром Р. Э. Фишером.
«Ничто так не обманчиво, как слишком очевидные факты», – справедливо считал Шерлок Холмс. Чем очевиднее факты, чем подробнее статистика, тем проще обмануть с ее помощью и тем устойчивее основанные на ней заблуждения. GURU рассказывает о приемах, которые могут использоваться для такого манипулирования, а также о тех ошибках, которые мы совершаем при интерпретации фактов, будь то статистика или события в нашей жизни. В конце статьи вас ждет небольшой список книг, которые рассказывают о наших заблуждениях, их причинах, о том, как выпутываться из паутины данных и их неверной интерпретации.
Анастасия Небольсина
Филипп Стеркин
– Но это факт?
– Нет, это не факт.
Это гораздо больше, чем факт.
Так оно и было на самом деле.
«Тот самый Мюнхгаузен»
Нет ничего проще, чем превратить то, что было на самом деле, в «факт». Способов исказить информацию и придать лжи налет достоверности существует великое множество:
— на этапе подбора данных,
— их подачи
— и интерпретации.
Снятие сливок
«На удочку насаживайте ложь и подцепляйте правду на приманку», – наставлял Полоний в «Гамлете». Это, пожалуй, базовый принцип манипулирования с помощью данных. Так, например, в прошлом табачные компании, ссылаясь на подробнейшие исследования, доказывали, что курение не вредно для здоровья, а то и полезно. Они использовали примитивный способ манипулирования, который называется cherry picking (снятие сливок), или «снятие сливок»: подобрать лишь те факты, которые подтверждают позицию, и скрыть те, которые опровергают ее.
Вот еще один пример. Взгляните на График 1: кривая роста средней температуры в России не выглядит угрожающе. Но проблема потепления выглядит куда более серьезной и очевидной на Графике 2.
Источник: Всемирный банк
Для борьбы с таким манипулированием стоит собирать информацию из разных (и конечно, достоверных) источников. И изучать данные с разных сторон, ведь сама по себе цифра мало что расскажет о происходящем. Так, рост доходов после вычета инфляции может превратиться в их падение. Сильный рост показателя за год может оказаться как ускорением, так и замедлением динамики, и даже сравнение с прошлым годом порой малоинформативно, например, замедление может быть возвратом к норме после бурного восстановительного роста. Рост расходов федерального бюджета, скажем, на образование может ничего не сказать об изменении политики государства: нужно смотреть динамику этих расходов, изменение их доли в бюджете, сравнить с ВВП, проверить, не связано ли это с новым распределением полномочий между федеральным бюджетом и региональными. Сильное изменение показателя может вводить в заблуждение, если не взглянуть на абсолютные показатели. Например, в январе просроченная задолженность по зарплате в России выросла почти на четверть, но она в целом невелика – всего 798,9 млн руб.
Правда, количество данных далеко не всегда переходит в качество выводов. Мы все жертвы собственных когнитивных искажений, например предвзятости подтверждения – нам проще отбирать факты, соответствующие нашим убеждениям, чем менять их (об этом рассказывала в «Экономике на слух» выпускница РЭШ Ксения Паниди из НИУ ВШЭ).
Ошибка выжившего
Другое распространенное заблуждение на этапе отбора данных – ошибка выжившего. Термин очень точно передает смысл ошибки. Ее суть описал еще Марк Туллий Цицерон, рассказывая о древнегреческом софисте Диагоре Мелосском, прозванном Безбожником. Ему пытались доказать, что боги не пренебрегают людьми, поскольку в храмах хранится множество табличек тех, кто выжил в бурю. «Так-то оно так, – ответил Диагор, – только здесь нет изображений тех, чьи корабли буря потопила и они сами погибли в море».
Иными словами, картина может быть неполной просто потому, что до нас дошла лишь часть данных. Насколько важно делать такую поправку, показывает история времен Второй мировой войны. Пытаясь понять, какие части самолета нужно укрепить, американские инженеры изучали, где у вернувшихся из боя машин больше всего пробоин. Математик Абрахам Вальд предложил противоположный подход: если самолет долетел, значит, повреждения некритические, и укреплять нужно те места, где пробоин нет.
Примеров ошибки выжившего вокруг нас множество. Мы судим об успехе отрасли по результатам выживших компаний, не обращая внимания на обанкротившиеся. Инвесторы, вдохновляясь историями успеха, начинают активно спекулировать, не задумываясь о том, сколько людей разорилось на этом пути. Пример в лекции о психологических ловушках на финансовых рынках приводил научный руководитель РЭШ, профессор Университета Помпеу Фабра Рубен Ениколопов: в средней доходности ETF не учитывается, что какие-то фонды могли просто закрыться.
Смещенный отбор
Представьте, что вы изучаете эффективность никотиновых пластырей, помогающих бросить курить. Вы набираете добровольцев, рассказывая им о сути эксперимента, и делите их на две группы: половине даете изучаемый образец, половине – пластырь с плацебо. Через какое-то время вы проверяете, сколько человек из каждой группы бросило курить. Разница между группами оказалась небольшой. Значит ли это, что толку от пластыря немного? Вовсе не обязательно. Полагаясь на результаты такого эксперимента, вы можете допустить ошибку. Ведь если человек захотел участвовать в исследовании пластырей, вероятно, он уже хочет бросить курить, возможно, поэтому разница между группами и оказалась невелика. Такой смещенный отбор (selection bias) означает, что выборка не является репрезентативной. Ровно так же нерепрезентативными могут быть данные статистики или опросов. Например, нерепрезентативны могут быть опросы бизнеса, если в них представлены и средние, и крупные компании. Ведь они сталкиваются с достаточно разными трудностями.
Игнорирование базового уровня
Люди склонны игнорировать обобщенную статистику и фокусироваться на отдельном случае. К каким ошибкам приводит такое игнорирование контекста, показали психологи Даниэль Канеман и Амос Тверски. Участникам эксперимента они дали описание студента по имени Том и спросили, на кого он учится, попросив выбрать варианты из списка образовательных программ в порядке убывания вероятности. В 1970-е, когда проводился эксперимент, на гуманитарных факультетах училось больше студентов, чем на факультете компьютерных наук. Но участники эксперимента решили, что умный интроверт Том, скорее всего, компьютерщик. Стереотипы перевесили статистику, согласно которой Том должен был оказаться скорее гуманитарием.
Игнорирование базового уровня часто ведет к неточной оценке вероятности случайных событий. Например, разовое падение или рост акций не означает изменения тренда.
Магия графика
Вводить в заблуждение может и подача материала. Классический прием – использовать для этого графики. Они «не содержат прилагательных или наречий, разрушающих иллюзию объективности», писал Даррелл Хафф в изданной еще в 1954 г. книге «Как лгать со статистикой». Для этого используются самые разные приемы, например, изменение шкалы или масштаба графика может увеличить или уменьшить наклон кривой и восприятие изменений показателя. Так, начав шкалу (вертикальную ось) не с нуля, можно сделать так, что даже самые незначительные изменения будут выглядеть существенными.
«После» не значит «вследствие»
Именно так звучит лозунг революции достоверности – как отделить причинно-следственные связи от корреляций. Люди в силу самой эволюции, пытаясь познать мир, ищут связь между случайными событиями. Но это удивительное свойство нашего мозга одновременно делает нас жертвами ошибочных суждений, стереотипов, теорий заговора, помогает манипулировать нами. Поэтому, например, люди склонны к суевериям – сколько студентов считает, что успешно сдали экзамен благодаря тому, что положили монетку в обувь или покричали с зачеткой в руках.
Такие случайные совпадения называют ложной корреляцией. Например, графики количества смертей в бассейнах и фильмов с актером Николасом Кейджем показывают почти идеальную корреляцию, хотя никакой связи между этими двумя показателями, разумеется, нет. Политики часто приписывают себе достижения в экономике, хотя причина может быть совсем другой, допустим благоприятная мировая конъюнктура. Рост количества раскрытых преступлений после увеличения численности правоохранительных органов может объясняться не усилением борьбы с преступностью, а ее ростом. (О том, как отличать причинно-следственные связи, рассказывали в подкасте «Экономика на слух» профессора РЭШ Сергей Измалков и Ольга Кузьмина, а о ложных корреляциях – профессор Университета Дьюка, выпускница РЭШ Анна Быховская.)
Ошибка игрока
Вы кидаете монету, и 15 раз подряд выпадает решка. Растет ли с каждым разом вероятность того, что выпадет орел? Большинство людей уверенно скажут: «Конечно». И совершат ошибку игрока – если что-то происходит чаще обычного, люди верят, что в будущем вероятность этого события уменьшится, и наоборот. Например, если фондовый рынок падает какое-то время, инвесторы начинают верить, что скоро он начнет расти. Не желая фиксировать убытки и надеясь отыграться, они слишком долго держатся за акции, которые обесцениваются, из-за чего их потери только растут.
Регрессия к среднему
Это еще один пример, показывающий, как важно делать поправку на фактор случайности. Серьезные и случайные колебания со временем будут стремиться к среднему значению. Примеров ошибок, которые мы совершаем, не учитывая регрессию к среднему, невероятное множество. Об одной из них рассказывает Даниэль Канеман в книге «Думай медленно, решай быстро».
Инструкторы военных летчиков, которым он читал лекции, рассказывали, что после похвалы за особенно мягкую посадку летчики сажали самолет хуже, а после резкой критики за грубую посадку следующая попытка оказывалась лучше. Из этого они делали вывод о пользе критики. Канеман понял, что инструкторы не учитывают регрессии к среднему: дело не в критике или похвале, а в том, что после неудачной попытки результат обычно улучшается, и наоборот. «Непонимание эффекта регрессии к среднему ведет к переоценке эффективности наказания и недооценке эффективности поощрения, – пишет Канеман. – В силу регрессии поведение, вероятнее всего, улучшится после наказания и ухудшится после награды. <…> в силу чистой случайности человека чаще всего награждают за наказание других и наказывают за их поощрение».
Парадокс Симпсона
И завершим наш список классическим статистическим парадоксом Симпсона: если для двух групп данных характерна одинаковая зависимость, то при их объединении характер зависимости может изменяться. Допустим, у группы женщин и мужчин диагностировали одинаковое заболевание. Чтобы проверить эффективность лекарства, его давали пациентам, а затем сравнивали их состояние с контрольной группой, которой давали плацебо. Допустим, 700 мужчин среди принимавших лекарство выздоровели, 800 – нет, а в контрольной группы – 80 и 130 человек соответственно. Среди принимавших лекарство женщин поправилось 150 из 220, в контрольной группе – 400 из 680. Казалось бы, препарат доказал эффективность – ведь доля выздоровевших среди принимавших лекарство выше, чем в контрольной группе. Вовсе нет! Если не делить пациентов на мужчин и женщин, вывод изменится: доля выздоровевших среди принимавших лекарство будет ниже, чем в контрольной группе. Дело в том, что группы не сбалансированы: в эксперименте с мужчинами контрольная группа относительно мала, а в эксперименте с женщинами – тестовая группа значительно меньше контрольной. Это искажает средние результаты. Поэтому стоит быть осторожным, если вы видите обобщение результатов для отдельных групп и их распространение на более широкую аудиторию.
И в завершение несколько книг, которые рассказывают о том, как статистика может нас обманывать и как использовать ее, чтобы не обмануться. В одной из следующих статей мы подробнее расскажем о них.
— «Как лгать со статистикой», Даррелл Хафф
— «Просвещение сегодня: в защиту разума, науки, гуманизма и прогресса», Стивен Пинкер
— «Фактологичность», Ханс Рослинг при участии Улы и Анны Рослинг
— «Как устроен мир на самом деле», Вацлав Смил
— «Цифры не лгут», Вацлав Смил
— «The Book of Why: The New Science of Cause and Effect» (Почему? Новая наука о причинно-следственной связи), Джуда Перл, Дана Маккензи
Вероятностная
природа мира
Вероятность
и неопределенность. Шансы. Законы случая.
Степени уверенности
Факторы,
влияющие на суждения о вероятности и
неопределенности Поиски смысла.
Чрезмерная уверенность
Использование
законов вероятностей
Игры,
основанные на случайности. Вычисление
вероятности событий с несколькими
возможными исходами. Ошибка при конъюнкции
— применение правила «и». Совокупный
риск — применение правила «или».
Ожидаемые
значения
Субъективная
вероятность Ошибка игрока
Игнорирование
базового уровня
Принятие
вероятностных решений
Прогнозы
на основе объединения информации
Нерегрессивные суждения
Риск
Оценка
риска. Необъективность при оценке риска
Использование
статистики и возможные ошибки, возникающие
при этом
О
среднем. Точность. Значимые различия.
Экстраполяция. Статистические мистификации
Применение
алгоритма
Краткий
итог главы
Термины
для запоминания
При
рассмотрении дела «Народ против Коллинс»
в 1968 г. присяжные столкнулись с трудной
задачей (цит. по: Arkes Hammond, 1986). Мужчина,
ставший жертвой ограбления, не мог
опознать напавшего на него человека.
Он вспомнил лишь то, что грабителем была
блондинка с волосами, завязанными в
«конский хвост», после ограбления
уехавшая на желтом автомобиле с откидным
верхом, которым управлял негр с усами
и бородой. Внешность подозреваемой
соответствовала этому описанию, но
могли ли присяжные быть уверены «без
обоснованных сомнений», что подсудимая
была грабительницей? Она была блондинкой
и часто завязывала волосы в «конский
хвост». Среди ее знакомых был негр с
усами и бородой, владевший желтым
автомобилем с откидным верхом. Если бы
вы были защитником, то вы бы подчеркивали,
что потерпевший не может узнать в этой
женщине грабителя. Какую стратегию вы
бы выбрали, если бы были обвинителем?
Обвинитель
пригласил специалиста по теории
вероятностей, который сообщил суду, что
вероятность совпадения всех этих условий
(блондинка плюс прическа «конский хвост»
плюс бородатый друг-негр плюс наличие
у него желтого автомобиля с откидным
верхом и так далее, при условии
независимости всех этих характеристик)
равна одной двенадцатимиллионной.
Специалист заявил суду, что это сочетание
характеристик столь необычно, что
присяжные могут быть уверены «без
обоснованных сомнений» — перед ними
грабительница. Присяжные вынесли вердикт
«виновна».
Вероятностная
природа мира
Теория
вероятностей — это всего лишь здравый
смысл, подтвержденный вычислениями.
Лаплас
(1749-1827)
Как
видно из приведенного выше примера,
юристы признают, что в юридических
вопросах мы никогда не имеем дела с
абсолютной определенностью. Вместо
этого мы оперируем различными степенями
неопределенности. Присяжных инструктируют
выносить решение о виновности подсудимого
в преступлении, когда они уверены в этом
«без обоснованных сомнений». Такая
норма принята потому, что всегда остаются
некоторые минимальные сомнения в
виновности осужденного. При решении
вопроса о виновности или невиновности
в гражданских делах присяжным следует
допускать другую степень сомнения. При
рассмотрении гражданских дел они должны
выносить вердикт «виновен», когда такое
решение поддерживают «преобладающие
доказательства». Таким образом, при
рассмотрении уголовных и гражданских
дел присяжным полагается оперировать
двумя различными уровнями неопределенности.
При вынесении решения о виновности
обвиняемого в уголовном преступлении
им необходима большая уверенность, чем
в случае гражданского дела.
Теория
вероятностей изучает вероятность
и
неопределенность. Она играет решающую
роль во всех профессиях и при принятии
большинства повседневных решений. Все
медицинские диагнозы и назначения вида
лечения по своей природе являются
вероятностными, так же как и деловые
решения, прием в колледжи, реклама и
научные исследования. Законы вероятности
являются краеугольным камнем науки;
ими руководствуются при интерпретации
всех научных открытий. Многие из наших
развлечений также основаны на вероятностных
принципах, особенно игра на скачках и
карточные игры. Каждый раз, принимая
решение взять с собой зонтик, вложить
деньги в ценные бумаги, купить страховой
полис или поставить на лошадь на скачках,
вы выносите вероятностное суждение.
Как говорится в одной английской
поговорке, кроме неизбежности смерти
и уплаты налогов, очень немногие вещи
в жизни известны наверняка. Поскольку
мы живем в вероятностном мире, для
критического мышления необходимо
понимание законов вероятностей.
Существуют
веские доказательства того, что обучение
использованию законов вероятности
способствует совершенствованию умения
правильно оперировать вероятностными
величинами. Проведя исследование
использования статистического мышления
при повседневных рассуждениях, ученые
пришли к выводу, что «это исследование
ясно показало, что изучение статистики
может способствовать применению ее
правил в суждениях о повседневной жизни,
причем в совершенно ином контексте по
сравнению с контекстом обучения» (Fong
et al., 1986, p. 280). Другими словами, несмотря
на то, что мыслительные навыки,
представленные в этой главе, требуют
знания основ арифметики, а также
сосредоточенности и труда, если вы
поработаете над предложенными задачами,
ваше мышление, вероятно, станет
совершеннее.
Вероятность
и неопределенность
Если
у вас неверные факты, но безупречная
логика, ваши заключения неизбежно будут
ложными. Поэтому, делая логические
ошибки, вы получаете хотя бы случайный
шанс прийти к правильному заключению.
Теорема
Кристи—Дэвиса (источник неизвестен,
взято из календаря)
Если
я подброшу «честную» монету (т.е. монету,
для которой выпадение орла и решки
одинаково вероятно) и попрошу вас угадать
вероятность выпадения орла, вы скажете,
что она равна 50% (или 0,50). Это означает,
что ожидается, что монета будет падать
орлом вверх в половине случаев. Несмотря
на то, что слово вероятность
используется
в нескольких различных значениях, в
контексте данной главы полезнее всего
будет такое определение: вероятностью
называется
отношение числа способов, которыми
можно прийти к определенному исходу
(мы называем его успехом), к числу
возможных исходов (когда все они
равноправны). Это мера того, насколько
часто мы ожидаем появления этого события
в достаточно протяженном интервале
времени. Слово «успех» может показаться
странным в данном контексте, но вы можете
считать, что это исход, в котором вы
заинтересованы. В нашем примере успех
— это выпадение орла. Монета может
упасть орлом вверх только одним способом,
поэтому число способов, которыми можно
прийти к успеху, равно 1. Каковы все
возможные исходы подбрасывания монеты?
Монета может упасть или орлом вверх,
или решкой вверх. (Я никогда не видела,
чтобы монета приземлялась на ребро, а
также никогда не видела, чтобы птица
поймала монету в воздухе и унесла ее,
поэтому я не рассматриваю такие исходы
в качестве возможных.) Таким образом,
существует только два возможных исхода,
каждый из которых равноправен. Чтобы
подсчитать вероятность выпадения орла,
поделите количество способов выпадения
орла (1) на число возможных исходов (2) и
вы получите ½, ответ, который был вам
уже известен. Поскольку некоторым людям
легче воспринимать проценты, чем дроби,
иногда ½ заменяют на 50%. Таким образом,
вы можете ожидать, что орел будет выпадать
в 50% случаев, в достаточно
протяженном интервале времени (т.
е., в данном случае при большом числе
попыток).
Давайте
рассмотрим другой пример. Какова
вероятность выпадения пяти при одном
броске игральной кости? Поскольку 5
может выпасть только одним способом,
числитель вероятностной дроби будет
равен 1. Игральная кость — это шестигранный
куб; поэтому при броске существует шесть
возможных исходов. Если кость не
«утяжелена» — т.е. может упасть любой
стороной вверх с одинаковой вероятностью,
— вероятность выпадения пяти равна 1/6
или примерно 17%. (302:)
Какова
вероятность выпадения четного числа
при одном броске «честной» кости? Чтобы
найти ее, рассмотрим количество способов,
которыми можно прийти к успеху. Может
выпасть 2, 4 или 6 — других возможных
четных чисел нет. Таким образом, к успеху
можно прийти тремя способами из шести
равновероятных исходов, поэтому
вероятность выпадения четного числа
равна 3/б
= ½.
Какова
вероятность выпадения целого числа
меньше семи? Если бы меня попросили
поставить на это событие, я бы поставила
свой дом, своих детей и все свои скромные
сбережения. Другими словами, я ручаюсь,
что это обязательно произойдет. Давайте
выясним, почему. Количество способов,
которыми при одном броске кости может
выпасть число меньше семи, равно шести
(1, 2, 3, 4, 5 или 6), и число возможных исходов
равно шести. Таким образом, вероятность
равна 6/6
или 1. Когда вероятность равна 1 (или
100%), событие должно произойти; оно
достоверно.
Какова
вероятность выпадения восьми при одном
броске кости? Я бы снова поставила все,
что имею, но только против того, что это
произойдет. Количество способов, которыми
может выпасть 8, равно 0. Следовательно,
вероятность этого события равна нулю;
это событие невозможно. Такая ситуация
также отражает полную определенность.
Значения вероятности находятся в
диапазоне от 0 (событие не может произойти)
до 1 (событие должно обязательно
произойти). Значения вероятности, близкие
к 0 или 1, характеризуют события, которые
почти точно не произойдут или почти
точно произойдут, в то время как значения,
близкие к 0,5 (50%), отражают максимальную
неопределенность, поскольку равновероятны
оба исхода, и поэтому нет оснований
предсказывать наступление одного из
них. Эти соотношения иллюстрирует рис.
7.1.
Шансы
Часто
удобно обсуждать вероятности, пользуясь
понятием «шансы».
Допустим,
ваш друг говорит, что шансы футбольной
команды его школы победить команду
вашей школы равны 1 к 3. Он ожидает, таким
образом, что если бы было проведено
четыре игры, то его команда выиграла бы
три из них. Обычно знатоки спорта
(спортивные комментаторы, редакторы
спортивных газет и просто болельщики)
выражают степень своей уверенности в
исходе спортивных состязаний, пользуясь
терминологией шансов. (Ставки, которые
принимаются на скачках и матчах по
боксу, отражают количество денег,
поставленное на каждого претендента,
и, следовательно, их смысл несколько
отличается от описанного выше.)
Чтобы
перевести шансы в вероятности, сложите
два приведенных числа (например, 3:1 = 4),
возьмите первое число в качестве
числителя, а полученную сумму в качестве
знаменателя (3/4)
и вы получите эквивалентную вероятность.
Законы
случая
Самыми
важными в последнем разделе были слова
«в достаточно протяженном интервале
времени». Кроме особых случаев, когда
вероятность исхода равна 0% или 100%, мы
не можем с определенностью сказать, что
произойдет в каждый конПример
Рис
7.1. Вероятность и достоверность.
кретный
момент. Бросая кость, я не знаю, выпадет
ли 5, но если я буду бросать «честную»
кость много-много раз, я знаю, что 5 будет
выпадать примерно в 17% случаев. Я не
знаю, при каких именно бросках будет
выпадать 5, но я приблизительно знаю,
сколько испытаний окончатся выпадением
5, если я буду бросать кость в течение
долгого времени. Это важно отметить.
Когда мы говорим о законах
случая (или
законах вероятностей), мы имеем в виду
способность предсказывать долю или
процент попыток, которые будут иметь
данный исход. При большом количестве
попыток я могу очень точно предсказать
количество появлений данного исхода,
но я не могу знать, какие именно попытки
дадут этот исход. Это означает, что я
могу делать хорошие «долгосрочные
прогнозы» и плохие «краткосрочные»
прогнозы.
Давайте
разберемся в этих различиях на примере
страхования. Когда вы страхуете свою
жизнь (или что-либо еще), вы заключаете
пари со страховой компанией. Вы
соглашаетесь ежегодно платить страховой
компании определенную сумму. Она
соглашается выплатить вашим наследникам
определенную сумму, когда вы умрете.
Существует много различных видов полисов
страхования жизни, но в наших целях нам
достаточно рассмотреть простейший из
них. Для демонстрации статистических
идей я воспользуюсь простыми числами
— в реальной жизни затраты и выплаты
не такие, как в этом примере. Предположим,
что вам 30 лет и вы согласились платить
страховой компании 1000 долларов в год.
Когда вы умрете, ваши наследники получат
20 000 долларов. Вы ставите на то, что умрете
в довольно молодом возрасте (пари,
которое вы надеетесь проиграть), так
что вы выплатите компании лишь небольшую
часть суммы, которую затем получат ваши
наследники. Если вы умрете, не дожив до
50 лет, то вы выиграете. Если не обращать
внимания на такие усложняющие вычисления
факторы, как инфляция и проценты с
капитала, то, скончавшись в молодом
возрасте, вы заплатите меньше тех 20 000
долларов, которые получат ваши наследники.
С другой стороны, страховая компания
выиграет, если вы доживете до глубокой
старости. Если вы умрете в возрасте
семидесяти лет, то заплатите компании
40 000 долларов, а ваши близкие получат
только 20 000. (304:)
Страховые
компании зарабатывают деньги на законах
случая (законах вероятностей). Никто не
знает, когда умрете вы или кто-либо
другой, но страховые компании знают
примерное число тридцатилетних людей
(возраст, когда вы купили свой полис),
которые умирают, не дожив до пятидесяти.
Таким образом, хотя никто не может точно
предсказать, в каком возрасте умрет тот
или иной человек, мы можем пользоваться
законами случая для прогнозирования
числа людей, которые доживут до того
или иного конкретного возраста.
Степени
уверенности
Вероятностями
иногда пользуются для выражения степени
уверенности в появлении какого-либо
исхода. Это второе определение термина
«вероятность».
Например,
если вы поступаете на работу и уверены,
что интервью прошло хорошо, вы можете
оценить вероятность того, что вас примут
на эту работу, как 80%. Это значение
вероятности не было получено путем
математических вычислений, т.е. делением
числа способов, которыми можно прийти
к успеху, на общее число возможных
исходов. Вместо этого данное значение
отражает степень вашей уверенности в
том, что вас примут на работу. Оно означает
уровень уверенности в пределах от
среднего до высокого. Если другой
человек, проходивший интервью для
получения того же места, считает, что
его шансы получить работу равны 50%,
очевидно, что он менее вас уверен в
положительном исходе.
Особенно
часто вероятности используются для
выражения степени уверенности в
определенном исходе в предвыборное
время. Политические обозреватели часто
приписывают вероятностные значения
вероятности избрания того или иного
кандидата. Если обозреватель прогнозирует,
что шансы кандидата победить равны 30%,
это означает, что, хотя этот кандидат
может победить на выборах, обозреватель
считает, что скорее всего он проиграет.
Вероятностные значения — удобный способ
количественного выражения уверенности
в исходе.
Факторы,
влияющие на суждения о вероятности и
неопределенности
Шансы
против того, что в самолете находится
бомба, равны миллион к одному, а против
того, что в самолете две бомбы — миллион
миллионов к одному. В следующий раз,
когда вы полетите на самолете, возьмите
с собой бомбу, чтобы уменьшить шансы ее
появления в самолете.
Бенни
Хилл (цит. по Byrn, 1988, р. 349)
Существует
обширная литература, подтверждающая
тот факт, что большинство людей ошибается
при оценке вероятности. Мы не можем
постичь природу случайностей и из-за
этого имеем весьма неверные представления
о вероятностях и (305:) неопределенности
( Garfield & Ahlgren, 1988). Это не удивительно,
если учесть, что мы можем пользоваться
вероятностями только для понимания
«долгосрочных» событий, а большая часть
нашего повседневного опыта основана
на краткосрочных наблюдениях. Например,
существует большое количество данных,
показывающих, что, в среднем, курящие
люди умирают в более раннем возрасте,
чем те, кто не курит (Paulos, 1994). Большинство
из нас не может открыть для себя эту
связь, потому что мы не знаем, в каком
возрасте умирает большая часть курящих,
но мы знаем одного или двух человек,
которые выкуривали по две пачки в день
и дожили до 90 лет. Такого рода личный
опыт заставляет нас сомневаться в
статистических данных, собранных в
результате наблюдений за многими людьми.
Мысль, которая проводится уже в нескольких
главах моей книги, заключается в том,
что личный опыт не является веским
основанием для вынесения многих суждений
о мире. Как вы помните из предыдущей
главы, обучение на опыте дорого обходится.
Поиски
смысла
Мне
кажется, жить — значит объяснять,
подтверждать и находить соответствие
между многими различными исходами,
качествами и причинами.
Джилович
( Gilovich, 1991, р. 22)
Мы
ищем причины событий, происходящих с
нами и с другими людьми, но большинство
из нас редко учитывает случайный характер
многих событий. Мы ищем во всем
закономерности и смысл, и часто это
приносит пользу, но может привести и к
необоснованным убеждениям. Рассмотрим,
например, такую историю, случившуюся
на самом деле: ко мне в кабинет зашел
студент, чтобы поговорить со мной. Он
рассказал, что с ним только что произошла
«поразительная вещь». Он учился в группе,
где было 15 студентов. Каждый из них
должен был сделать устный доклад, а
порядок выступления студенты определяли,
вытягивая номера из коробки. «Догадайтесь,
кому достался номер 1?» — возбужденно
спросил он. Я догадалась, что ему. «Точно,
а вы знаете, какова вероятность этого?»
Я знала, что эта вероятность равна 1/15
или примерно 7%. «Разве это не поразительно?
Из 15 человек в группе я вытянул номер
1. Как вы это объясните?» Я приписала
этот не столь уж поразительный исход
случаю; в конце концов, кто-то же должен
был вытянуть номер 1. Он был уверен, что
это что-то означает; может быть, вмешались
«боги» или у него «испортилась» карма
(что бы это ни означало). Он искал причины,
которая объяснила бы это событие, и не
учитывал возможность простой «случайности».
Чрезмерная
уверенность
В
вероятностных событиях, по определению,
всегда присутствует некоторая
неопределенность. Тем не менее исследования
показывают, что люди испытывают большую,
чем следовало бы, уверенность в своих
решениях, касающихся вероятностных
событий. Рассмотрим пример, который
любит приводить Даниэл Канеман,
исследующий эту тему. Когда он и его
соавторы начинали работу над учебником
по принятию решений, они были вполне
уверены, что закончат работу в течение
года, хотя знали, что на завершение
большинства книг, подобных той, которую
они писали, требуется много лет. Они
считали, что им удастся написать книгу
быстрее, чем подсказывали «шансы». На
самом деле им потребовалось несколько
лет на завершение учебника.
Аналогичное
явление имеет место всякий раз, когда
мы обращаемся к консультантам по
инвестициям. Вероятность заработать
деньги, вкладывая их в ценные бумаги с
высоким риском, так мала, что часто
бывает выгоднее оставить деньги на
банковском счете с низким процентом
дохода. Тем не менее, многие верят, что
им удастся сделать удачное вложение,
не учитывая своих шансов на успех.
Для
исследования феномена чрезмерной
уверенности был
поставлен эксперимент, в котором людей
просили ответить на конкретные вопросы
с указанной степенью уверенности
(Kahneman &
Tversky,
1979). Попробуйте ответить на такой вопрос:
«Я на 98% уверен, что количество атомных
реакторов, работавших в 1980 г. во всем
мире, было больше __ и меньше ___». Нужно
вставить на пропущенные места числа,
которые отражают уверенность на 98%.
Исследователи обнаружили, что почти в
одной трети случаев правильный ответ
не лежал между двумя числами,
соответствующими уверенности на 98%.
(Правильный ответ на этот вопрос — 189.)
Этот результат показывает, что люди
часто ощущают глубокую уверенность,
когда для такой степени уверенности
нет оснований.
Покупали
ли вы когда-нибудь лотерейные билеты?
Знаете ли вы, каковы шансы против того,
что вы выиграете джек-пот? Законы
вероятности диктуют, что вам следует
ожидать проигрыша, но огромное количество
людей ожидает выигрыша. Недавно журнал
«Деньги» (
Money) опубликовал
вызывающие беспокойство результаты
опроса, которые говорят о том, что
примерно одинаковое число людей пытается
обеспечить свою старость, покупая
лотерейные билеты (39%) или вкладывая
деньги в ценные бумаги (43%) (Wang, 1994).
Самую
большую уверенность в неопределенных
ситуациях люди ощущают тогда, когда
верят, что могут управлять случайными
событиями. Многим специалистам по
государственным лотереям известно это
свойство человеческой натуры, и сейчас
разработана система лотерей, где
покупатель билета сам выбирает свой
номер. Люди предпочитают самостоятельно
выбирать свои номера, а не получать их
случайным образом, поскольку у них
возникает при этом иллюзия, что они
управляют событиями. Выигравший номер
все равно определяется случаем, но люди
верят, что вероятность выигрыша больше,
если они сами выбирают номера.
Использование
законов вероятностей
Мы,
почти не задумываясь, ежедневно по многу
раз пользуемся вероятностными
соотношениями Давайте начнем с одного
из немногих примеров, в которых
непосредственно приводятся значения
вероятности. Многие люди начинают каждый
день с того, что читают в утренней газете
прогноз погоды. Что вы сделаете, если
узнаете, что на сегодня вероятность
дождя равна 80%? Большинство людей
отправится на работу или в школу, захватив
с собой зонтик. Но что если дождя не
будет? Можно ли заключить, что синоптики
ошиблись? Если вероятность дождя равна
80%, то это означает, что из каждых 100 дней
с аналогичными погодными условиями 80
дней будут дождливыми. Таким образом,
вероятность дождя, как и все вероятностные
величины, основана на том, чего можно
ожидать в течение длительного времени.
Синоптики знают, что в 80 из 100 дней будет
дождь, но они не могут знать, в какие
именно дни он пойдет.
Предположим,
что вы собираетесь жениться в этот
гипотетический день и у вас запланирована
торжественная церемония на открытом
воздухе. Предположим, что в прогнозе
погоды указывался дождь с вероятностью
80%, но дождя не было. Будете ли вы считать,
что хорошая погода обусловлена чем-либо,
кроме случайности, или что отсутствие
дождя является хорошим (или плохим)
знаком для вашей свадьбы? Если вы
проинтерпретируете хорошую погоду как
сигнал небес или волю астральных тел,
то вы продемонстрируете пример только
что описанного явления — мы ищем смысла
в событиях, даже столь, казалось бы, нам
неподвластных, как погода, и редко
учитываем простые случайности.
Количество
случаев, когда мы получаем непосредственные
значения вероятности, которые для нас
уже подсчитаны, сравнительно невелико.
Одна из областей, в которых эта практика
расширяется, — это использование
медицинских информационных вкладышей,
которые помогают пациентам понять все
опасности и полезные эффекты от приема
определенного лекарства. Администрация
по пищевым продуктам и лекарствам
требует, чтобы все оральные контрацептивы
(противозачаточные таблетки) были
снабжены вкладышами со статистической
информацией о риске для здоровья,
связанном с их приемом. Чтобы прийти к
разумному решению на основе приведенной
информации, потенциальные покупательницы
противозачаточных таблеток должны
понимать смысл статистических обобщений,
которые приводятся в этих вкладышах.
Возьмем
в качестве примера следующий отрывок
из текста, вложенного в упаковку
противозачаточных таблеток: «По оценкам
врачей, одна из 2000 женщин в возрасте от
20 до 44 лет, пользующихся оральными
контрацептивами, бывает госпитализирована
в связи с нарушением свертываемости
крови. Среди женщин того же возраста,
не пользующихся этими препаратами,
ежегодно госпитализируется одна из 20
000» (Orhto Pharmaceutical Corp., 1979, p. 16). Хотя потребители
могут легко понять, что нарушение
свертываемости крови более вероятно у
тех, кто принимает таблетки, эта информация
не имеет большого практического значения,
поскольку потребителям оральных
противозачаточных средств трудно
представить себе, что такое 1 из 2000 —
много это или мало; т. е. они не могут
ответить на вопрос, опасен ли для них
прием таблеток. Два эксперимента на эту
тему ( Halpern & Blackman, 1985; Halpern et al., 1989)
показали, что для большинства людей
подобная информация почти лишена смысла.
Предположим,
вы прочитали, что риск развития болезней
сердца у потребителей оральных
противозачаточных средств в 10,5 раз
больше, чем у тех, кто ими не пользуется.
Из такой информации большинство людей
сделает вывод, что оральные контрацептивы
связаны с существенным риском развития
сердечных болезней. Предположим теперь,
что вам сообщили, что только у 3,5 женщин
из 100 000 потребителей возникают сердечные
заболевания. Вы, вероятно, поймете из
этой фразы, что применение оральных
противозачаточных средств связано с
небольшим риском. Рассмотрите «оборотную
сторону» этой информации и подумайте,
как бы вы оценили безопасность лекарства,
если бы прочитали, что у 99 996,5 женщин из
100 000 потребителей не возникнут заболевания
сердца. Не кажется ли вам, что это звучит
безопаснее? Еще один способ представления
той же самой информации — это перевести
ее в проценты. Существует лишь 0,0035%
вероятности, что у потребителей оральных
контрацептивов возникнут болезни
сердца. Большинство женщин теперь сочтет
риск, связанный с приемом противозачаточных
таблеток, незначительным.
Какое
из этих утверждений правильно? Все.
Единственное отличие между ними — это
способ представления статистической
информации, а различные способы
представления статистической информации
приводят к сильно отличающимся оценкам
безопасности ( Halpern et al., 1989). При
интерпретации статистической информации
важно иметь это в виду. Появилась
тенденция обеспечивать потребителей
статистической информацией о риске,
чтобы они могли выносить компетентные
суждения на самые разные темы — от
лечения определенного вида рака до
безопасности ядерной энергии. Хотя тема
риска в этой главе будет рассмотрена
подробнее, имейте в виду, что лучший
способ понять смысл вероятностной
величины риска — это выписать все
эквивалентные математические значения
(например, X
из
У случаев; риск возрастает во столько-то
раз; количество смертельных исходов;
количество людей, которые не умрут).
Когда одновременно необходимо сравнить
большое количество значений, полезно
воспользоваться наглядным представлением
сравнительных рисков. Во всех главах
своей книги, как вы заметили, я рекомендую
использование пространственного
представления информации (например,
круговых диаграмм при интерпретации
силлогизмов; графических организаторов
для понимания сложных текстов; древовидных
схем для принятия разумных решений).
Одним из преимуществ, которые это дает,
является уменьшение нагрузки на память
и возможность наглядно рассматривать
несколько различных вариантов.
Игры,
основанные на случайности
Америка
— страна людей, которые любят играть в
различные игры. От Лас-Вегаса до
Атлантик-Сити, во всех больших и маленьких
городах, расположенных между ними, люди
тратят огромное количество времени и
денег, играя в игры, где все зависит от
случая и искусства игрока. Многие люди
только тогда серьезно задумываются о
вероятностях, когда играют в азартные
игры.
Карты
Игра
в карты — повсеместное времяпрепровождение;
маленькие дети играют в «дурака» и
«пьяницу», а взрослые — в преферанс,
бридж, покер, очко и многие другие игры
— всех не перечислить. Неопределенность,
присущая самой природе игры в карты,
делает эту игру еще приятнее (хотя
дружеская компания и пиво с солеными
сухариками тоже играют свою роль). (309:)
Хорошие
игроки, независимо от того, в какую игру
они играют, понимают и используют законы
вероятностей. Давайте рассмотрим
определение вероятности применительно
к игре в карты. Например, какова вероятность
вытянуть наугад туза пик из полной
колоды, в которой 52 карты? Вероятность
этого события равна 1/52,
или примерно 2%, поскольку существует
только 1 туз пик и 52 возможных исхода.
Какова вероятность вытянуть туза любой
масти из полной колоды карт? Если вы до
сих пор следили за изложением материала
в этой главе, то понимаете, что ответ
равен 4/52,
или примерно 8%, поскольку в колоде из
52 карт имеется 4 туза.
Несмотря
на то, что некоторые профессиональные
картежники утверждают, что им удалось
разработать систему, которая помогает
им увеличить свои шансы на выигрыш, в
большинстве карточных игр невозможно
«обмануть случай», как бы искусен ни
был игрок. Трудно сказать, до какой
степени правдивы рассказы об удачливых
игроках в карты. Профессиональные игроки
часто любят хвастаться своими победами
и с готовностью забывают о тех случаях,
когда они проигрывали. Более того, многие
из самозваных экспертов по карточным
играм продают свои «беспроигрышные
системы». Надеюсь, что вы помните из
материала глав, посвященных рассуждениям
и анализу аргументации, что когда
«эксперт» получает выгоду от продажи
товара, его мнение становится сомнительным.
По
данным Гюнтер (Gunther, 1977), Вере Неттик
(реальное лицо) очень повезло. При игре
в бридж к ней на руки пришли все 13 бубновых
карт. Затаив дыхание, она выиграла
большой шлем, имея на руках набор карт,
который приходит лишь раз
Рис.
7.2. Какую из этих двух комбинаций карт
вы можете с большей вероятностью получить
при сдаче хорошо перетасованной колоды
карт?
в
жизни. Любой статистик немедленно укажет
на то, что каждая возможная комбинация
карт рано или поздно окажется у кого-то
на руках. Поэтому комбинация, доставшаяся
этой женщине, не более необычна, чем
любая другая, хотя, конечно, она более
запоминающаяся. Гюнтер ( Gunther, 1977) произвел
следующие расчеты.
Существует
приблизительно 635 миллиардов возможных
комбинаций карт, которые может получить
игрок при игре в бридж. Из этих комбинаций
восемь можно считать «идеальными», хотя
некоторые из них лучше других. Начнем
с того, что существует четыре идеальных
бескозырных комбинаций. Это сочетание
всех четырех тузов, всех четырех королей,
всех четырех дам и одного из четырех
валетов. Любая из этих четырех комбинаций
несомненно идеальна, поскольку все
взятки ваши. Чуть менее идеальны, в
порядке убывания, комбинации, содержащие
все пики, все черви, все бубны и все
трефы. Если из 635 миллиардов комбинаций
идеальными являются 8, то статистическая
вероятность говорит о том, что такая
комбинация может появиться в одной из
примерно 79 миллиардов попыток. Теперь
остается лишь прикинуть, сколько раз
американцы ежегодно играют в бридж и
сколько раз раздаются карты при каждой
игре. При использовании довольно
умеренных оценок получается, что в США
идеальная комбинация карт приходит на
руки к удачливому игроку в бридж примерно
один раз в три или четыре года (р. 30).
На
самом деле Гюнтер приводит заниженные
цифры, поскольку новые колоды карт
сложены по мастям в восходящем порядке,
так что одно или два «идеальных» тасования
могут привести к «идеальному» для бриджа
раскладу (Alcock, 1981). («Идеальное» тасование
происходит тогда, когда после снятия
колоды карты при тасовании ложатся
через одну из каждой половины.) И, конечно,
при этих вычислениях не учитывалась
возможность мошенничества, которое
изменяет значение вероятности, поскольку
все возможные комбинации карт перестают
быть равновероятными. Рассмотрите две
комбинации карт, изображенные на рис.
7.2. Если карты раздаются случайным
образом, то равновероятны все возможные
их комбинации. Эта тема также обсуждается
в главе 8.
Рулетка
Рулетку
часто считают аристократической игрой.
Странно, что она завоевала такую
репутацию, поскольку эта игра основана
на чистой случайности. В отличие от
большинства карточных игр, искусства
игры в рулетку не существует. Как вам,
вероятно, известно, при игре в рулетку
маленький шарик катится по круглому
колесу с пронумерованными разноцветными
ячейками. Существует 18 красных ячеек,
18 черных и 2 зеленые. Игроки могут делать
различные ставки. Можно поставить на
то, что шарик попадет в красную ячейку.
Какова вероятность этого события при
условии, что вероятность попадания
шарика в любую ячейку одинакова? Красными
являются 18 из 38 ячеек (количество
возможных исходов); поэтому вероятность
попадания шарика в красную ячейку равна
18/38.
Поскольку это число меньше, чем 0,5, мы
понимаем, что шарик будет останавливаться
в красной ячейке несколько реже, чем в
половине случаев. Таким образом, если
вы будете постоянно ставить на красное,
вы будете проигрывать немного чаще, чем
выигрывать. Предположим теперь, что вы
ставите на черное. Вероятность выигрыша
опять будет равна 18/38;
и опять-таки, если вы будете все время
ставить на черное, вы будете проигрывать
чаще, чем выигрывать. Конечно, играя в
рулетку, вы будете иногда выигрывать,
а (311:) иногда проигрывать, но после многих
ставок — в достаточно протяженном
интервале времени — вы проиграете.
Шансы
или вероятность выигрыша в любом казино
всегда распределяются в пользу «хозяев»,
иначе казино не получали бы прибыли.
Тем не менее, одному человеку удалось
«обыграть хозяев» в рулетку. Одним из
людей, которых я очень уважаю, является
Эл Гиббс, ученый, известный своими
работами в Лаборатории реактивного
движения в Пасадене, штат Калифорния,
где выполняются многие работы по
программе космических исследований
США. Когда он был студентом, он
воспользовался своими знаниями теории
вероятностей и, играя в рулетку в клубе
«Пионер» в Рено, увеличил свое состояние
со 125 долларов до $6300. Вот как он это
сделал: Гиббс знал, что, несмотря на то,
что выпадение любого номера при игре в
рулетку равновероятно, все устройства,
сделанные руками человека, имеют
недостатки. Из-за этого некоторые номера
выпадают чаще других. Чтобы определить
номера, которые выпадали чаще других,
Гиббс вместе со своим другом записал
результаты 100 000 запусков рулетки. На
эти номера они и стали ставить. К
сожалению, никто из нас не сможет
повторить его успех, потому что с тех
пор колеса стали ежедневно разбирать
и собирать заново из других частей.
Поэтому, несмотря на то, что каждое
колесо остается неидеальным, каждый
день его несовершенства меняются.
Вычисление
вероятности событий с несколькими
возможными исходами
Нас
часто интересует вероятность одновременного
наступления нескольких событий, например
выпадения двух орлов при двух бросках
монеты или по крайней мере одной шестерки
при двух бросках игральной кости.
Ситуации такого рода называются
ситуациями с несколькими возможными
исходами.
Использование
древовидных диаграмм
Хотя
довольно легко понять, что вероятность
выпадения орла при одном броске «честной»
монеты равна ½, интуитивно определить
вероятность выпадения четырех орлов
при четырех бросках «честной» монеты
несколько труднее. Хотя пример с монетой
может показаться искусственным, он
хорошо подходит для объяснения сочетания
вероятностей при нескольких попытках.
Давайте произведем расчеты. (Следите
за моими рассуждениями, даже если вы
панически боитесь математики. Если вы
поработаете над примерами, вычисления
и математические рассуждения покажутся
вам довольно простыми. Не надо восклицать,
взглянув на следующие несколько цифр:
«Нет, ни в коем случае, я это просто
пропущу». Важно уметь думать с числами
и о числах.)
При
первом броске может наступить лишь один
из двух возможных исходов; орел (О) или
решка (Р). Что произойдет, если монету
бросят дважды? Существует четыре
возможных исхода: орел оба раза (ОО),
орел в первый раз и решка во второй раз
(ОР), решка в первый раз и орел во второй
раз (РО) и решка оба раза (РР). Поскольку
существует четыре возможных исхода и
лишь один способ выпадения двух орлов,
то вероятность этого события равна 1/4
(опять-таки мы предполагаем, что монета
— «честная», (312:) т.е. выпадение орла и
решки равновероятно). Существует общее
правило для вычисления вероятности
совместного появления нескольких
событий в любой ситуации — правило «и».
Если вы хотите найти вероятность
совместного появления первого и
второго
события (орел при первом и
при
втором броске), надо перемножить
вероятности наступления этих событий
по отдельности. Применяя правило «и»,
мы находим, что вероятность появления
двух решек при двукратном броске монеты
равна ½ x ½ = 1/4.
Интуитивно кажется, что вероятность
совместного появления двух событий
должна быть меньше, чем вероятность
каждого из них в отдельности; так оно и
оказывается.
Простой
способ расчета этой вероятности
получается, если представить все
возможные события с помощью древовидной
диаграммы. Древовидные
диаграммы использовались в главе 4,
когда мы проверяли правильность
утверждений типа «если… то…». В этой
главе мы припишем ветвям дерева
вероятностные значения, чтобы определить
вероятности различных сочетаний исходов.
В последующих главах я еще вернусь к
древовидным диаграммам при рассмотрении
способов нахождения творческих решений
задач.
При
первом броске монеты она упадет или
орлом, или решкой вверх. Для «честной»
монеты выпадения орла и решки имеют
одинаковую вероятность, равную 0,5.
Давайте изобразим это следующим образом:
Когда
вы бросаете монету второй раз, то либо
за первым орлом последуют второй орел
или решка, либо за первой решкой последуют
второй орел или решка. Вероятности
выпадения орла и решки при втором броске
по-прежнему равны 0,5. Исходы второго
броска изображаются на диаграмме в виде
дополнительных ветвей дерева.
Как
видно из диаграммы, существует четыре
возможных исхода. Вы можете пользоваться
этим деревом для нахождения вероятностей
других событий. Чему (313:) равна вероятность
получения одной решки при двух бросках
монеты? Поскольку существует два способа,
которыми можно получить одну решку (ОР
или РО), ответ равен 2/4
или ½. Если вы хотите найти вероятность
двух или более различных исходов, сложите
вероятности всех исходов. Это называется
правилом «или». По-другому эту задачу
можно сформулировать так: «Чему равна
вероятность получить или
сначала
орла, а потом решку (1/4),
или
сначала
решку, а потом орла (1/4)?» Правильная
процедура нахождения ответа состоит в
том, чтобы сложить эти значения, в
результате чего получается ½.
Интуитивно
кажется, что вероятность появления
одного из нескольких событий должна
быть больше, чем вероятность появления
каждого из них; так оно и оказывается.
Правилами
«и» и «или» можно пользоваться только
тогда, когда интересующие нас события
независимы.
Два
события независимы, если появление
одного из них не влияет на появление
второго. В рассматриваемом примере
результат первого броска монеты никак
не влияет на результат второго броска.
Кроме того, для применения правила «или»
необходимо, чтобы события были
несовместимыми, т. е. не могли происходить
одновременно. В рассматриваемом примере
исходы являются несовместимыми, поскольку
мы не можем получить и орла, и решку при
одном броске.
Представление
событий в виде древовидных диаграмм
полезно во многих ситуациях. Давайте
расширим наш пример. Предположим, что
мужчина в полосатом костюме с длинными,
подкрученными вверх усами и бегающими
маленькими глазками останавливает вас
на улице и предлагает сыграть на деньги,
бросая монету. Он все время ставит на
орла. При первом броске монета падает
орлом вверх. При втором броске происходит
то же самое. При третьем броске опять
выпадает орел. Когда вы начнете
подозревать, что у него «нечестная»
монета? У большинства людей сомнения
возникают при третьей или четвертой
попытке. Вычислите вероятность выпадения
одних орлов при трех и четырех бросках
«честной» монеты (вероятность выпадения
орла равна 0,5).
Для
расчета вероятности выпадения трех
орлов в трех попытках вам надо нарисовать
дерево с тремя рядами «узлов», причем
из каждого узла исходят две «ветви».
В
этом примере нас интересует вероятность
выпадения трех орлов подряд при условии,
что монета «честная». Посмотрите на
столбец, озаглавленный «исход», и найдите
исход ООО. Поскольку это единственный
исход с тремя орлами, перемножьте
вероятности вдоль ветви 000 (обведенной
на диаграмме) и вы получите 0,5 х 0,5 х 0,5 =
0,125. Вероятность 0,125 означает, что если
монета «честная», то в среднем она будет
падать орлом вверх три раза подряд в
12,5% случаев. Поскольку эта вероятность
невелика, то при выпадении трех орлов
подряд большинство людей начинает
подозревать, что монета «с секретом».
Для
расчета вероятности выпадения четырех
орлов в четырех попытках добавьте к
дереву дополнительные ветви.
Вероятность
выпадения четырех орлов равна 0,5 х 0,5 х
0,5 х 0,5 = 0,0625, или 6,25%. Как вы уже знаете,
математически она равна 0,54;
т. е. умножить число само на себя четыре
раза — это то же самое, что возвести его
в четвертую степень. Если вы будете
считать на калькуляторе, где есть
операция возведения в степень, то вы
получите тот же самый ответ — 0,0625. Хотя
такой исход возможен и когда-нибудь
произойдет, он маловероятен. На самом
деле он настолько неправдоподобен и
необычен, что многие сказали бы, что
человек с бегающими глазками, наверное,
жульничает. Несомненно, что при выпадении
пятого орла подряд разумно будет
заключить, что вы имеете дело с мошенником.
Для большинства научных целей событие
считается «необычным», если его появление
ожидается с вероятностью менее 5%. (На
языке теории вероятностей это записывается
так: р < 0,05.)
Давайте
оставим искусственный пример с монетой
и применим ту же логику в более полезном
контексте. Я уверена, что любой студент
когда-либо сталкивался с тестами с
выбором вариантов, в которых нужно
выбирать из предложенных вариантов
правильные ответы. В большинстве таких
тестов на каждый вопрос предлагается
пять вариантов ответов, из которых
правилен только один. Предположим, что
вопросы настолько трудны, что вы можете
только случайно угадать правильный
ответ. Какова вероятность правильного
угадывания при ответе на первый вопрос?
Если вы понятия не имеете, какой из
вариантов является правильным ответом,
то вы с одинаковой вероятностью можете
выбрать любой из пяти вариантов,
предполагая, что любой из них может
оказаться правильным. Поскольку сумма
вероятностей выбора всех вариантов
должна быть равна единице, то вероятность
выбора каждого из вариантов при
равновероятности всех вариантов равна
0,20. Один из вариантов правильный, а
остальные — неправильные, поэтому
вероятность выбора правильного варианта
равна 0,20. Древовидная диаграмма этой
ситуации изображена ниже.
Какова
вероятность правильно угадать ответы
на первые два вопроса теста? Нам придется
добавить новые ветви к дереву, которое
вскоре станет очень густым. Чтобы
сэкономить место и упростить вычисления,
можно представить все неправильные
варианты в виде одной ветви, обозначенной
«неправильные». Вероятность ошибиться
при ответе на один вопрос равна 0,8.
Вероятность
правильно угадать ответы на два вопроса
равна 0,2 х 0,2 = 0,04. То есть случайно это
может произойти только в 4% попыток.
Допустим, что мы расширим наш пример до
трех вопросов. Я не буду рисовать дерево,
но вы должны уже понять, что вероятность
равна 0,2 х 0,2 х 0,2 = 0,008. Это настолько
необычное событие, что оно может произойти
случайно менее чем в 1 % попыток. Что вы
подумаете о человеке, которому удалось
правильно ответить на все три вопроса?
Большинство людей (а преподаватели тоже
люди) заключит, что студент не выбирал
ответы наугад, а действительно что-то
знал. Конечно, не исключено, что ему
просто повезло, но это чрезвычайно
маловероятно. Таким образом, мы приходим
к выводу, что полученный результат не
может объясняться только удачей.
Мне
хотелось бы отметить одну любопытную
сторону таких рассуждений. Рассмотрим
плачевную ситуацию, в которую попала
Сара. Она отвечала на 15 вопросов теста,
где ответ на каждый вопрос надо было
выбирать из пяти вариантов. Сара ответила
неправильно на все 15 вопросов. Можете
ли вы определить вероятность того, что
это произошло случайно? Я не буду рисовать
древовидную диаграмму для иллюстрации
этой ситуации, но легко видеть, что
вероятность ошибиться при ответе на
один вопрос равна 0,8; поэтому вероятность
неправильно ответить на все 15 вопросов
равна 0,815.
Это число 0,8, умноженное само на себя 15
раз, в результате чего получается 0,0352.
Поскольку вероятность такой случайности
равна 3,52%, может быть, Саре стоит заявить
преподавателю, что такой необычный
результат не может объясняться
случайностью? Сара, конечно, может
привести подобный довод, но поверили
бы вы ей на месте преподавателя?
Предположим, она утверждает, что знала
ответы на все вопросы. Как иначе она
смогла бы не выбрать правильный вариант
ответа в 15 вопросах подряд? Я не знаю,
сколько преподавателей поверили бы ее
утверждению, что 15 неверных ответов
доказывают наличие у нее знаний, хотя
в принципе такой ход рассуждений
используется для доказательства наличия
знаний, поскольку вероятность правильно
угадать все ответы примерно такая же.
(В этом примере вероятность наугад
ответить правильно на все 15 вопросов
равна 0,2015;
это число значительно меньше 0,0001.) Если
бы преподавателем Сары была я, то я бы
поставила ей высокие оценки за творческий
подход и понимание статистических
принципов. Не исключено, что Сара
действительно что-то знала на эту тему,
но в этом «чем-то» была систематическая
ошибка. Я бы также указала ей на то, что,
возможно, она не подготовилась к тесту,
а вдобавок ей еще и не повезло, и она
сделала 15 неверных догадок. В конце
концов, иногда случаются и очень необычные
события.
Перед
тем как перейти к чтению следующего
раздела, проверьте, понимаете ли вы, как
применять древовидные диаграммы для
расчета вероятностей и учета всех
возможных исходов. В этой главе я еще
вернусь к таким диаграммам. Когда вы
научитесь их использовать, вы будете
удивлены, как много существует ситуаций,
в которых они могут применяться.
Ошибка
при конъюнкции — применение правила
«и»
Тверски
и Канеман ( Tversky & Kahneman, 1983) составили
следующую задачу.
Линде
31 год, она откровенный и прямой человек
и очень способна. В колледже она выбрала
в качестве основного предмета философию.
Когда она была студенткой, ее волновали
проблемы расовой дискриминации и
социальной справедливости; кроме того,
она участвовала в антиядерных
демонстрациях.
Для
каждого из следующих утверждений укажите
вероятность того, что это утверждение
служит описанием Линды.
A.
Линда работает учительницей в начальной
школе.
Б.
Линда работает в книжном магазине и
занимается йогой.
B.
Линда активно участвует в движении
феминисток.
Г.
Линда работает социальным психиатром.
Д.
Линда является членом Лиги женщин-избирателей.
Е.
Линда работает кассиром в банке.
Ж.
Линда работает страховым агентом.
З.
Линда работает кассиром в банке и активно
участвует в движении феминисток.
Теперь
прекратите чтение и оцените вероятность
истинности каждого из утверждений (р.
297).
Этот
небольшой отрывок про Линду был написан
в качестве характерного описания
активной феминистки, чему соответствует
утверждение В. Таким образом, если
воспользоваться распространенным
стереотипом «типичной феминистки», то
правдоподобным описанием является В.
Обратите внимание на утверждения Е
(кассир) и 3 (феминистка и кассир). Как вы
оценили вероятность истинности этих
утверждений? Большинство людей считает,
что истинность 3 более вероятна, чем
истинность Е. Понимаете ли вы, что Е
должно быть более вероятным утверждением,
чем 3, если быть кассиром в банке и быть
феминисткой — события независимые?
Бывают кассиры, которые не принимают
активного участия в феминистском
движении. При определении вероятности
совместного появления двух событий вы
перемножаете вероятности их появления
по отдельности (правило «и»). Таким
образом, вероятность совместного
появления этих событий должна быть
меньше, чем вероятность каждого из этих
событий. В исследовании Тверски и
Канемана (Tversky & Kahneman, 1983) 85% субъектов
оценили вероятность истинности
утверждения 3 выше, чем Е. Ошибка,
возникающая, когда люди считают, что
совместное появление двух событий более
вероятно, чем появление одного из них,
называется ошибкой
конъюнкции.
Для
тех читателей, которым легче воспринимать
пространственную информацию, давайте
представим задачу в виде круговых
диаграмм — такая форма представления
использовалась при рассмотрении
силлогизмов в главе о рассуждениях.
Пусть один круг представляет всех на
свете банковских кассиров, а другой —
всех феминисток. Эти два круга должны
наложиться друг на друга, потому что
некоторые банковские кассиры являются
одновременно феминистками. На рис. 7.3
область пересечения кругов заштрихована.
Как видно из рис. 7.3, заштрихованная
область, которая представляет всех
людей, одновременно являющихся кассирами
и феминистками, должна быть меньше, чем
круг, представляющий всех кассиров,
потому что существуют кассиры, которые
не являются феминистками.
Теперь,
когда вы поняли, в чем заключается ошибка
конъюнкции, попробуйте ответить на
другой вопрос (также взятый из работы
Tversky & Kahneman, 1983):
В
Британской Колумбии проводилось
обследование здоровья мужчин из выборки,
где были представлены все возрастные
группы и профессии.
Пожалуйста,
приведите свои оценочные значения
следующих величин:
Какова
процентная доля обследованных мужчин,
которые перенесли один или более
инфарктов? _____ (318:)
Рис.
7.3. Два круга представляют «всех
феминисток» и «всех банковских кассиров».
Пересечение этих двух кругов представляет
тех людей, которые одновременно являются
феминистками и банковскими кассирами.
Поскольку существуют феминистки, которые
не работают кассирами, и кассиры, которые
не являются феминистками, область
пересечения кругов должна быть меньше,
чем каждый из них в отдельности.
Какова
процентная доля обследованных мужчин
в возрасте старше 55 лет, которые перенесли
один или более инфарктов? ____ (р. 308)
Теперь
прекратите чтение и вставьте на
пропущенные места свои оценочные цифры.
Более
65% респондентов считали, что процентная
доля мужчин, которые старше 55 лет и
перенесли инфаркт, будет больше, чем
процент всех мужчин, которые перенесли
инфаркт. Вы заметили, что это еще один
пример ошибки конъюнкции? Вероятность
совместного появления двух случайных
событий не может быть выше, чем вероятность
появления только одного из них.
Совокупный
риск — применение правила «или»
Очевидно,
что вероятность случайно ответить
правильно на три вопроса, при наличии
пяти вариантов ответов на каждый из
вопросов, будет значительно меньше, чем
вероятность правильно угадать ответ
на один вопрос. Ясно также, что вероятность
правильно угадать ответ хотя бы на один
вопрос из трех будет выше, чем вероятность
правильно угадать ответ, когда вопрос
всего один. До сих пор я специально
подбирала простые примеры. Давайте
выясним, как применять рассмотренные
принципы в реальной жизненной обстановке.
В
реальной жизни риск, как правило, связан
с многократным попаданием в рискованную
ситуацию. Рассмотрим вождение машины.
Вероятность попасть в аварию при одной
поездке на машине очень невелика. Но
что будет с вероятностью аварии, если
вы совершаете сотни или тысячи поездок?
Согласно правилу «или», она будет равна
вероятности аварии при первой, или
при
второй, или…
при
(319:) n-й
поездке. Шекли (Shaklee, 1987) провела интересное
исследование того, как люди понимают
концепцию совокупного риска. Она
предложила субъектам значения
вероятностей, которые соответствовали
риску наводнения в течение года. Затем
субъектам надо было оценить вероятность
наводнения в течение одного месяца, 5
лет, 10 лет и 15 лет. Только 74% субъектов
понимали, что вероятность наводнения
увеличивается, если рассматривать
интервал времени более одного года.
Среди тех, кто дал более высокие оценки
вероятности наводнения за интервалы
более одного года, большинство серьезно
недооценивали совокупную вероятность.
Давайте
рассмотрим аналогичный пример. При
применении метода контрацепции,
эффективного на 96% из расчета на год, в
среднем у четырех женщин из каждых ста,
пользующихся этим методом, в течение
года наступит беременность. Предполагая,
что уровень неудач не зависит от времени,
следует ожидать, что при применении
этого метода в течение 15 лет забеременеет
больше женщин, а при его применении в
течение более 15 лет количество
беременностей будет еще больше (Shaklee,
1987). При опросе студентов колледжа
оказалось, что только 52% студентов
понимало, что количество ожидаемых
беременностей возрастает со временем,
а большинство из них существенно
недооценивало число беременностей.
Вероятно,
идея, которую я пытаюсь донести до
читателя, уже ясна: при определении
риска важно понимать, относится ли
предлагаемое вам значение вероятности
к какой-либо единице времени (например,
год), и осознавать, что совокупный риск
увеличивается при повторении рискованной
ситуации. Создается впечатление
непонимания многими того, что совокупные
риски выше, чем однократные.
Ожидаемые
значения
Какую
из следующих двух ставок вы бы сделали,
если было бы можно выбрать лишь одну из
них?
1.
Большая дюжина: игра стоит один доллар.
Если, бросив пару игральных костей, вы
получите 12 очков, вам вернут ваш доллар
плюс еще 24 доллара. Если выпадет любая
другая сумма, вы проиграли свой доллар.
2.
Счастливая семерка, игра стоит один
доллар (так же, как в предыдущем случае).
Если, бросив пару игральных костей, вы
получите в сумме 7 очков, вам вернут ваш
доллар плюс еще б долларов. Если выпадет
любая другая сумма, вы проиграли свой
доллар.
Теперь
выберите либо ставку номер 1, либо ставку
номер 2.
Большинство
людей выбирает ставку номер 1, считая,
что 24 доллара, которые они выиграют,
если выпадет 12 оков, в четыре раза больше,
чем 6 долларов, которые можно выиграть,
если выпадет 7 очков, а денежная величина
одинакова для каждой ставки. Давайте
проверим, насколько правильны такие
рассуждения.
Чтобы
выяснить, какая из ставок выгоднее, надо
рассчитать вероятность выигрыша и
проигрыша в каждом из случаев. Существует
формула, которая учитывает все эти
значения и дает ожидаемое
значение (ОЗ)
выигрыша для каждой игры. Ожидаемое
значение — это количество денег, которое
можно ожидать выиграть (320:) при каждой
ставке, если вы все время будете продолжать
играть. Формула для расчета ожидаемого
значения (ОЗ) имеет следующий вид:
ОЗ
= (вероятность выигрыша) х (величина
выигрыша) + (вероятность проигрыша) х
(величина проигрыша).
Давайте
вычислим ОЗ для первой ставки. Начнем
с расчета вероятности выпадения 12 при
броске пары игральных костей. Существует
только один способ получить 12: когда на
каждой из костей выпадет 6. Вероятность
этого события при условии, что кости
«честные», равна 1/6
х 1/б
= 1/36
= 0,028. (Поскольку нас интересует вероятность
выпадения 6 и
на
первой, и
на
второй кости, мы используем правило «и»
и перемножаем вероятности.) Таким
образом, выпадение 12 ожидается в 2,8%
случаев. Чему равна вероятность, что 12
не выпадет? Поскольку вы уверены, что
12 либо выпадет, либо не выпадет (других
исходов быть не может), можно вычесть
0,028 из 1. Вероятность того, что выпадет
не 12, равна 0,972. (Это значение с небольшой
ошибкой округления можно получить
также, если рассчитать вероятности 35
остальных возможных исходов — каждая
из них равна 1/36
— и сложить их.) Все исходы, возможные
при броске пары игральных костей,
показаны на рис. 7.4.
ОЗ
(1-я ставка) = (вероятность выпадения 12)
х (выигрыш) + (вероятность выпадения не
12) х (проигрыш)
ОЗ
(1-я ставка) = 0,028 х $24 + 0,972 х (- $1) 03 (1-я ставка)
= $0,672 — $0,97 03 (1-я ставка) = — $0,
Давайте
посмотрим, из чего состоит эта формула.
Если выпадет 12, вы выиграете $24, которые
дают величину выигрыша. Если выпадет
любое другое число, вы потеряете доллар,
который заплатили, чтобы вступить в
игру, поэтому величина проигрыша равна
$1. Вероятность выигрыша умножается на
величину выигрыша. Вероятность проигрыша
умножается на величину проигрыша. Затем
эти два произведения складываются. ОЗ
при такой ставке равно $0,30. Это означает,
что в конечном счете, если вы будете
продолжать играть в эту игру много раз,
вы можете ожидать, что будете проигрывать
в среднем по $0,30 при каждой игре. Конечно,
при каждой игре вы можете или проиграть
$1, или выиграть $24, но после множества
игр вы проиграете в среднем по $0,30 за
одну игру. Если вы сыграете 1000 раз, ставя
каждый раз по доллару, то вы потеряете
$300.
Сравним
этот результат со второй ставкой. Чтобы
рассчитать ОЗ для второй ставки, мы
начнем с вычисления вероятности выпадения
7 очков при броске пары костей. Сколько
существует способов получить 7, бросив
пару костей? Семь очков получится, если
выпадет 1 на первой кости и 6 на второй,
2 и 5, 3 и 4, 4 и 3, 5 и 2 или 6 и 1. Таким образом,
существует 6 возможных способов получить
7 очков из 36 возможных исходов. Вероятность
любого из этих исходов равна 1/6
x
1/6
= 1/36.
(Это вероятность получить, например, 1
на первой кости и 6 на второй кости.) Для
определения вероятности того, что за
первым выпавшим числом последует второе
нужное число, вы должны применить правило
«и». Поскольку теперь вас интересует
вероятность выпадения 1 и 6 , или
2
и 5, или
3
и 4, или
4
и 3, или
5
и 2, или
6
и 1, то (321:) следующим шагом должно быть
применение правила «или». Поскольку
существует 6 возможных комбинаций, вам
надо сложить шесть раз по 1/6
(что, конечно, то же самое, что умножить
1/36
на 6). Таким образом, вероятность выпадения
7 очков при броске пары костей равна
6/36
(1/6
или 0,167). Вероятность выпадения любой
другой суммы очков (не 7) равна 1 – 0,167 =
0,833. Теперь мы подсчитаем 03 для второй
ставки:
ОЗ
(2-я ставка) = (вероятность выпадения 7) х
(выигрыш) + (вероятность выпадения не 7)
х (проигрыш)
Рис.
7.4. Древовидная диаграмма, изображающая
все исходы, возможные при броске пары
игральных костей.
ОЗ
(2-я ставка) = 0,167 х $6 + 0,833 х (- $1)
ОЗ
(2-я ставка) = $1,002 — $0,833 = $0,169, или приблизительно
$0,17.
Это
означает, что если вы будете продолжать
играть на условиях второй ставки, то вы
выиграете в среднем по $0,17 за каждую
игру. Следовательно, если вы сыграете
1000 раз, ставя каждый раз по $ 1, то можно
ожидать, что вы разбогатеете на $170.
Конечно, как и в первом случае, вы никогда
не выиграете $0,17 за одну игру; это средний
результат за много-много игр. Это то,
что произойдет на большом интервале
времени.
Даже
если вы сначала думали иначе, лучше
выбрать вторую ставку, поскольку
вероятность выпадения семь очков
относительно высока. Это объясняется
тем, что существует шесть сочетаний,
которые в сумме дают семь очков.
Существует
игра, основанная на принципе, что чем
больше имеется способов, которыми может
произойти событие, тем выше его
вероятность. Предположим, что в одной
комнате собрались 40 человек, составляющих
случайную выборку. Оцените вероятность
того, что среди них окажутся два человека,
у которых дни рождения совпадают.
Возможно, вы удивитесь, узнав, что эта
вероятность равна приблизительно 0,90.
Вы понимаете, почему она такая высокая?
Существует очень много способов
совпадения дней рождения у сорока
человек. Чтобы точно рассчитать эту
вероятность, надо подсчитать количество
всех возможных сочетаний из сорока
человек по два. Таким образом, нам
придется начать с сочетания первого
человека со вторым, первого с третьим
и т. д., пока не дойдем до первого с
сороковым; затем начнем считать сочетания
второго человека с третьим второго с
четвертым и т.д., пока не дойдем до
сочетания второго с сороковым. Этот
процесс мы будем повторять до тех пор,
пока каждый из сорока человек не побывает
в паре с любым из остальных. Поскольку
существует так много возможных пар
людей, у которых могут совпадать дни
рождения, то такое «совпадение» более
вероятно, чем могло показаться сначала.
Вероятность совпадения чьих-нибудь
дней рождения превышает 0,50 для 23 человек
и превышает 0,75 для 32 человек (Loftus &
Loftus, 1982). Вы можете воспользоваться этими
знаниями, чтобы держать пари на вечеринках
или любых других собраниях людей. Лучше
всего, если количество людей близко к
40. Большинству людей трудно поверить,
что вероятность совпадения дней рождения
настолько высока.
Вы
можете также воспользоваться своими
знаниями по теории вероятностей для
того, чтобы повысить свои шансы на успех
в некоторых ситуациях. Возьмем, к примеру,
Аарона и Джилл, которые спорили из-за
того, кому из них выносить мусор. Их мама
согласилась помочь им уладить разногласия,
назвав наугад число от одного до 10. Тот
из них, чье число окажется ближе к числу,
названному мамой, победит в споре. Аарон
был первым и назвал число «три». Какое
число должна назвать Джилл, чтобы иметь
максимальные шансы на победу? Прекратите
чтение и подумайте, какое число ей
следует выбрать.
Джилл
лучше всего выбрать число «четыре».
Если мама назовет любое число, большее
трех, то эта стратегия принесет Джилл
победу. Таким образом, она может увеличить
вероятность выигрыша в ситуации, которая
кажется зависящей только от случая.
(323:)
Субъективная
вероятность
Обычно
мы не имеем дела с известными или
объективными вероятностями, такими как
вероятность дождя в какой-либо день или
вероятность возникновения болезней
сердца при приеме противозачаточных
таблеток. Тем не менее, мы ежедневно
принимаем решения на основе собственных
оценок вероятности различных событий.
Субъективной
вероятностью называют
личные оценки вероятности событий.
Такой термин введен для отличия наших
оценок от объективной
вероятности, под
которой понимают суждение о вероятности
события, рассчитанное математическим
путем на основе известных данных о
частоте его появления. Психологи,
исследовавшие субъективные вероятности,
обнаружили, что человеческие суждения
о вероятностях часто бывают ошибочными,
но, тем не менее мы руководствуемся ими
при принятии решений во многих ситуациях.
Ошибка
игрока
На
ярмарках, в казино, в парках и в
телевизионных шоу пользуется популярностью
игра под названием «Колесо Фортуны».
Имеется большое колесо, которое можно
вращать. Колесо разделено на множество
пронумерованных секторов, как колесо
рулетки. Резиновый указатель показывает,
какой номер выиграл.
Предположим,
что ваша подруга Ванда решила подойти
к «Колесу Фортуны» с научной точки
зрения. Она села рядом с колесом и стала
записывать все выигравшие номера.
Допустим, что Ванда записала следующий
набор чисел: 3, 6, 10, 19, 18, 4, 1, 7,7,5,20, 17,2, 14,
19, 13,8, 11, 13, 16, 12, 15, 19, 3, 8. После тщательного
изучения этих чисел она заявила, что
при последних 25 запусках колеса ни разу
не выпадало число «девять»; она собирается
поставить крупную сумму на «девять»,
так как теперь вероятность появления
этого числа значительно возросла.
Согласны ли вы с тем, что это надежная
ставка? Если вы ответили «да», то совершили
ошибку, которая очень часто встречается
при изучении законов вероятности.
«Колесо Фортуны» не обладает памятью
и «не помнит», какие номера только что
выиграли. Если колесо сконструировано
таким образом, что выигрыш любого номера
имеет одинаковую вероятность, то
выпадение «девятки» равновероятно при
каждом запуске колесе, независимо от
того, часто или редко это число выпадало
в прошлом. Люди верят, что случайные
процессы, такие как вращение колеса,
должны самокорректироваться таким
образом, что если событие какое-то время
не происходило, то вероятность его
появления увеличивается. Такие неверные
представления носят название ошибки
игрока.
Ошибку
игрока можно обнаружить во многих
ситуациях. Рассмотрим пример из области
спорта. Иногда считают, что если игроку
в бейсболе долго не удается ударить, то
повышается вероятность того, что к нему
придет мяч, потому что ему «полагается»
удар. Один мой друг, большой любитель
спорта, рассказал мне следующую историю
о Доне Саттоне, бывшем подающем игроке
из команды «Доджерс». В один из сезонов
Саттон проиграл очень много пробежек.
Он предсказывал, что за этим «спадом»
в игре последует «коррекция», и он
закончит сезон с обычным для себя средним
результатом. К сожалению, случайные
факторы не подвергаются коррекции, и,
начав сезон плохо, он закончил его с
результатом ниже своего обычного
среднего (324:) уровня. Часто люди продолжают
совершать «ошибку игрока» даже после
того, как им объяснили, в чем она
заключается. Студенты рассказывали
мне, что хотя на интеллектуальном уровне
они могут понять, что совершают «ошибку
игрока», на интуитивном уровне они
«нутром» чувствуют, что «так и должно
быть». Для понимания законов вероятностей
нередко нужно отказаться от своих
интуитивных предчувствий, поскольку
они часто бывают неверными. Давайте
рассмотрим другой пример.
У
Уэйна и Марши четыре сына. Хотя они
вообще-то не хотят иметь пятерых детей,
обоим всегда хотелось иметь дочку.
Следует ли им планировать завести еще
одного ребенка, поскольку сейчас, при
условии, что первые их четверо детей —
все мальчики, рождение дочери более
вероятно? Если вы поняли, в чем заключается
«ошибка игрока», то вы признаете, что
при пятой попытке, так же как и при каждой
из первых четырех, рождение дочери так
же вероятно, как и рождение сына. (На
самом деле из-за того, что мальчиков
рождается чуть больше, чем девочек,
вероятность рождения мальчика несколько
выше, чем вероятность рождения девочки.)
У
«ошибки игрока» существует и оборотная
сторона — некоторые убеждены, что
события происходят полосами. Рассмотрите
следующие два варианта.
А.
Баскетболистка совершила 2 или 3 последних
броска мимо кольца. Она собирается
бросать снова. Б. Баскетболистка 2 или
3 раза подряд попала в кольцо. Она
собирается бросать снова.
В
каком случае вероятность попадания
больше — в случае А или в случае Б?
Джилович
(Gilovich, 1991) задавал подобные вопросы
опытным баскетбольным болельщикам и
обнаружил, что 91% из них верит, что
вероятность попадания выше в случае Б
по сравнению со случаем А. Другими
словами, они верят, что игрокам везет
«полосами». Чтобы выяснить, существуют
ли данные, подтверждающие веру в «полосы»,
Джилович проанализировал статистические
данные по играм филадельфийской
баскетбольной команды. Вот что он
выяснил:
Если
игрок только что попал в кольцо, 51 %
следующих бросков был успешным.
Если
игрок только что промахнулся мимо
кольца, 54% следующих бросков были
успешными.
Если
игрок только что попал в кольцо два раза
подряд, 50% следующих бросков были
успешными.
Если
игрок только что промахнулся два раза
подряд, 53% следующих бросков были
успешными.
Эти
данные не подтверждают того, что
баскетболисты совершают броски
«полосами». Тем не менее интервью с
самими баскетболистами показало их
веру
в
то, что успешные и неудачные броски идут
«полосами». Очень трудно убедить людей
в том, что случай — это просто случай;
он не корректирует сам себя и не
распределяет результаты «полосами».
Игнорирование
базового уровня
Чарли
очень хочется первый раз в жизни
поцеловать девушку. Если он пригласит
Луизу пойти с ним в кино, то он только
на 10% уверен, что она примет его (325:)
приглашение. Зато если она пойдет с ним
в кино, он на 95% уверен, что на прощание
она его поцелует. Каковы шансы Чарли
получить поцелуй?
Начальные
вероятности, существующие a
priori, называют
базовым
уровнем. В
этой задаче первое препятствие, которое
надо преодолеть Чарли, — это уговорить
Луизу пойти с ним в кино. Вероятность
этого события 10%. Эту цифру, т. е. базовый
уровень, важно обдумать. Десять процентов
— довольно низкое значение, поэтому,
скорее всего, она с ним не пойдет. Он
хочет знать вероятность совместного
появления двух случайных событий — она
идет с ним в кино и она его целует. Перед
тем как приступить к решению этой задачи,
оцените приблизительно величину ответа,
который вы ожидаете получить. Как вы
думаете, она будет больше 95%, между 95% и
10% или меньше 10%?
Для
решения этой задачи мы нарисуем
древовидную диаграмму, на которой
изобразим все возможные исходы и их
вероятности. Конечно, маловероятно,
чтобы Чарли или любой другой юноша,
желающий стать Ромео, стал бы на самом
деле рассчитывать вероятность этого
решающего события, но на этом примере
можно продемонстрировать сочетание
вероятностей. Может быть, Чарли решит,
что вероятность добиться поцелуя у
Луизы столь мала, что лучше выбрать
Брунгильду, которая с большей вероятностью
примет его приглашение на свидание и
уступит его любовным чарам. Кроме того,
любой, кто в действительности оценивал
вероятностные величины, касающиеся
любви, может также захотеть точнее
оценивать вероятность совместного
появления двух или нескольких событий.
Наша
диаграмма сначала имеет только две
ветви — Луиза принимает приглашение и
Луиза отказывается. От узла «Луиза
соглашается» начинается следующее
разветвление, указывающее, получит
Чарли поцелуй или нет. Каждая ветвь
должна быть помечена соответствующими
значениями вероятностей. Конечно, если
Луиза не примет приглашение, то Чарли
совершенно точно не получит поцелуя.
Следовательно, ветвь, исходящая из узла
«Луиза отказывается», будет помечена
значением вероятности 1,00 события «Чарли
не поцелуют».
Согласно
правилу «и» для нахождения вероятности
двух (или нескольких) событий, вероятность
того, что на прощание Луиза поцелует
Чарли, равна: 0,10×0,95 = 0,095.
Вы
не удивлены, что объективная вероятность
оказалась меньше, чем низкий базовый
уровень (10%), и значительно меньше, чем
более высокий вторичный или последующий
уровень (95%)? Многих людей это удивляет.
Надеюсь, что вы помните, что любой ответ,
превышающий 10%, был бы признаком ошибки
конъюнкции. Как было сказано в разделе
об ошибках конъюнкции, вероятность
совместного (326:) появления двух случайных
событий (Луиза соглашается и целует
Чарли) должна быть меньше, чем вероятности
появления каждого из этих событий по
отдельности. Большинство людей игнорирует
низкий базовый уровень вероятности
(или недооценивает его влияние) и дает
оценку ответа, лежащую ближе к более
высокому уровню вторичной вероятности.
В целом люди склонны переоценивать
вероятность совместного появления двух
или нескольких случайных событий. Ошибки
такого типа называются игнорированием
базового уровня.
Принятие
вероятностных решений
Большая
часть принимаемых нами в жизни важных
решений связана с вероятностями. Хотя
более всестороннее обсуждение принятия
решений будет проводиться в главе 8,
давайте рассмотрим применение древовидных
диаграмм в процессе принятия решений.
Эдит
пытается выбрать для себя специализацию
в колледже. Она учится в университете,
где для специализации по каждому из
предметов надо сдавать отдельные
вступительные экзамены. Она серьезно
думает о том, чтобы стать бухгалтером.
Она знает, что на отделение бухгалтерии
принимают только 25% из желающих туда
поступить. Семьдесят процентов поступивших
оканчивают курс, и 90% окончивших успешно
сдают государственные экзамены на
звание бухгалтера и становятся
бухгалтерами. Эдит хотела бы узнать,
каковы ее шансы стать бухгалтером, если
она выберет эту специализацию.
Чтобы
ответить на ее вопрос, нарисуем древовидную
диаграмму, ветви которой будут указывать
«путь» к успешному овладению профессией
бухгалтера.
Из
приведенной выше диаграммы вы видите,
что вероятность успешно овладеть
профессией бухгалтера равна 0,25 х 0,70 х
0,90, т. е. 0,158. Получив такой результат,
Эдит должна обдумать другие варианты.
Например, она может попробовать поступать
сразу на отделения бухгалтерии и
педагогики. Она может снова подсчитать
свои шансы на успех по одной из этих
профессий, по обеим сразу (если такой
вариант для нее возможен) или вероятность
неудачи и там, и там.
В
этом примере предполагается, что у нас
нет никакой дополнительной информации,
на основе которой можно оценивать шансы
Эдит на успех. Предположим (327:) теперь,
что нам известно, что у Эдит прекрасные
способности к математике. Приведет ли
наличие такого рода информации к
изменению соответствующих вероятностей?
Повысится ли вероятность того, что Эдит
будет принята, окончит курс и успешно
овладеет профессией, требующей знания
математики? Интуитивно хочется ответить
«да». Давайте на следующем примере
рассмотрим, как изменится задача
вычисления вероятности успеха, если
учитывать дополнительную информацию.
Прогнозы
на основе объединения информации
Хосе
всегда хотел стать артистом. Поэтому
он планирует продать все свое имущество
и отправиться в Нью-Йорк делать карьеру.
Предположим, и вам, и Хосе известно, что
лишь 4% людей, мечтающих стать актерами,
добиваются в Нью-Йорке профессионального
успеха. Это значение является базовым
уровнем; оно основано на информации,
известной еще до того, как мы получим
какую-либо конкретную информацию о
Хосе. Давайте остановимся и обдумаем
эту цифру — базовый уровень. Она говорит
о том, что очень немногие из людей,
мечтающих стать актерами, становятся
профессионалами в этой области. Другими
словами, шансы на успех низкие. Предположим,
что у вас нет никакой дополнительной
информации о Хосе. Как бы вы оценили его
шансы на успех? Если вы ответили 4%, вы
совершенно правы! В отсутствие какой-либо
другой информации используйте базовый
уровень.
Хосе
считает, что ему не стоит беспокоиться:
дело в том, что 75% тех, кто преуспел на
актерском поприще, имеют кудрявые
волосы, а также хорошо поют и рассказывают
анекдоты. Поскольку у Хосе кудрявые
волосы, он хорошо поет и уморительно
рассказывает анекдоты, то он уверен,
что скоро будет рассылать поклонникам
свои глянцевые фотографии размером 8 х
10. Значение второй вероятности называется
вторичным; оно отражает специфическую
информацию о характеристиках Хосе и
желательного исхода. Мы используем эти
два значения вероятностей для того,
чтобы решить, обоснован ли оптимизм
Хосе. Каковы его точные шансы на успех?
Не забывайте, что вероятности лежат в
диапазоне от 0 до 1, причем 0 означает,
что Хосе точно потерпит неудачу и ему
придется возвратиться домой, а 1 означает,
что он совершенно точно добьется успеха
на Бродвее. Теперь остановитесь и оцените
субъективную вероятность его успеха.
Можете
ли вы предложить способ определения
объективной вероятности успеха? Чтобы
найти объективную вероятность, вам
потребуется знать еще одно число, про
которое часто забывают, — процент тех,
кто терпит неудачу, несмотря на то, что
обладает характеристиками, связанными
с успехом (в данном случае, кудрявыми
волосами и умением петь, танцевать и
шутить). Очень немногие люди понимают,
что при оценке вероятности успеха
необходимо учитывать эту величину. Для
краткости изложения я буду обозначать
характеристики, связанные с успехом
(кудрявые волосы и умение петь и шутить),
просто «кудрявые волосы», а отсутствие
этих качеств — «нет кудрявых волос».
Предположим, что 50% потерпевших неудачу
обладают этими качествами. В таком
контексте для расчета вероятностей
тоже можно использовать древовидные
диаграммы. Давайте начнем с начала и
рассмотрим все возможные исходы. В
данном случае Хосе либо добьется успеха,
либо потерпит неудачу, поэтому мы назовем
первые ветви «успех» и «неудача». Как
и прежде, мы будем надписывать вероятность
каждого события вдоль соответствующей
ветви.
Отметим,
что эти две вероятности (0,04 и 0,96) в сумме
равны 1,0, поскольку других возможных
исходов нет. Один из этих исходов
обязательно осуществится, поэтому сумма
их вероятностей равна 1,0, что указывает
на достоверность.
Хосе
знает, что у 75% из тех, кто добивается
успеха, бывают кудрявые волосы. В этом
примере мы пытаемся найти вероятность
определенного исхода (успеха) при
условии, что у нас уже имеется некоторая
информация, касающаяся вероятности
этого исхода. Давайте добавим новые
ветви, исходящие из узлов «успех» и
«неудача». В этом примере существуют
четыре различных исхода: успех при
наличии кудрявых волос, успех при
отсутствии кудрявых волос, неудача при
наличии кудрявых волос и неудача при
отсутствии кудрявых волос. Эти четыре
исхода показаны на следующей диаграмме:
Отметим,
что поскольку 75% (0,75) добившихся успеха
имеют кудрявые волосы, а 25% (0,25) не обладают
этой характеристикой, то сумма вероятностей
событий, исходящих из одного узла, должна
равняться единице. Точно так же 50%
потерпевших неудачу имеют кудрявые
волосы, а 50% неудачников не обладают
этим качеством. Поскольку мы учитываем
всех неудачников, то сумма этих
вероятностей также должна равняться
единице.
После
того как диаграмма нарисована, подсчитать
объективную вероятность успеха Хосе
уже совсем просто. Как и раньше, чтобы
найти вероятность какого-либо исхода,
надо перемножить вероятности вдоль
ведущей к нему ветви. В данном случае
мы перемножим вероятности вдоль каждой
из ветвей диаграммы и представим
результаты в виде таблицы:
р |
= |
р |
= |
р |
= |
р |
= |
1,00 |
Из
таблицы видно, что общая доля людей,
обладающих кудрявыми волосами, равна
0,03+ 0,48 = 0,51.
Чтобы
определить истинные шансы Хосе на успех,
нам следует разделить долю людей,
добившихся успеха и обладающих кудрявыми
волосами (0,03), на общую долю тех, кто
имеет кудрявые волосы (0,03 + 0,48 = 0,51). Мы
пытаемся прогнозировать успех Хосе на
основе знания того факта, что у него
кудрявые волосы, а некоторая часть людей
с кудрявыми волосами добивается успеха.
Какую часть всех людей с кудрявыми
волосами (0,51) составляют те, кто добился
успеха (0,03)?
Доля
добившихся успеха с кудрявыми волосами
Общая
доля людей с кудрявыми волосами = 0,03
(0,03 + 0,48) » 0,Таким образом, шансы Хосе на
успех на 50% выше (6% против 3%), чем у любого
неизвестного, желающего стать артистом,
но все равно они очень низкие. Наличие
информации о том, что он обладает
некоторыми качествами, связанными с
успехом, привело к некоторому увеличению
вероятности его успеха по сравнению с
базовым уровнем, но это увеличение очень
незначительно.
Возможно,
вам покажется проще следить за логикой
этих расчетов, если вы сведете всю
информацию в таблицу:
Успех |
Неудача |
Сумма |
|
Кудрявые |
0,03 |
0,48 |
0,51 |
Нет |
0,01 |
0,48 |
0,49 |
Сумма |
0,04 |
0,96 |
1,00 |
Вы
не удивлены, что его шансы на успех
оказались столь низкими, несмотря на
то, что последующая или вторичная
вероятность имела такое высокое значение
(75%)? Большинство людей оказывается
удивлено таким результатом. Столь слабые
шансы Хосе стать артистом объясняются
тем, что в целом на этом поприще добивается
успеха очень небольшое количество
желающих. Полученное Хосе значение
вероятности было близко к априорному,
или базовому, уровню успеха для всех
начинающих артистов. Поскольку в целом
очень немногим артистам удается добиться
успеха, Хосе, как и любой другой будущий
артист, имеет низкие шансы на успех.
Исследования показали, что вообще
большинство людей склонно к переоценке
шансов на успех при низких базовых
уровнях и к их недооценке при высоких
базовых уровнях. В предыдущем примере,
касавшемся Эдит, у нас была лишь информация
о базовом уровне, на которой основывался
процесс прогнозирования. В этом примере
у нас есть информация о Хосе, которая
позволила нам предсказать его шансы на
успех, превышающие базовый уровень,
хотя из-за общей низкой доли успеха
кандидатов в актеры в целом это повышение
было незначительным.
Тем
читателям, которые предпочитают мыслить
пространственными категориями, я
предлагаю представить себе большую
группу людей, 4% из которых являются
добившимися успеха артистами, а 96% — не
являются таковыми. Эта группа изображена
на рис. 7.5. Четверо из 100 нарисованных
человечков улыбаются — так изображены
добившиеся успеха актеры. Если у вас
нет другой информации для прогнозирования
успеха Хосе, то вам придется воспользоваться
этим базовым уровнем и предсказать ему
4% шансов на успех. (330:)
Рис.
7.5. Наглядное изображение 4%-го уровня
успеха. Заметьте, что 4% лиц улыбаются.
Теперь
давайте учтем дополнительную информацию:
75% тех, кто добился успеха, имеют кудрявые
волосы, а из тех, кто потерпел неудачу,
кудрявыми волосами обладают лишь 50%.
Эта информация сочетается с информацией
о базовом уровне. Результат изображен
на рис. 7.6, где добившимся успеха и
неудачникам пририсованы кудрявые
волосы. Из четырех улыбающихся человечков
трое (75%) обладают кудрявыми волосами,
а из 96 хмурых человечков кудрявые волосы
у 48 (50%).
Анализируя
эти цифры, легко заметить, что наши
математические действия заключались
в том, чтобы определить долю улыбающихся
человечков с кудрявыми волосами по
отношению ко всем человечкам с кудрявыми
волосами, а затем использовать то, что
мы знаем о Хосе, для предсказания его
шансов на успех. Графически это доля
(или часть), которую составляют три
улыбающихся кудрявых человечка по
отношению к оставшемуся 51 кудрявому
человечку:
3/51=0.Обобщая;
получим следующую схему для расчета
вероятности исхода при условии, что у
вас имеется информация, касающаяся этой
вероятности.
1.
Нарисуйте полную древовидную диаграмму,
указав информацию о базовом уровне
(например, успеха или неудачи), в первой
группе узлов. Вторичной информацией
воспользуйтесь при изображении второй
группы узлов
2.
Составьте таблицу, где все различные
сочетания базовой и вторичной информации
представлены в виде строк. (331:)
3.
Перемножьте вероятности вдоль каждой
из ветвей диаграммы и запишите результаты
в строках таблицы.
4.
Составьте дробь, в которой значение
вероятности интересующей вас ветви
(например, успех при наличии кудрявых
волос) будет числителем, а сумма этого
значения и значения вероятности из
другой ветви, содержащей то же условие
(например, неудача при наличии кудрявых
волос), будет знаменателем.
5.
Проверьте ответ. Имеет ли он смысл?
Следует ли ожидать, как в приведенном
примере, что вероятность успеха должна
быть выше базового уровня, потому что
у нас имеется информация, которая связана
с успехом? (Если бы мы знали, что Хосе
обладает некоторым качеством, которое
связано с неудачей, то мы бы предсказали,
что его шансы на успех будут ниже базового
уровня, но при изначально низком базовом
уровне они уменьшатся ненамного.)
Существует
большое количество заболеваний, базовый
уровень вероятности заболеть которыми
невелик для группы населения. Результаты
медицинских тестов следует интерпретировать
с учетом соответствующего базового
уровня каждой болезни. Медицина, как и
большинство других дисциплин, является
вероятностной наукой; тем не менее,
очень немногие врачи получают подготовку
по теории вероятностей. Неумение
применять информацию о базовых уровнях
может привести к неверным диагнозам.
Игнорирование базового уровня является
распространенной ошибкой, допускаемой
при размышлении об исходах вероятностных
событий.
Рис.
7.6. Наглядное изображение относительной
доли добившихся успеха актеров и
неудачников,
обладающих такими же характеристиками,
как Хосе. Эти характеристики
изображены
в виде кудрявых волос.
Дреман
(Dreman, 1979) суммирует результаты большого
количества исследований на эту тему
следующим образом: «Тенденция к недооценке
или полному игнорированию известных
вероятностей при принятии решений,
несомненно, является самым серьезным
недостатком интуитивного мышления»
(цит. по: Myers, 1995, р. 331). Последствия подобных
постоянных ошибок и когнитивных
предубеждений играют серьезную роль
не только в экономике, управлении и
капиталовложениях, но практически в
любой области, где приходится принимать
решения, связанные с вероятностью.
Нерегрессивные
суждения
Гарри
недавно поступил в Государственный
арбузолитейный университет. Средний
балл всех студентов этого университета
(СБ) равен 2,8. Гарри — новичок и еще не
сдавал экзаменов. Хотя у вас нет никакой
конкретной информации о Гарри, как вы
думаете, каков будет его средний балл?
Прекратите чтение и попытайтесь угадать
его средний балл.
После
первых экзаменов в середине семестра
Гарри получил средний балл 3,8. При наличии
этой новой информации как вы теперь
оцените СБ Гарри, который он получит в
конце учебного года? Большинство людей
на первый вопрос сразу отвечает 2,8, т.
е. называют средний балл всех студентов
арбузолитейного университета. Это
правильный ответ, поскольку, не имея
другой информации, лучше всего заключить,
что средний балл любого из студентов
этого университета близок к общему
среднему баллу. На второй вопрос
большинство людей отвечает 3,8. К сожалению,
это не самый лучший ответ. Хотя и верно,
что человек, получающий высокие оценки
на экзаменах в середине семестра, как
правило, получает высокие оценки на
экзаменах за весь семестр, все же эти
оценки не совпадают в точности. Обычно
человек, получивший очень высокий по
какой-либо шкале результат, в следующий
раз получает результаты ближе к средним.
Следовательно, средний балл Гарри в
конце учебного года, скорее всего, будет
меньше, чем 3,8, и больше, чем 2,8. (Точный
прогноз среднего балла можно вычислить
математически, но эти расчеты выходят
за рамки данной книги.) Эта идея сложна
для понимания, поскольку большинство
людей находит, что она противоречит
интуиции, и это действительно так.
Полезно
рассмотреть пример из области спорта.
Вспомните своих любимых спортсменов.
Хотя они иногда выступают совершенно
блестяще, чаще всего их результат близок
к среднему. В конце концов, невозможно
всегда сбивать все кегли или выбивать
1000 очков. Любителям спорта известно
явление, которое носит название «синдром
второго года». После выдающихся успехов
в течение первого года выступлений на
следующий год звезда обычно начинает
показывать результаты, которые ближе
к среднему уровню. Еще один пример,
который может помочь прояснить эту
концепцию, — это часто используемый
пример о росте отцов и сыновей. Как
правило, сыновья отцов очень высокого
роста имеют рост ближе к среднему (хотя
все же выше среднего). Это явление носит
название регрессии
к среднему значению. (Среднее
значение вычисляется путем сложения
всех интересующих вас значений и деления
на число этих значений.) (333:)
Выше
в этой главе я говорила о законах случая.
Никто не может точно предсказать рост
конкретного человека. Но в целом — т.е.
если обследовать очень много отцов
высокого роста, то окажется, что у
большинства из их сыновей рост регрессирует
к среднему значению. Таким образом, как
и было сказано выше, знание законов
вероятности помогает нам лучше
прогнозировать, но точные прогнозы
будут получаться не всегда. Важно
понимать эту концепцию, имея дело с
вероятностными событиями.
Канеман
и Тверски ( Kahneman & Tversky, 1973) изучали
последствия, возникающие вследствие
того, что специалисты не понимают явления
регрессии к среднему. Израильские летные
инструкторы хвалили курсантов, когда
они успешно выполняли сложные фигуры
пилотажа и маневры, и критиковали плохие
полеты. С учетом того, что вы только что
узнали о регрессии к среднему значению,
понятно, что должно произойти после
того, как пилот отлично справился с
заданием? Последующие полеты, вероятно,
окажутся ближе к среднему уровню, потому
что класс пилотажа регрессировал к
среднему. И наоборот, чего следует
ожидать после очень плохого полета?
Опять-таки, последующие должны быть
ближе к среднему уровню — в данном
случае это означает, что они станут
лучше, хотя могут все равно остаться
ниже среднего уровня. Инструкторы не
понимали явления регрессии к среднему
значению, поэтому пришли к неверному
выводу о том, что похвалы приводят к
ухудшению результатов, а критика — к
улучшению.
Давайте
рассмотрим еще один пример регрессии
к среднему значению. Это явление носит
повсеместный характер, но очень немногие
люди знают о нем. Предположим, что вы
узнали о группе самопомощи для людей,
дети которых очень плохо себя ведут.
(Такие группы действительно существуют.)
Большинство родителей обращается в
такие группы тогда, когда их дети ведут
себя особенно плохо. После нескольких
недель посещения группы многие родители
сообщают, что поведение их ребенка стало
лучше. Можно ли сделать вывод, что занятия
в группе помогли родителям научиться
управлять поведением своих детей?
Вспомните о регрессии к среднему
значению! Если родители поступили в
группу, когда поведение их ребенка было
особенно плохим, то что бы они ни делали
— даже если бы они не делали ничего, —
все равно поведение ребенка, скорее
всего, должно регрессировать к среднему
по условной шкале поведения уровню. Мы
можем прогнозировать не ангельское или
хотя бы нормальное, т. е. среднее поведение,
а только некоторое улучшение или
изменение поведения в сторону среднего
уровня. Поскольку это статистический
прогноз, иногда он может оказаться
неверным, но в среднем (в достаточно
протяженном интервале времени) мы будем
правы. Поэтому нельзя сделать никаких
выводов об эффективности занятий в
группе самопомощи, если не провести
эксперимент того типа, который был
описан в главе 6. Нужно будет случайным
образом распределить детей и семьи по
группам самопомощи и контрольным
группам, а затем определить, будут ли
дети из групп самопомощи вести себя
значительно лучше, чем дети из контрольной
группы, на которых не оказывали никакого
специального воздействия. Для того
чтобы заключить, что такие группы
помогают улучшить поведение ребенка,
мы должны иметь возможность случайным
образом распределить семьи по группам.
Если вы начнете искать в жизни случаи
регрессии к среднему значению, то
удивитесь, какое количество событий
можно объяснить именно «движением к
среднему значению», а не какими-либо
другими причинами. (334:)
Риск
Если
мы проанализируем данные, полученные
в сотнях населенных пунктов, расположенных
в США или во всем мире, то обнаружим, что
в некоторых районах имеет место
исключительно высокий уровень
заболеваемости некоторыми видами рака,
врожденных уродств, опухолей мозга и
других заболеваний, а также необъяснимых
смертей. Как можно выяснить, существует
ли связь между высоким уровнем
заболеваемости и наличием токсических
веществ (например, пестицидов) в воде и
магнитными полями от линий электропередач
или это явление носит случайный характер?
Понятие
частотности, т.е. того, насколько часто
повторяется событие, является неотъемлемой
частью определения вероятности. Если
событие происходит часто, то его появление
имеет высокую вероятность. Для определения
степени риска, связанного с катастрофическими
событиями, необходимо сначала определить
их частоту. Поскольку, как правило,
катастрофические события происходят
редко (например, авиакатастрофы или
утечки радиации с атомных электростанций),
а в некоторых случаях их последствия
проявляются лишь через много лет
(например, раковые заболевания, вызванные
загрязнением окружающей среды), то
определение их частотности — очень
трудная задача. Чтобы понять, как люди
выносят свои суждения о степени риска,
необходимо понимать, как они определяют
частотность связанных с риском событий
обыденной жизни. Ряд исследователей
(Lichtenstein et al., 1978) заинтересовался тем,
как люди оценивают частотность событий,
вызывающих летальный исход. Они изучили
этот вопрос, предложив студентам колледжа
и членам Лиги женщин-избирателей
несколько пар возможных причин смерти
и попросив их выбрать, какая из причин
более вероятна. Чтобы понять суть этого
эксперимента и полученных в нем
результатов, давайте попробуем сами
ответить на несколько вопросов. Для
приведенных ниже пар событий укажите,
какое из них является более вероятной
причиной смерти, а затем оцените, во
сколько раз вероятнее выбранная вами
причина приводит к смерти, чем второе
событие пары. (Реальные частотности
упоминающихся событий приводятся в
конце этого раздела.)
A. |
Астма |
или |
торнадо |
Б. |
Замерзание |
или |
сифилис |
В. |
Диабет |
или |
самоубийство |
Г. |
Болезни |
или |
рак |
Д. |
Наводнение |
или |
убийство |
Е. |
Сифилис |
или |
диабет |
Ж. |
Астма |
или |
ботулизм |
З. |
Отравление |
или |
удар |
И. |
Туберкулез |
или |
убийство |
К. |
Все |
или |
рак |
Исследователи
обнаружили, что в целом люди тем точнее
оценивают вероятности причин смерти,
чем больше реальные различия между
частотностями событий, однако они делают
большое количество ошибок при оценке
частотности различных событий по
отношению друг к другу. Субъекты
описанного эксперимента переоценивали
частотность событий, которые происходят
очень редко, и недооценивали частотность
событий, которые происходят очень часто.
Кроме того, частотность (335:) событий со
смертельным исходом, которые широко
освещаются в средствах массовой
информации (например, авиакатастрофы,
наводнения, убийства, торнадо, ботулизм),
обычно переоценивается, в то время как
менее драматичные, молчаливые убийцы
(например, диабет, инсульт, астма,
туберкулез) недооцениваются. Создается
впечатление, что широко освещаемые
события легче приходят на ум, и это
приводит к необъективной оценке их
частотности. Наше восприятие риска
искажается под влиянием событий, которые
хорошо запоминаются, таких как стихийные
бедствия или несчастные случаи, поданные
в новостях как сенсации, например,
большая авиакатастрофа или заболевание
ботулизмом из-за употребления непрожаренных
гамбургеров. В главе 2 я говорила о том,
что память является неотъемлемой частью
всех мыслительных процессов. Наши
воспоминания оказывают решающее влияние
на характер нашего мышления. Из приводимой
ниже цитаты видно, насколько важно при
оценке мыслительных процессов иметь в
виду то, что память может быть необъективной.
.Наше
общество очень часто выносит суждения
об опасной деятельности при отсутствии
адекватных статистических данных об
этой деятельности, — например, об
исследованиях в области генной инженерии
или захоронении радиоактивных отходов
Мы подозреваем, что необъективность,
обнаруженная в этих суждениях (переоценка
редких событий, недооценка частых
событий и искажения, возникающие под
влиянием драматичности или яркости
производимого впечатления), на самом
деле существует и даже может усиливаться
в таких ситуациях (Lichtenstein et al , 1978, р 577)
Нет
ничего удивительного в том, что мы
склонны переоценивать вероятность
событий, которые широко освещаются в
средствах массовой информации. Принимая
решения, мы полагаемся на доступную нам
информацию и обычно не осознаем, что
эта информация тенденциозна или
сенсационна (Fischoff, 1993). Об убийствах
рассказывают в каждом выпуске новостей
и пишут в каждой газете; о смертях,
наступивших от болезней сердца, редко
упоминают в этом контексте. Неудивительно,
что многие люди считают, что вероятность
быть убитыми для них больше, чем
вероятность умереть от сердечного
приступа (эта оценка, к сожалению, верна
для подростков и молодежи из больших
американских городов, хотя и неверна
почти для всех остальных людей).
Оценка
риска
Каждый
день мы попадаем в одни рискованные
ситуации и избегаем других. Мы начинаем
рисковать, как только просыпаемся.
Уилсон
и Крауч (Wilson & Crouch, 1987)
Как
специалисты принимают решения, которые
потенциально могут иметь катастрофические
последствия? Как всем нам, осведомленным
гражданам своей страны и избирателям,
принимать решения, связанные с риском?
Постановка таких вопросов вполне
своевременна, но ответить на них нелегко.
Целью
оценки риска является нахождение путей
избежать риска, снизить его или взять
под контроль ( Wilson & Crouch, 1987). Человеческая
жизнь всесторонне (336:) связана с риском.
В качестве примера можно привести то,
что в США примерно 200 человек ежегодно
погибают от удара электрическим током
из-за неисправности домашней проводки
или бытовых электроприборов, а 7000 человек
умирают от последствий падения в
собственном доме (большинство из них
старше 65 лет). Тем не менее мало кто из
нас сочтет риск подобного несчастного
случая достаточно серьезным для того,
чтобы перестать пользоваться электричеством
или прекратить ходить по своему дому.
Существуют и другие риски, которые явно
слишком велики, чтобы им подвергаться.
Например, очень немногие из нас решатся
с завязанными глазами перейти автостраду
с интенсивным движением. Кроме того,
существуют риски, которые почти не
изучены, такие как выбросы новых
химических веществ в окружающую среду
или развитие новых технологий. Уилсон
и Крауч (Wilson & Crouch, 1987) предлагают
избирателям и потребителям при принятии
решения о безопасности какого-либо
действия или технологии использовать
несколько способов оценки риска:
1.
Один из методов оценки риска основан
на анализе исторических данных. Например,
для того чтобы оценить риск возникновения
рака из-за облучения при рентгенологических
медицинских исследованиях, можно
воспользоваться данными о том, что при
определенной ежегодной дозе облучения
(40 мР) ожидается возникновение определенного
количества случаев заболевания (1100).
Подобную информацию о риске потребители
могут сравнить с другими известными
рисками, чтобы решить, перевешивает ли
польза, приносимая рентгеновскими
исследованиями, связанный с ними риск.
2.
Риск, связанный с новыми технологиями,
для которых еще нет исторических данных,
можно рассчитать путем расчета риска,
связанного с отдельными компонентами
этих технологий (в случае, если они
независимы друг от друга), и перемножения
полученных значений вдоль ветвей дерева
решения. Такой метод расчета вероятностей
был описан выше в одном из разделов этой
главы. В качестве примера можно привести
расчет вероятности серьезной аварии
на химическом заводе.
3.
Риск можно рассчитать по аналогии.
(Использование аналогий в качестве
вспомогательного средства при решении
задач более подробно обсуждается в двух
следующих главах.) При испытаниях
лекарств на животных экспериментатор
фактически пользуется аналогией и
экстраполирует полученные результаты
на людей.
Необъективность
при оценке риска
Психологи
и другие ученые, исследующие то, каким
образом люди определяют степень
рискованности различных ситуаций,
знают, что при оценке «туманной смеси
догадок» (Paulos, 1994, р. 34), на которых строится
информация, нуждающаяся в нашей
интерпретации, большинство из нас
становится жертвой распространенных
предубеждений. Вот некоторые из них
(Wandersman & Hallman, 1993):
1.
Когда люди рискуют добровольно, то они
воспринимают риск менее серьезно по
сравнению со случаями вынужденного
риска. Например, многие считают, (337:) что
косметические операции безопаснее, чем
операции, от которых мы не можем
отказаться. В конце концов, пациенты
добровольно идут на косметическую
операцию, поэтому им приходится убеждать
себя, что эта операция «достаточно
безопасна».
2.
Естественные риски считаются менее
опасными, чем искусственные. Например,
многие люди считают, что природные
токсины, имеющиеся в нашей пище, менее
опасны, чем попавшие в нее пестициды
или добавление консервантов.
3.
Запоминающиеся события, в которых
пострадало одновременно большое
количество людей, воспринимаются как
более рискованные по сравнению с
обыденными и менее яркими событиями.
Примером этого эффекта является большое
количество людей, которые боятся попасть
в авиакатастрофу, но почти не думают о
безопасности при поездках на автомобиле.
4.
События, которые люди считают
подконтрольными человеку, воспринимаются
как более безопасные по сравнению с
теми событиями, которыми нельзя управлять.
Многие люди склонны чувствовать себя
в большей безопасности, сидя за рулем,
а не в качестве пассажира, поскольку
большинство из нас считает себя водителями
выше среднего уровня.
5.
Явления, которые невозможно наблюдать
и которые связаны с эффектными и пугающими
последствиями (генная инженерия,
радиоактивные отходы, СПИД и ядерные
реакторы), считаются более рискованными,
чем явления, связанные с известной
степенью риска или менее пугающими
последствиями (курение, автокатастрофы,
динамит и пистолеты; Slovic, 1987).
Очевидно,
что личное восприятие риска отличается
от его научной оценки. Эксперты по оценке
риска судят о риске на основе данных о
ежегодной смертности; события, вызывающие
наибольшее количество смертей,
расцениваются как самые рискованные.
Например, эксперты сочли автотранспорт
источником большего риска, чем
использование ядерной энергии (поскольку
в автокатастрофах погибает больше
людей), в то время как выборки, составленные
из студентов колледжей и членов Лиги
женщин-избирателей, посчитали ядерную
энергию источником большего риска (так
как катастрофы, связанные с ее
использованием, могут иметь ужасающие
воображение последствия).
Главная
трудность при интерпретации маловероятных
рисков, таких как наводнения или ядерные
аварии, состоит в том, что статистические
данные о них трудны для осмысления.
Трудно соотнести с собственной жизнью
тот факт, что конкретное связанное с
риском событие случается с одним из 10
000 человек. Нам необходимо так
переформулировать эту информацию, чтобы
она отвечала на вопрос: «Насколько
вероятно, что это случится со мной?»
Один из предлагаемых способов осмысления
такого рода информации состоит в том,
чтобы перевести все подобные риски в
стандартные единицы «риска в час» (
Slovic, Fischoff, & Lichtenstein, 1986). Предположим,
например, вы узнаете, что риск, связанный
с поездкой на мотоцикле, равен риску,
который связан с пребыванием в 75-летнем
возрасте в течение одного часа. Поможет
ли подобная информация осмысленно
интерпретировать риск, связанный с
поездкой на мотоцикле? Хотя она может
принести пользу при оценке сравнительного
риска (поездка на мотоцикле по сравнению
с полетом на дельтаплане), сама по себе
такая информация бесполезна, поскольку
понять, что подразумевается под риском
пребывания в 75-летнем возрасте в течение
одного часа, все равно трудно. (338:)
В
качестве избирателей и потребителей
мы постоянно сталкиваемся с необходимостью
принятия решений по огромному количеству
самых разных проблем, включающих в себя
использование ядерной энергии,
радиационное заражение пищевых продуктов,
хирургические операции, качество воды
и воздуха, применение лекарств. Для
принятия обоснованного решения всегда
необходимо тщательное рассмотрение
информации, касающейся оценки риска,
связанного с данным решением (например,
исторические данные, аналогичные риски
и риски, связанные с отдельными
компонентами), а также понимание факторов,
приводящих к тенденциозности при
субъективной оценке риска.
Ниже
приводятся ответы на заданные выше
вопросы о вероятностях причин смерти,
сопровождающиеся действительными
частотностями каждой причины (количество
смертей на 100 000 000 человек). Проверьте
свои ответы и выясните, не сделали ли
вы общих ошибок, переоценив события,
которые касаются большого количества
людей одновременно и лучше запоминаются
(такие, как авиакатастрофы), и недооценив
те риски, которые мы считаем управляемыми
(такие, как вождение автомобиля).
Более |
Количество |
Менее |
Количество |
|
А. |
Астма |
920 |
Торнадо |
44 |
Б. |
Сифилис |
200 |
Замерзание |
163 |
В. |
Диабет |
19 |
Самоубийство |
12 |
Г. |
Болезни |
360 |
Рак |
37 |
Д. |
Убийства |
9200 |
Наводнение |
100 |
Е. |
Диабет |
19 |
Сифилис |
200 |
Ж. |
Астма |
920 |
Ботулизм |
1 |
З. |
Удар |
52 |
Отравление |
0,5 |
И. |
Убийство |
9200 |
Туберкулез |
1800 |
К. |
Все |
55 |
Рак |
46 |
Использование
статистики и возможные ошибки, возникающие
при этом
Существует
три вида лжи: просто ложь, гнусная ложь
и статистика.
Дизраэли
(1804-1881)
Когда
мы хотим узнать что-нибудь о группе
людей, часто бывает невозможно или
неудобно спрашивать об этом всех членов
группы. Предположим, что вы хотите
выяснить, действительно ли доноры,
сдающие кровь для Красного Креста, как
правило, добрые и благородные люди.
Поскольку вы не можете обследовать
всех, кто сдает кровь, чтобы определить,
насколько они добры и заботливы, вы
обследуете только часть этого контингента,
которая называется выборкой.
Количественные
показатели, рассчитанные на выборке
людей, называется статистическими
данными. (Статистикой
также называется область математики,
которая использует теорию вероятностей
для принятия решений о контингентах.)
(339:)
Статистические
данные встречаются в любой сфере жизни
— от средних результатов игроков в
бейсбол до величины военных потерь.
Многие люди вполне справедливо относятся
к статистике подозрительно. Хафф (Huff,
1954) написал небольшую книжечку, в которой
приводятся юмористические примеры
статистических ошибок. Книга носит
название «Как лгать с помощью статистики»
(How to Lie With Statistics). В этой книге есть такая
зарифмованная мысль: «Статистика умело
грим наложит — немного пудры и немного
краски — и факты на себя уж не похожи.
Я отношусь к статистике с опаской» (р.
9).
О
среднем
Если
сказать, что в средней американской
семье 2,1 ребенка, то что это будет
означать? Это число было получено путем
создания выборки из американских семей,
подсчета общего количества детей в этих
семьях и деления на количество семей в
выборке. Это число может дать весьма
точное представление о том, что в
американских семьях примерно по два
ребенка — в некоторых больше, а в
некоторых меньше, а может и ввести нас
в заблуждение. Возможно, что в половине
семей совсем не было детей, а в другой
половине было по четыре ребенка или
даже больше, а читатель будет ошибочно
считать, что в большинстве семей
«примерно» два ребенка, в то время как
на самом деле нет ни одной такой семьи.
Эта ситуация напоминает человека,
который держит голову в духовке, а ноги
в холодильнике и говорит, что в среднем
он чувствует себя вполне комфортно. Не
исключено также, что выборка, использованная
для получения этого статистического
показателя, не репрезентативна для
контингента — в данном случае для всех
американских семей. Если выборка состояла
из студентов колледжей или жителей
Манхэттена, то полученный результат
завышен. С другой стороны, если в выборку
вошли жители сельских районов, то
полученный результат занижен. Если
выборки не отражают особенности
контингента, то их называют
нерепрезентативными
выборками. Статистические
данные, рассчитанные на таких выборках,
не дают точной информации о контингенте.
Средние
значения тоже могут вводить нас в
заблуждение, поскольку существует три
различных вида средних значений.
Предположим, что у миссис Вонг пятеро
детей. Старшая дочь сделала успешную
карьеру и занимает пост управляющего
большой корпорацией. Она зарабатывает
$500 000 в год. Вторая дочь — учительница и
зарабатывает $25 000 в год. Третий сын
работает официантом и получает $15 000 в
год. Оставшиеся дети — безработные
артисты, получающие по $5000 в год. Если
миссис Вонг хочет похвастаться, как
хорошо живут ее дети, она может подсчитать
среднее
арифметическое их
доходов, которое называют еще средним
значением. Когда
люди думают о средних показателях, они,
как правило, имеют в виду среднее
арифметическое. Это сумма всех значений,
поделенная на число слагаемых. Средний
доход детей миссис Вонг равен $550000 : 5 =
$110 000. Конечно, любой человек, услышав
такую цифру, заключит, что у миссис Вонг
очень успешные и состоятельные дети.
Средний
доход детей миссис Вонг получился таким
высоким из-за того, что в сумму входит
одно очень большое слагаемое, в результате
чего среднее значение (340:) возросло.
Средние значения также называют оценками
с тяготением к центру. Второй
тип оценок с центральной тенденцией —
это медиана,
или
срединное значение. На него не влияет
наличие нескольких экстремальных
значений величины. Чтобы найти медиану,
значения выстраиваются в порядке
возрастания или убывания. Значение,
оказавшееся в середине ряда, и является
медианой. Для примера с доходами детей
миссис Вонг это будет выглядеть так:
$5000;
$5000; $15 000, $25 000, $500 Средним значением, или
медианой, будет третье значение, или
$15 000. Таким образом, миссис Вонг могла
бы также заявить, что ее дети зарабатывают
в среднем по $15 000. (Когда число значений
четное, медиана равна среднему
арифметическому двух срединных значений.)
Миссис
Вонг могла бы утверждать, что ее дети
зарабатывают в среднем $ 110 000 или $15 000,
и оба утверждения были бы правдивыми.
Смысл приведенного примера в том, что
следует осторожно относиться к средним
показателям. Чтобы понять их смысл,
необходимо знать, о каком типе значения
идет речь — о среднем арифметическом
или медиане, а также иметь представление
об изменчивости данных и «форме»
распределения (каким образом числа
группируются).
Точность
Предположим,
я сообщу вам, что проводилось научное
исследование продолжительности рабочего
дня у служащих. Более того, в результате
этого исследования обнаружено, что
средняя продолжительность рабочего
дня равна 8,167 часа. Не правда ли, звучит
наукообразно и внушительно? А если бы
я сказала вам, что большинство служащих
работает примерно по 8 часов в день?
Большинство из вас ответило бы: «Я это
и так знаю. Стоило ли проводить
исследование?» Дело в том, что точные
статистические данные часто производят
на нас впечатление даже тогда, когда
точность совсем не нужна.
Приведу
пример из одного престижного еженедельного
журнала новостей. Естественно, для
журнала важно, чтобы читатели считали
его статьи правдивыми и авторитетными.
Несколько лет назад в нем была опубликована
статья об угрозе здоровью жителей
Нью-Йорка, которая возникает из-за
собачьих экскрементов. Чтобы создать
у читателей представление о масштабах
проблемы, они подсчитали ежедневное
количество собачьих экскрементов в
Нью-Йорке с точностью до двух десятичных
знаков (до одной сотой фунта!). Я понятия
не имею, как они получили эту цифру, и
мне даже думать не хочется о том, как
они собирали данные. Я твердо уверена
только в том, что они не могли точно
измерить это количество. Зато, конечно,
такие точные статистические данные
произвели впечатление, что журнал
публикует тщательно проверенную научную
информацию, которой можно доверять.
Еще
более смешной пример излишней точности
связан с именем Марка Твена, одного из
самых знаменитых писателей Америки.
Однажды он заявил, что возраст реки
Миссисипи — 100 миллионов и три года.
Оказывается, за три года до этого Марк
Твен узнал, что Миссисипи — 100 миллионов
лет. (341:)
Значимые
различия
Если
вы хотите определить средний рост всех
женщин, то вы можете создать выборку из
100 женщин, измерить их рост и вычислить
среднее значение. Предположим, что вы
взяли другую выборку из 100 женщин и снова
определили их средний рост. Будете ли
вы ожидать, что средние значения роста
для этих двух выборок точно совпадут?
Конечно, нет — очевидно, что будут
наблюдаться некоторые отклонения. Эти
средние значения рассчитаны на различных
выборках, поэтому получены несколько
отличающиеся результаты.
Допустим,
кто-нибудь измерил рост женщин из
выборки, состоящей из тех, кто живет в
студенческом общежитии, и обнаружил,
что их средний рост 5 футов и 5 дюймов.
Затем он измерил рост женщин, которые
не живут в общежитии, и обнаружил, что
их средний рост 5 футов и 4½ дюйма. Можно
ли на основании этих данных сделать
вывод, что те, кто живет в общежитии, —
выше ростом, чем те, кто там не живет?
Надеюсь, что вы ответили «нет», потому
что небольшие различия между группами
могут носить случайный характер, особенно
если размер
выборки невелик,
т. е. в нее входит малое количество людей.
Существуют статистические методы для
определения вероятности того, что
различия между данными, полученными на
двух или нескольких выборках, являются
случайными. Если вероятность случайности
очень мала, то такие различия называются
значимыми
различиями.
Вопрос
о значимости изменений относится также
и к контингентам. Если по списку
численность студентов вашего колледжа
увеличилась с 15 862 до 15 879 человек, то
есть ли у администрации основания
заключить, что подобное увеличение
численности что-либо означает? Ответ
на этот вопрос зависит от множества
переменных. Если количество студентов
в течение последних 5 лет ежегодно
немного увеличивалось, то эти цифры
могут отражать слабую, но постоянную
тенденцию. С другой стороны, это
сравнительно небольшое увеличение
могло произойти из-за случайных колебаний,
и тогда оно не отражает определенной
тенденции. Из-за случайных факторов это
число могло бы с таким же успехом
уменьшиться. Точно так же изменение
уровня безработицы с 10,0 % до 9,9% может
или быть всего лишь случайным колебанием
(флуктуацией), или указывать на конец
экономического спада. Можно ожидать,
что республиканцы и демократы по-разному
будут интерпретировать такие цифры, в
зависимости от того, кто в данный момент
стоит у власти.
Экстраполяция
Экстраполяцией
называется
оценка значения величины путем продолжения
ряда известных ее значений. Если число
студентов, специализирующихся по
психологии в Захолустном университете,
за последние 5 лет составляло приблизительно
150, 175, 200, 225 и 250, соответственно, то
большинство людей одобрительно отнесется
к прогнозу, предсказывающему, что в
следующем году количество студентов,
специализирующихся по психологии, будет
равно примерно 275.
Экстраполяция
может приводить к ошибкам, которые
иногда бывают смешными. Например,
предположим, что нам надо исследовать
уменьшение средней численности
американской семьи с 1900 по 1950 г. С помощью
экстраполяции мы можем получить прогноз,
что вскоре средняя численность
американской семьи будет равна нулю, а
затем превратится в отрицательное
число. Конечно, этого быть не может! Это
все равно что сказать, что если время,
за которое спринтеры пробегают
стометровку, будет продолжать сокращаться,
то в конце концов кто-нибудь пробежит
ее за 0 секунд или за отрицательный
промежуток времени.
Статистические
мистификации
Как
можно превратить чистый жир в смесь,
которая на 96% не содержит жиров? Нет, тут
нет никакого волшебства; на самом деле
это очень просто. Если съесть два кусочка
сливочного масла, то 100% калорийности
будут составлять жиры. Но если положить
те же два кусочка масла в стакан с водой
и выпить эту тошнотворную смесь, то вы
создадите на 96% свободный от жиров
напиток (т. е. он будет содержать 96% воды).
Вам достанется то же самое количество
калорий, состоящих из одних жиров, но
название «напиток, на 96% свободный от
жиров» производит впечатление большей
пользы для здоровья. Поэтому продукты
с наклейкой «на столько-то процентов
не содержит жиров» являются фальсификацией
здорового питания, а этикетки наклеены
с целью дезинформации (Nutrition Action
Healthletter, 1991).
Многие
из статистических данных, на которые
мы по привычке ссылаемся, удручающе
неправильны. Бозелл ( Bozell, 1993) усомнился
в точности сведений, которые мы получаем
из средств массовой информации. Например,
он цитирует репортера CBS,
который
предупреждал, что заболеваемость СПИДом
среди гетеросексуалов только в 1992 г.
увеличилась на 30%. Но по данным Центра
контроля над заболеваемостью, количество
заболевших СПИДом среди гетеросексуалов
в 1992 г. увеличилось на 17%, что является
снижением скорости роста заболеваемости
по сравнению с ростом на 21% в 1991 г. Точно
так же Бозелл цитирует ведущего программы
новостей NBC,
который
сообщил, что в настоящее время в США 5
миллионов бездомных, хотя Бюро переписи
населения в 1990 г. насчитало только 220
000 бездомных. Различия очень большие,
но как нам определить, какие из этих
статистических данных ближе к истине?
Во-первых,
стоит выработать привычку подвергать
сомнениям статистические данные, которые
вам сообщают. Как они были собраны и кто
их собирал? Например, трудно точно
подсчитать количество бездомных — их
нелегко отыскать, поскольку у них нет
адресов и телефонов. Как были получены
две различные оценки этого количества?
Какая выборка использовалась — из
центра Нью-Йорка или из Солт-Лэйк-Сити?
Есть ли у вас причины считать, что данные
преднамеренно искажены? Например,
консервативная политическая группа
«Женщины, волнующиеся за Америку» с
очевидными целями поместила в
общенациональных газетах призыв к
запрещению мужского и женского
гомосексуализма в армии. В поддержку
своей позиции они цитировали научное
исследование, обнаружившее, что
«гомосексуальное поведение приводит
к половой распущенности, связано с
принуждением и не поддается контролю»
(цит. по: Bozell, 1993, р. А18). Далее шло утверждение
что «типичный гомосексуалист» каждый
год имеет минимум 68 половых партнеров!
Вы заинтересовались, где и как были
получены подобные статистические
данные? Надеюсь, что заинтересовались.
Это «научное исследование» проводилось
более 10 лет (343:) назад и специально было
нацелено на изучение наиболее активных
и неразборчивых в связях
гомосексуалистов-мужчин, поэтому его
результаты нельзя обобщать на всех
гомосексуалистов. Если вы будете
подвергать сомнению статистические
данные, с которыми постоянно встречаетесь
в жизни, у вас будет меньше шансов быть
введенными в заблуждение искаженными
данными.
Применение
алгоритма
Рассмотрим
этапы применения общей схемы мышления
при осмыслении и использовании
вероятностей.
1.
Какова цель? Всякий
раз, когда вы принимаете решения,
касающиеся неопределенных событий, вам
необходимо применять навыки, описанные
в этой главе. Это особенно необходимо,
когда вам сообщают вероятностные
значения или когда подразумевается
степень уверенности в чем-либо. Такие
ситуации возникают при решении большинства
проблем и принятии многих решений,
потому что они часто относятся к событиям
в будущем, о которых никогда нельзя
судить с полной определенностью.
2.
Что известно? При
постановке задачи вам необходимо знать,
как получены сообщаемые вам значения
вероятностей — объективно или субъективно.
Вам необходимо проверить, не могут ли
эти значения оказаться тенденциозными.
Не повлиял ли на значение вероятности,
приписываемое данному исходу, тот факт,
что данный исход желателен? Хотя тема
учета степени надежности источников
информации обсуждалась в главе 5, она
касается и данного контекста. Перед тем
как использовать значения вероятностей,
вам надо оценить качество имеющейся у
вас информации. Поскольку значения
вероятностей часто используются для
убеждения людей, необходимо проверить,
соответствуют ли представленные числовые
данные предлагаемой вам аргументации.
При
выяснении того, что вам известно, ищите
информацию, которую можно использовать
для расчета вероятностных оценок.
Например, если вам дана вероятность
риска, то как она рассчитана — за год,
за одно воздействие (например, рентгеновское
облучение) или за всю жизнь? Имеется ли
дополнительная информация, которую
можно использовать в комбинации с
базовыми уровнями, чтобы уточнить ваши
прогнозы?
3.
Какие навыки мышления позволят вам
достичь поставленной цели? Для
работы с вероятностными событиями было
предложено большое количество методов
мышления. Один из самых полезных —
изображение полной древовидной диаграммы
с указанием вероятностей для каждой
ветви. Этот метод позволяет вам «увидеть»
и объективно рассчитать вероятность
различных исходов. Когда вы используете
дополнительную информацию в сочетании
с информацией о базовом уровне, важно
правильно сформировать их отношения,
чтобы обойти проблему игнорирования
базового уровня. Требуется также умение
узнавать типичные и часто встречающиеся
ошибки (например, ошибка конъюнкции,
неумение учитывать совокупные риски)
и использовать правила «и» и «или» для
повышения точности вероятностных
решений. (344:)
Поскольку
в жизни очень немногое известно с полной
определенностью, методы осмысления и
использования вероятностей приходится
применять часто. После прочтения этой
главы вы должны уметь:
Рассчитывать
ожидаемые значения в ситуациях с
известными вероятностями.
Узнавать
случаи регрессии к среднему значению
и вносить поправки в свои прогнозы с
учетом этого явления.
Использовать
правило «и», избегая при этом ошибок
конъюнкции.
Использовать
правило «или» для расчета совокупных
вероятностей.
Узнавать
«ошибки игрока» и избегать их.
При
составлении прогнозов использовать
базовые уровни.
Использовать
древовидные диаграммы для принятия
решений в вероятностных ситуациях.
Вносить
поправки в оценки рисков с учетом
совокупного характера вероятностных
событий.
Понимать
сущность различий между средним
арифметическим и срединным значениями
(медианой).
Избегать
проявления чрезмерной уверенности в
неопределенных ситуациях.
Понимать
ограничения, накладываемые на применение
экстраполяции
Использовать
вероятностные суждения для совершенствования
принятия решений.
При
оценке неизвестных рисков учитывать
такие показатели, как исторические
данные, степени риска, связанного с
отдельными компонентами решения, и
аналогии.
4.
Достигнута ли поставленная цель?
Вероятности
учитываются для того, чтобы количественно
оценить и снизить степень неопределенности.
Вы достигнете своей цели, когда сможете
приписать случайным событиям более
точные значения вероятностей.
Краткий
итог главы
1.
Поскольку очень немногое в жизни известно
наверняка, законы вероятностей играют
решающую роль во многих аспектах нашей
жизни
2.
Согласно определению, вероятность —
это отношение количества способов,
которыми может произойти определенное
событие (которое мы называем успехом),
к общему числу возможных исходов (когда
все возможные исходы равноправны). Этим
термином также пользуются для выражения
степени уверенности в появлении событий
с неизвестной или известной из прошлого
частотностью появления.
3.
Обычно люди склонны испытывать по поводу
неопределенных событий большую
уверенность, чем позволяет объективная
вероятность этих событий. (345:)
4.
Существует несколько способов
представления вероятностной информации,
эквивалентных с точки зрения математики,
но вызывающих резкие различия в
человеческой интерпретации этой
информации.
5.
Для расчета вероятностей многократного
появления события (например, при двух
или более бросках монеты) можно
использовать древовидные диаграммы.
Если события независимы, то вероятность
любого сочетания исходов можно найти
путем перемножения значений вероятностей
вдоль ветвей дерева.
6.
Ожидаемое значение выигрыша или проигрыша
пари можно рассчитать по формуле, в
которую входят вероятности и величины
выигрыша и проигрыша.
7.
Субъективные вероятности — это наши
личные оценки возможности появления
событий, частотность которых неизвестна.
Если люди считают, что они могут управлять
случайными событиями, то величина
субъективной вероятности содержит
систематическую ошибку.
8.
Большинство людей не учитывает совокупную
природу вероятности событий, связанных
с риском.
9.
Люди оценивают вероятности драматичных
и широко освещаемых в прессе событий
выше, чем вероятности менее драматичных
или менее известных событий. В целом
люди переоценивают вероятности частых
событий и недооценивают вероятности
редких событий
10.
Существует тенденция игнорировать
информацию о базовых уровнях, особенно
при составлении прогнозов на основе
сочетания разной информации.
11.
Лишь немногие люди понимают, что если
человек получает исключительно высокие
или низкие результаты при одном измерении,
то при втором измерении его результаты,
скорее всего, окажутся ближе к среднему
значению.
12.
Чаще всего используются две оценки с
тяготением к центру — среднее
арифметическое и срединное значение
(или медиана). Каждое из них рассчитывается
по особой математической формуле.
13.
При оценке риска у большинства людей
постоянно действуют некоторые
предубеждения. Это занижение вероятности
добровольного риска и риска в ситуациях,
которые мы считаем находящимися под
нашим контролем, и переоценка рисков в
искусственно созданных ситуациях,
которые хорошо запоминаются и не
поддаются наблюдению.
14.
Многие люди ошибочно верят, что
статистические данные, выраженные
точными числами (например, со многими
десятичными знаками), заслуживают
большего доверия.
15.
Экстраполяцией называется метод оценки
величины путем продолжения ряда известных
ее значений.
Термины
для запоминания
Проверьте,
насколько хорошо вы разобрались в
понятиях, представленных в этой главе,
перечитав их определения. Если окажется,
что какой-то термин вызывает у вас
затруднения, обязательно перечитайте
раздел, в котором он обсуждается. (346:)
Базовый
уровень. Начальная
или априорная вероятность появления
события.
В
достаточно протяженном интервале
времени. Обозначает
необходимость многократных испытаний
для получения оценки доли «успешных»
исходов.
Вероятность.
Отношение
количества способов, которыми может
произойти определенное событие, к общему
числу возможных исходов (когда все
возможные исходы равноправны). Это
характеристика того, насколько часто
мы ожидаем появления события в
достаточно протяженном интервале
времени. Этим
термином также пользуются для выражения
степени уверенности и частоты появления
события в прошлом.
Выборка.
Подгруппа
контингента, которую изучают, чтобы
судить обо всем контингенте.
Древовидные
диаграммы. Разветвляющиеся
диаграммы, которые можно использовать
при расчете вероятностей для учета всех
возможных исходов последовательности
событий.
Законы
случая (или вероятности).
Умение прогнозировать количество или
процентную долю попыток, которые
окончатся определенным исходом.
Значимые
различия. Различия
между двумя группами наблюдений, которые
столь велики, что, вероятно, возникли
не случайно.
Игнорирование
базового уровня. Постоянная
тенденция к игнорированию или недооценке
начальных вероятностей (базовых уровней)
и к преувеличению значений вторичной
вероятности при принятии решения о
вероятности данного исхода.
Медиана
(срединное значение). Оценка
с тяготением к центру, которая
рассчитывается путем нахождения
значения, стоящего в середине возрастающего
или убывающего ряда значений.
Независимые
события. Два
или несколько событий являются
независимыми, если появление любого из
этих событий не влияет на появление
остальных.
Нерепрезентативная
выборка. Выборка,
не отражающая особенности контингента,
из которого она отобрана.
Объективная
вероятность. Количественные
суждения о вероятностях событий с
известными частотностями, полученные
математическим путем.
Ожидаемое
значение выигрыша. Количество
денег, которое вы ожидаете выиграть в
конечном счете при повторных ставках.
Согласно математической формуле
ожидаемое значение выигрыша равно сумме
вероятности выигрыша, умноженной на
величину выигрыша, и вероятности
проигрыша, умноженной на величину
проигрыша.
Относительная
частотность. То,
как часто происходит событие по отношению
к другим событиям, возможным в тот же
момент времени.
Оценки
с тяготением к центру. Рассчитанные
на выборках или контингентах показатели,
обобщающие все значения величины в виде
одного числа. Две из таких оценок с
тяготением к центру — это среднее
арифметическое и медиана.
Ошибка
игрока. Ошибочное
представление о том, что случайные
события самокорректируются. Многие
люди неправильно считают, что если
случайное событие давно не происходило,
то вероятность его появления возрастает.
Ошибка
конъюнкции. Ошибочное
представление о том, что совместное
появление одного или нескольких событий
более вероятно, чем появление одного
из этих событий. (347:)
Размер
выборки. Количество
человек, выбранных для эксперимента.
Регрессия
к среднему значению. Обычно,
когда человек получает исключительно
высокие или низкие результаты при
измерении какого-либо показателя, то
при втором измерении его результаты,
скорее всего, окажутся ближе к среднему
значению.
События
с несколькими возможными исходами.
События,
исход которых зависит от двух или
нескольких испытаний: например, выпадение
двух орлов при двух бросках монеты.
Совокупная
вероятность. Вероятность
появления события при проведении
многократных испытаний.
Среднее
арифметическое. Оценка
с тяготением к центру, которая
рассчитывается путем сложения всех
имеющихся значений и деления полученной
суммы на количество слагаемых.
Статистические
данные. Показатели,
которые рассчитываются для описания
выборки. (Статистика — раздел математики,
изучающий вероятности и математические
характеристики распределений чисел.)
Субъективная
вероятность. Личные
оценки вероятности появления случайных
событий.
Шансы.
Математический
способ указания вероятности, который
часто применяется в области спорта.
Экстраполяция.
Оценка
величины путем продолжения ряда известных
ее значений.
Явление
чрезмерной уверенности. Тенденция
людей испытывать большую уверенность
в своих суждениях о вероятности, чем
позволяют значения объективной
вероятности. (348:)
ПОДМЕЧАЕМ ПРОТИВОРЕЧИЯ ОШИБОЧНОГО РАССУЖДЕНИЯ 203 не поддерживают экстремизм, тогда — даже если каждый отдельно взятый экстремист злобен — неэкстремистов, отличающихся злобностью, почти наверняка окажется больше.
Эта ошибка называется игнорированием базового уровня, поскольку не учитывает про- порциональное соотношение обсуждаемых явлений. В повседневной жизни она чаще всего наблюдается в форме стереотипного неприятия национальных меньшинств: «Мой дом огра- били. Наверняка это дело рук кого-то из иммигрантов — почти все они преступники». Нередко такого рода выводы опровергаются статистикой, поскольку — независимо от уровня крими- нализованности немногочисленной этнической группы — общее число преступников, не при- надлежащих к этой группе, намного больше.
Эта ошибка наблюдается в сферах финансов и бизнеса, когда сосредоточение на цели по- лучения большой прибыли путем продажи дорогих, но редко приобретаемых товаров приво- дит к пренебрежению более важным показателем совокупных продаж.
Вопрос. Я получаю $200 с продажи каждого холодильника и всего $5 — с картриджа для принтера. Мне нужно сосредоточиться на продажах холодильников, верно?
Правильный ответ. Нет, поскольку ты продаешь только два холодильника в неделю, но мог бы продавать по 100 картриджей ежедневно.
В общем виде эта логическая ошибка выглядит следующим образом: Большинство А являются С; немногие В являются С; Х — С; вероятно, Х есть также А.
ИНФОРМАЦИЯ К РАЗМЫШЛЕНИЮ. Почему, на ваш взгляд, так легко игнорировать базовый уровень, размышляя о явлении с участием больших и малых групп? Как бы вы объяс- нили эту проблему другому человеку?
ОТ ИГНОРИРОВАНИЯ БАЗОВОГО УРОВНЯ К ТЕОРЕМЕ БАЙЕСА Для успешного обучения и научной работы особенно важно уметь распознавать одну из раз- новидностей ошибки игнорирования базового уровня, которая может возникнуть при ана- лизе редких или маловероятных событий.
Прочтите следующий абзац, посвященный сдаче анализа на редкое (вымышленное) за- болевание — назовем его вымышлит. С учетом имеющейся информации, каковы шансы, что я страдаю вымышлитом?
Я прохожу обследование по поводу вымышлита, заболевания, поражающего одного человека из миллиона. У меня отсутствуют симптомы, но я читал об этом недуге в интернете и хочу убедиться, что со мной все в порядке. Врач говорит, что если вымышлит имеется, то анализ всегда безошибочно выявляет его. Если человек здоров, то анализ точен на 99,9%. Прекрасно! Я сдаю анализ и через пять минут получаю результат. Он положительный. Анализ показал, что у меня вымышлит. Ну почему мне так не везет!
КРАЙНЕ МАЛОВЕРОЯТНО ВЕСЬМА ВЕРОЯТНО Игнорирование базового уровня: ошибка, при которой не при- нимается в расчет пропорциональ- ное соотношение обсуждаемых явлений, вле- кущая за собой некорректный вывод о вероят- ности результата.
Игнорирование базового уровня: игнорированием базового уровня,