Проблема ложноположительного срабатывания[108]
Проблема ложноположительного срабатывания[108]
Когда мы не можем думать подобно истинным байесовцам, ложноположительное срабатывание начинает представлять собой проблему не только для маммографии, но и для всей науки. В введении я упомянул работу врача-исследователя Джона П. А. Иоаннидиса. В 2005 г. Иоаннидис опубликовал влиятельный труд под названием «Почему самые широко публикуемые выводы исследований неверны»{577}, в котором процитировал множество статистических и теоретических аргументов, подтверждавших, что (как и следует из названия) большинство гипотез, признанных истинными в медицине и большинстве других научных профессий, являются, по сути, ложными.
Гипотеза Иоаннидиса, как мы уже сказали, кажется одной из немногих истинных. Так, сотрудники компании Bayer Laboratories обнаружили, что не могут повторить в ходе собственных экспериментов до двух третей положительных заключений, опубликованных в медицинских журналах{578}. Еще один способ проверить правдивость выводов исследования состоит в том, чтобы понять, насколько точными являются результаты предсказаний в реальном мире, И, как мы видим на множестве примеров, приведенных в этой книге, часто выводы не выдерживают испытание реальностью. Судя по всему, частота появления неудачных предсказаний во множестве областей, от сейсмологии до политических наук, оказывается невероятно высокой.
«За последние 20 лет благодаря геометрическому росту доступной информации, развитию геномики и других технологий мы получили возможность измерять миллионы и миллионы потенциально интересных переменных, – рассказал мне Иоаннидис. – Можно ожидать, что мы сможем использовать эту информацию для того, чтобы заставить предсказания работать на нас. Я не говорю, что мы не достигли никакого прогресса. Принимая во внимание наличие миллионов научных работ, признать это было бы крайне стыдно. Однако совершенно очевидно, что мы не сделали миллионов открытий. Большинство работ не вносят реального вклада в развитие знания».
Вот почему наши предсказания могут оказаться более подверженными неудаче в эру Больших данных. С экспоненциальным ростом объема доступной информации по той же экспоненте растет и количество гипотез, требующих изучения. Например, правительство США в настоящее время публикует сведения о 45 тыс. экономических статистических показателей. Если вы захотите протестировать связи между всеми комбинациями из пар этих показателей – есть ли, допустим, причинно-следственная связь между ставкой банковского кредитования и уровнем безработицы в Алабаме? – то вам потребуется протестировать не меньше миллиарда гипотез[109]. Однако количество осмысленных связей в данных, говорящих о наличии причинно-следственной связи, а не о корреляции, и позволяющих протестировать то, каким образом мир работает по-настоящему, на много порядков ниже. Истина не растет теми же темпами, что и информация; по сути, в мире сейчас не больше истины, чем было до появления интернета или печатного пресса. Основная часть данных – всего лишь шум, так же как основная часть Вселенной заполнена вакуумом.
Тем не менее, как мы знаем из теоремы Байеса, в случаях, когда реальная вероятность возникновения какой-либо болезни в популяции низка (рак груди у молодых женщин; истина в море данных), ложноположительное срабатывание может доминировать в результатах, если только мы не будем достаточно внимательны и осторожны. На рис. 8.3 представлено графическое отображение этой картины. Так, 80 % истинных научных гипотез вполне справедливо признаются истинными, а около 90 % неверных гипотез совершенно справедливо отвергаются. Тем не менее, поскольку истинные открытия возникают крайне редко, оказывается, что около двух третей выводов, которые мы считаем правильными, на самом деле оказываются ложными!
Рис. 8.3. Графическое отображение ложноположительного срабатывания
К сожалению, как выяснил Иоаннидис, состояние опубликованных исследований в большинстве областей, по которым проводилось статистическое тестирование, напоминает ту картину, что можно увидеть на рис. 8.3[110].
Почему же доля ошибок так велика? До определенной степени вся данная книга представляет собой ответ на этот вопрос. Причин можно назвать много: отчасти они связаны с нашими психологическими предубеждениями, отчасти – с распространенными методологическими ошибками, а отчасти – с неправильно выстроенными стимулами.
Однако основная проблема лежит в том, что тип статистического мышления, который используют различные исследователи, является ошибочным по своей сути.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКДанный текст является ознакомительным фрагментом.
Читайте также
Проблема
Проблема Человек умирал. Он прожил не очень долгую по нашим временам жизнь, но и не очень короткую — среднестатистическую. И прожил он ее средне. Многие другие прожили лучше. Но таких, кто прожил еще хуже, было не меньше. Человек знал, что жить ему осталось от силы день, а
Проблема Европы
Проблема Европы Мне кажется, заплатили за страшный разгул нацизма в Европе в ХХ веке одни немцы. Остальные все отряхнулись и пошли. Может быть, в этом причина того, что нацизм возвращается. Понимаете? Может быть, потому, что только немцы заплатили.Нацизм, подобный
Вічна проблема
Вічна проблема Останнім часом[2] у світі й справді спостерігається тенденція до значної демократизації і свободи. За даними громадської організації «Дім Свободи» (Freedom House), яка проводить щорічні міжнародні опитування про стан дотримання політичних і громадянських прав
Проблема геогигиены
Проблема геогигиены Мы живем в быстро меняющемся мире. Промышленное и гидротехническое строительство, лесозаготовки, распашка целинных земель, применение ядохимикатов — это все неконтролируемым, стихийным образом меняет облик Земли, нашу "среду обитания". Научное
Проблема-2050
Проблема-2050 Подводя итог сказанному, стоит вернуться к статье Владимира Путина о национальном вопросе, где фигурирует сравнение иммиграционных процессов наших дней с «новым великим переселением народов», изменившим «привычный уклад и облик целых
Проблема ціни
Проблема ціни Додумалися вони до цього не самі: піонером тут, вірогідно, став І. Лисяк-Рудницький, згідно з концептом якого «українська революція» хоч і не досягла своєї мети[56], але «внутрішньо переродила суспільство України», «створила Україну як модерну політичну
ПРОБЛЕМА № 1
ПРОБЛЕМА № 1 Как определить, что является важнейшей проблемой общества? Спрашивать об этом людей бесполезно. Они будут повторять то, что им навязали СМИ. У людей могут быть разные мнения насчет того, как проблему решать, но по поводу самих проблем есть определенный
Коренная проблема — проблема «двух народов»
Коренная проблема — проблема «двух народов» Обратите взор в прошлое. Разве вы не видите, что трёхсотлетняя история «православного царства» Романовых — это прогрессирующая (особенно с начала XVIII века) алчность и коррумпированность правящей верхушки и бюрократического
1. Проблема достоверности
1. Проблема достоверности Оставим в покое тот нюанс, что можно родиться при царе, но нельзя родиться при боярине, пусть он трижды свояк Филарета (см. контекст). Итак, проблема достоверности, поиск ляпов, сравнение текста с энциклопедией и справочником… В последнее время
ПРОБЛЕМА ТАБОТОВ
ПРОБЛЕМА ТАБОТОВ Во-первых и прежде всего: в середине XIX века Аксум посетил легат патриарха Армении, полный решимости доказать, что предание о нахождении там ковчега, «в которое верит вся Абиссиния», является на деле «отвратительной ложью». Оказав определенный нажим на
ПРОБЛЕМА
ПРОБЛЕМА Предполагается, что основной конкретной причиной неконкурентоспособности российских товаров (а значит, и экономики в целом) является их низкое качество. Считается также, что основным лекарством против этого являются иностранные инвестиции. Примем пока эти
3. ПРОБЛЕМА СЕВЕР— ЮГ
3. ПРОБЛЕМА СЕВЕР— ЮГ Даже если многими террористами не движет непосредственно нищета, неравенство в процессе глобализации порождает восстание против Запада, использованное Исламом. Хирш, сентябрь 2002 До сентября 2001 г. подлинная пропасть в уровне жизни тридцати стран —
Проблема геогигиены
Проблема геогигиены Мы живем в быстро меняющемся мире. Промышленное и гидротехническое строительство, лесозаготовки, распашка целинных земель, применение ядохимикатов — это все неконтролируемым, стихийным образом меняет облик Земли, нашу «среду обитания». Научное
В чем здесь проблема?
В чем здесь проблема? Россия сегодня снова на распутье. Ей необходим лидер, который мог бы вывести страну на новый виток. И конечно, здесь напрашиваются исторические параллели.В 1920-е годы, когда Сталин пришел к власти, страна была истерзана революцией и Гражданской войной.