Когда статистика отклонилась от принципов Байеса
Когда статистика отклонилась от принципов Байеса
Английский статистик и биолог по имени Рональд Эймлер (Р. A.) Фишер был, возможно, основным интеллектуальным соперником Томаса Байеса, несмотря на то что он родился в 1890 г., почти через 120 лет после его смерти. Он проявил себя еще более яркой личностью, чем Байес, и таким же олицетворением английской интеллектуальной традиции своего времени, каким в наши дни стал Кристофер Хитченс. Он был миловидным, но неопрятно одетым человеком{579}, постоянно курил трубку или сигареты и вел непрекращающийся бой с реальными и вымышленными соперниками.
Посредственный лектор, но в то же время проницательный писатель, обладавший чутьем к драматическим сюжетам, он оставался отличным и востребованным собеседником за обедом. Интересы Фишера были невероятно широкими. Один из лучших биологов и генетиков своего времени, но при этом беззастенчивый сторонник элитизма, он искренне оплакивал тот факт, что у представителей бедных классов имелось значительно больше потомства, чем у интеллектуалов{580} (сам Фишер, следуя собственным убеждениям, с осознанием собственного долга дал жизнь восьмерым отпрыскам).
Возможно, Фишер в большей степени, чем кто-либо еще, отвечает за то, какими статистическими методами мы широко пользуемся в настоящее время. Он разработал терминологию проверки статистической значимости и значительную часть соответствующей методологии. Он не относился к числу больших поклонников Байеса и Лапласа, но именно он впервые использовал термин «байесовский» (Bayesian) в опубликованной статье, причем довольно уничижительным образом{581}, а в другой статье утверждал, что теория Байеса «должна быть полностью отвергнута»{582}.
Фишер и его современники не видели проблемы в формуле, называемой теоремой Байеса, как таковой, поскольку это обычное математическое выражение. Скорее, они беспокоились о том, как следует ее применять. В частности, у них вызывало вопросы понятие байесовского априорного значения{583}. Оно казалось им слишком субъективным: мы должны заранее предусмотреть, насколько вероятным мы считаем какое-то событие, прежде чем пуститься в эксперименты? Не противоречит ли это понятиям объективной науки?
Поэтому Фишер и его современники решили разработать набор статистических методов, которые, как они надеялись, освободят нас от любого возможного негативного влияния предубеждений и искажений. Это направление статистики обычно называется «фреквентизм» (frequentism), хотя также его называют «фишеровской статистикой» (в противовес байесовской){584}.
Идея фреквентизма состоит в том, что неопределенность в статистической проблеме возникает исключительно из-за того, что сбор данных производится на выборке, а не на всей популяции. Это имеет вполне разумные основания, когда мы изучаем, допустим, результаты политических опросов. Например, при проведении опросов в Калифорнии выборка составляет всего 800 человек, а не 8 млн, которые придут голосовать на очередных выборах, в результате возникает так называемая ошибка выборки. Величина ошибки, которую вы видите в описании политических опросов, измеряет именно это – насколько велика вероятность ошибки из-за того, что вы опрашиваете 800 представителей популяции из 8 млн? Методы фреквентистов как раз и призваны дать этому параметру количественную оценку.
Однако даже в контексте политических выборов ошибки выборки не всегда позволяют рассказать всю историю. В течение короткого интервала между конференцией демократической партии в Айове и первичными выборами демократической партии в Нью-Гемпшире в 2008 г. в последнем штате было опрошено около 15 тыс. человек{585} – невероятно много для столь небольшого штата, притом что предел погрешности теоретически составлял ±0,8 %. Однако реальная ошибка оказалась в 10 раз выше: Хиллари Клинтон выиграла выборы в штате с перевесом в 3 %, хотя, по данным опросов, уступала Бараку Обаме 8 %. Ошибка выборки – единственный тип ошибки, которому фреквентисты дают право на существование, – была, пожалуй, меньшей из проблем, возникшей при проведении опросов в Нью-Гемпшире.
Кроме того, некоторые организации, занимающиеся опросами, стабильно демонстрируют искажение в сторону той или иной партии{586}. С тем же успехом они могли бы опросить все 200 млн взрослых американцев и все равно получить неверные результаты. Байес разобрался с этими проблемами уже 250 лет назад. Если вы используете искаженный инструмент, то не важно, как много измерений вы произведете, вы неправильно сформулировали цель.
По сути, фреквентистский подход к статистике пытается изо всех сил утвердиться в мысли о том, что частая причина неверных предсказаний – это человеческая ошибка. Этот подход рассматривает неопределенность как нечто, присущее эксперименту, а не нашей способности понимать реальный мир. Фреквентистский метод также предполагает, что чем больше данных мы собираем, тем меньше становится ошибка. Со временем она приблизится к нулю. Таким образом, наличие данных считается необходимым и достаточным для решения любой проблемы. Многие из куда более проблемных вопросов предсказания, описанных в этой книге, связаны с областями, в которых полезные данные встречаются крайне редко, и порой их сбор действительно является важным и ценным делом. Однако неправильное использование этого метода вряд ли поставит вас на верный путь к статистическому совершенству. Как заметил Иоаннидис, эра Больших данных лишь ухудшает проблемы ложных позитивных выводов в исследовательской литературе.
Фреквентистский метод нельзя считать особенно объективным ни в теории, ни на практике. Напротив, он полагается на целый ряд предположений. Например, обычно предполагается, что неопределенность в измерении следует колоколообразной кривой или нормальному распределению. Часто это предположение достаточно хорошо описывает ситуацию, но не в случае таких вещей, как колебания на фондовом рынке. Фреквентистский подход требует определения выборки, которая будет выглядеть достаточно прямолинейно, когда дело касается политического опроса, но довольно неоднородно во многих других областях практического применения.
Какую «выборку из популяции» можно было бы выбрать в случае атаки 11 сентября?
Однако еще бо?льшая проблема состоит в том, что фреквентистские методы – в своем стремлении создать безупречные статистические процедуры, которые не могут быть испорчены предубеждениями самого исследователя, – вынуждают его герметично закрываться от реального мира. Эти методы не позволяют такому исследователю изучить глубокий контекст или ущербные черты своей гипотезы, то есть то, чего требует байесовский метод в форме априорной вероятности. В результате можно увидеть, на первый взгляд, серьезные научные работы о том, как жабы могут предсказывать землетрясения{587}, или о том, как оптовые магазины типа Target стимулируют создание нетерпимости в обществе{588}. В подобных исследованиях фреквентистские тесты применяются для создания «статистически значимых» (однако, по сути, бессмысленных и даже возмутительных) выводов.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКДанный текст является ознакомительным фрагментом.
Читайте также
Слизняки, принимаемые за людей. Что нам выгоднее: когда знают о нас правду или когда говорят о нас вздор?
Слизняки, принимаемые за людей. Что нам выгоднее: когда знают о нас правду или когда говорят о нас вздор? В наше время чуть не вся Европа влюбилась в турок, более или менее. Прежде, например, ну хоть год назад, хоть и старались в Европе отыскать в турках какие-то национальные
1.4. Глобальная цивилизация: конфликтность идеалов и принципов
1.4. Глобальная цивилизация: конфликтность идеалов и принципов В таком понимании течения событий в Жизни трагедия в США 11 сентября 2001 г. — ещё один стимул к тому, чтобы заняться глобальной социологией, т.е. выявить конфликтные принципы и идеалы, свойственные
4. Преимущества новых принципов партийного строительства
4. Преимущества новых принципов партийного строительства 4.1. В сфере перспективЭффективная работа партии по культурно-нравственному преображению общества на её новом жизненном этапе должна базироваться не столько на количественном росте членов партии без учёта их
Невероятное наследие Томаса Байеса
Невероятное наследие Томаса Байеса Томас Байес был английским священником, родившимся то ли в 1701, то ли в 1702 г. О жизни его известно довольно мало, хотя он подарил свое имя целому направлению в статистике и, возможно, самой знаменитой ее теореме. Неясно даже,
Простая математика теоремы Байеса
Простая математика теоремы Байеса Если философская подоплека теоремы Байеса удивительно глубока, то ее математика потрясающе проста. В своей базовой форме это всего лишь алгебраическое выражение с тремя известными переменными и одной неизвестной. Однако эта простая
У МЕНЯ НЕТ ПРИНЦИПОВ, ЕСТЬ ТОЛЬКО НЕРВЫ…
У МЕНЯ НЕТ ПРИНЦИПОВ, ЕСТЬ ТОЛЬКО НЕРВЫ… Биргит ФайтПервая полная публикацияЯ хотела бы для начала поговорить о Марксе и о Фрейде. У вас же есть какие-то взгляды на их счет…Нет никаких! Поймите простую вещь — и это самое серьезное, что я могу сказать по этому поводу, — у
В ТЕНИ ВЕЛИКИХ ПРИНЦИПОВ
В ТЕНИ ВЕЛИКИХ ПРИНЦИПОВ С выходом романа Дети полуночи, вызвавшего в то время (1980) единодушное восхищение, никто в англосаксонском литературном мире уже не сомневался, что Рушди является одним из самых одаренных романистов современности. Роман Сатанинские стихи,
СТАТИСТИКА
СТАТИСТИКА Согласно переписи населения СССР, произведенной в 1959 году, народонаселение Советского Союза составляло 208 828 000 человек. Из этого числа 2 268 000 были евреи.В СССР евреи составляют 11 % научных работников; 10,4 % юристов (прокуроров, судей, адвокатов); 14,7 % советских
Семь принципов
Семь принципов Все семьи очень индивидуальны, каждая и хороша и плоха по-своему (не имею в виду семьи, где родители пьют и детьми не занимаются, — это особый разговор). Наша семья не лучше соседской, где хозяйство ведется гораздо разумнее и экономнее, не хуже семьи,
Когда телевизор умер О том, что случится, когда первенство в передаче информации окончательно перейдет от телевидения к интернету
Когда телевизор умер О том, что случится, когда первенство в передаче информации окончательно перейдет от телевидения к интернету http://www.podst.ru/posts/4563/Я в своей профессиональной жизни сменил несколько ипостасей: работал в журналах, на радио и на телевидении – однако лишь
4. Новая статистика
4. Новая статистика Новая трактовка начала войны подействовала все-таки не на всех: шпион-перебежчик для многих людей представлялся фигурой чересчур одиозной, чтобы его аргументы воспринимать всерьез. Иное дело вопрос о цене Победы. Наверно, нет в России человека,
Применение принципов сетевых войн
Применение принципов сетевых войн Сетевые войны предназначены для ведения в тех условиях, когда необходимо избежать ядерного столкновения и невозможно (или накладно) полноценно использовать технические средства индустриальных войн. Пространством сетевой войны
Во имя принципов
Во имя принципов Конечно, эта политика захвата контроля и господства подается общественности не под лозунгом «увеличения прибылей наших транснациональных корпораций» — этот лозунг был бы плохо принят а в выражениях более благопристойных. Например: «гарантирование
ОБВИНЯЕТ СТАТИСТИКА
ОБВИНЯЕТ СТАТИСТИКА Количество случаев суицида в американских вооруженных силах, по словам представителей Пентагона, в этом году может стать рекордным за все время и превысить, впервые со времен войны во Вьетнаме /1964-73 гг./ число самоубийств среди гражданского
СТАТИСТИКА
СТАТИСТИКА Британцы стали жить дольше, но при этом потолстели, обленились и еще более утеряли веру в Бога, свидетельствуют данные доклада Управления национальной статистики Великобритании. Продолжительность жизни среднестатистического британца увеличилась в 2006 году