Шум и сигнал
Шум и сигнал
Многие примеры, приведенные в этой книге, относятся к тем случаям, когда прогнозисты ошибочно принимают корреляцию за причинно-следственную связь, а шум за сигнал. Вплоть до 1997 г. принадлежность команды – победителя Суперкубка по американскому футболу к одной из лиг достаточно сильно коррелировала с направлением фондового рынка в следующем году. Однако эта связь не подкреплялась никаким заслуживавшим уважения механизмом причинно-следственных отношений, и если бы вы инвестировали свои деньги, руководствуясь только этой зависимостью, то, в конечном итоге, лишились бы последней рубашки. Индикатор, связанный с Суперкубком, давал нам фальшивый позитивный результат.
Иногда справедливым бывает и обратное. Шум способен заглушить сигнал даже в случаях, когда у вас, в сущности, нет сомнений в том, что сигнал действительно существует. Возьмем, например, взаимозависимость, которую вряд ли кто-то будет оспаривать: если вы потребляете больше калорий, то ваши шансы располнеть увеличатся. Но уверены ли вы, что столь очевидная зависимость находит свое отражение в статистических данных?
Я загрузил в программу данные по 84 странам, для которых оценка уровня полноты жителей и объем потребления калорий находятся в открытом доступе{797}. При взгляде с этой точки зрения связь между этими показателями начинает казаться совершенно неочевидной. В Южной Корее (где в рационе жителей присутствует много мяса) ежедневное потребление калорий находится на уровне примерно 3070 калорий на человека, что несколько выше среднего значения по всему миру. Однако доля полных людей в этой стране составляет всего лишь 3 %. В то же время жители тихоокеанского острова Науру ежедневно потребляют примерно столько же калорий, что и жители Южной Кореи{798}, однако полных людей там не менее 79 %. Если нанести данные по всем 84 странам на график (рис. 12.1), то мы увидим, что связь между излишним весом и потреблением калорий не совсем очевидна; по стандартным тестам, такие результаты не были бы признаны «статистически значимыми»[157].
Рис. 12.1. Соотношение среднего потребления калорий на человека в день и доли полных людей в 84 странах мира
Разумеется, увидеть подлинную связь мешает множество различных факторов. Возможно, что у жителей некоторых странах лучше генетика или они ведут более подвижный образ жизни. Кроме того, неточны и сами данные о том, как много калорий реально потребляет в день взрослый человек{799}. Однако исследователь, принимающий эти статистические свидетельства слишком буквально, может все же ошибочно отвергнуть связь между потреблением калорий и излишним весом, то есть получить ошибочный отрицательный результат.
Конечно, было бы замечательно, если бы мы могли просто импортировать данные в статистическую модель, произвести расчеты и согласиться с тем, что результат достаточно точно описывает происходящее в реальном мире. В некоторых условиях, особенно в богатых данными областях типа бейсбола, такое предположение достаточно близко к тому, чтобы считаться правильным. Но во многих других случаях неспособность понять суть причинно-следственной связи заводит нас в тупик.
У нас было множество причин сомневаться в глобальном потеплении, если бы оно не имело под собой причинно-следственной связи. Климат Земли проходит через различные фазы потепления и похолодания, которые разворачиваются на протяжении лет, десятилетий или столетий. Эти циклы начали действовать задолго до появления промышленной цивилизации. Однако любые предсказания выглядят более убедительными, если подкрепляются правильным пониманием первопричин того или иного явления. И мы хорошо понимаем первопричину глобального потепления – это парниковый эффект.
Данный текст является ознакомительным фрагментом.