Опасность экстраполяции

Опасность экстраполяции

Экстраполяция является одним из основных методов прогнозирования, порой слишком простым. В сущности, это предположение о том, что текущая тенденция будет развиваться и в будущем, причем до бесконечности. Некоторые самые известные неудачные предсказания были сделаны именно вследствие слишком вольного обращения с подобным предположением.

Например, на рубеже XX в. многие градостроители были обеспокоены увеличением использования конных экипажей, следствием использования которых было загрязнение улиц конским навозом. Один из авторов газеты Times of London предсказывал, что если в 1894 г. улицы Лондона, фигурально выражаясь, погрязли по колено в навозе, то к 1940?м гг. они окажутся погребенными под трехметровой толщей этой субстанции{491}. К счастью, примерно через 10 лет после публикации этой статьи Генри Форд начал производить первые прототипы автомобиля «Модели Т», и подобного кризиса удалось избежать.

Экстраполяция также стала виновником и некоторых других неудачных предсказаний, связанных с ростом населения. Возможно, самые первые серьезные усилия по предсказанию роста населения в мире были предприняты английским экономистом сэром Уильямом Петти в 1682 г.{492}. В то время статистика населения была не особенно доступна, и Петти выполнил большую инновационную работу, чтобы рассчитать (достаточно точно), что темп роста населения в XVII в. был довольно медленным. Однако затем он совершенно неверно предположил, что события в будущем станут развиваться точно такими же темпами, и, согласно его прогнозам, глобальное население планеты в 2012 г. должно было составить всего чуть более 700 млн человек{493}.

Через сто лет началась промышленная революция, и население начало расти значительно быстрее. В реальности количество жителей планеты, перевалившее за 7 млрд в конце 2011 г.{494}, примерно в 10 раз больше, чем следовало из прогнозов Петти.

В 1968 г. была издана достаточно противоречивая книга «Демографическая бомба» (Paul Ehrlich «Population Bomb»), написанная биологом из Стэнфорда Полом Р. Эрлихом и его женой, Анной Эрлих. В ней была допущена противоположная ошибка. Авторы этой книги совершенно ошибочно предположили, что от голода в 1970?е гг. умрут сотни миллионов людей{495}. Неудача этого предсказания была вызвана огромным количеством причин, в том числе и склонностью Эрлихов концентрироваться на самых страшных сценариях, чтобы привлечь внимание к своей точке зрения. Однако одна значительная проблема состояла в том, что они предполагали сохранение высокого уровня рождаемости, присущего эре свободной любви 1960?х гг., и в будущем. С их точки зрения, это означало появление все большего и большего количества голодных ртов[93].

«В процессе написания “Демографической бомбы” я предполагал, что интерес людей к сексу и детям настолько силен, что изменить размер семьи будет сложно, – рассказывал мне Пол Эрлих в коротком интервью, – но затем мы поняли, что, если относиться к женщинам достойно и предоставить им достаточно возможностей для работы, показатель рождаемости начинает снижаться». Другие ученые, не склонные к подобным упрощениям, поняли это уже тогда. Прогнозы роста населения, изданные ООН в 1960?е и 1970?е гг., в целом достаточно точно показали, чему будет равна численность населения планеты через 30 или 40 лет{496}.

Экстраполяция приводит к одной из самых значительных проблем при исследовании как роста населения, так и распространения болезней, когда изучаемый показатель увеличивается по экспоненте. В начале 1980?х гг. совокупное количество случаев заболевания СПИДом, диагностированных в США, росло в геометрической прогрессии{497}: в 1980 г. было 99 случаев, в 1981 г. – 434, а к 1984 г. оно достигло 11 148. Эти цифры можно нанести на график, как сделали некоторые ученые в то время{498}, и попытаться его экстраполировать, чтобы выявить закономерность. В этом случае можно было бы сделать прогноз о том, что количество случаев СПИДа, диагностированных в США, могло бы вырасти к 1995 г. до 270 тыс. Довольно неутешительный прогноз, однако на самом деле все стало гораздо хуже: к 1985 г. СПИДом заболело около 560 тыс. человек, то есть примерно в два раза больше (рис. 7.2).

Рис. 7.2. Общее количество случаев заболевания СПИДом, диагностированных в США: реальное до 1984 г. и экстраполированное до 1995 г.

Возможно, однако, что с точки зрения статистики точные прогнозы, основанные на экстраполяции по экспоненциальной шкале, вообще нельзя делать. Даже корректная версия этого метода{499}, учитывающая предел погрешности, показывает, что количество случаев заболевания СПИДом в 1995 г. могло колебаться в пределах от 35 тыс. до 1,8 млн. Этот диапазон слишком широк, чтобы дать какую-то разумную основу для прогноза.

Почему оказались неудачными предсказания, касающиеся эпидемии гриппа в 2009 г.

Хотя статистические методы, используемые эпидемиологами при анализе вспышек гриппа, не так просты, как в описанных выше примерах, при их использовании все равно приходится сталкиваться с проблемой экстраполяции. Это связано с тем, что обычно имеется только небольшое количество потенциально сомнительных базовых точек данных.

Одной из самых полезных переменных при прогнозировании распространения болезни является так называемое репродуктивное число, обычно обозначаемое R0. Значение R0 показывает, какое количество неинфицированных людей потенциально могут заразиться от единственного инфицированного человека. Например, значение R0, равное 4, означает, что – при отсутствии вакцин или других средств защиты – заболевший человек передаст болезнь еще четырем людям до того момента, как выздоровеет (или умрет).

Теоретически любая болезнь с R0 > 1 распространится со временем (при отсутствии вакцин и карантинов) на все население. Однако порой значение R0 бывало обманчивым: оно приближалось к 3 для «испанки», к 6 для оспы и к 15 для кори. В случае малярии, одной из самых смертельно опасных болезней в истории цивилизации, до сих пор отвечающей примерно за 10 % смертей в некоторых уголках мира, значение этого показателя может достигать сотен{500} (табл. 7.1).

Таблица 7.1. Медианные значения[94] R0 для различных заболеваний{501}

Проблема состоит в невозможности сформулировать надежные расчеты R0 до тех пор, пока болезнь не распространится по всему сообществу и пока у вас не появится достаточно времени для тщательного изучения статистики. Поэтому эпидемиологи вынуждены делать экстраполяции, основываясь на ранних и немногих данных. Измерить на ранних этапах другой ключевой статистический показатель заболеваемости, смертность, может быть столь же сложно. Мы сталкиваемся с ситуацией «Уловки-22»; болезнь невозможно точно предсказать без этой информации, однако надежные количественные расчеты чаще всего оказываются невозможными, пока болезнь не наберет обороты.

Данные о первых вспышках инфекционных заболеваний часто бывают искаженными. Например, приведенные выше цифры о первых поставленных диагнозах СПИДа в США стали доступными лишь через несколько лет после заражений. Но даже скорректированные статистические данные не позволили улучшить качество прогнозов. Однако если бы мы были вынуждены положиться на данные, реально доступные ученым в то время{502}, то результаты могли оказаться еще хуже. Это связано с тем, что в первые годы своего развития СПИД плохо воспринимался и вызывал чувство стыда как у пациентов, так и у врачей{503}. Множество странных синдромов с симптомами, напоминавшими СПИД, оставались без диагноза или диагностировались неправильно – иногда причиной смерти считались другие инфекции, вызываемые СПИДом. Лишь многие годы спустя, когда врачи начали заново открывать старые истории болезней, им удалось лучше оценить развитие СПИДа в первые годы.

Неточные данные также послужили причиной плохих прогнозов распространения свиного гриппа в 2009 г. Смертность, связанная с H1N1, была, по всей видимости, достаточно высокой в Мексике, однако оказалась невероятно низкой в США. Хотя отчасти это было связано с различиями в эффективности здравоохранения в каждой стране, значительная часть различий представляла собой на самом деле статистическую иллюзию.

Само понятие смертности представляет собой простое отношение количества смертельных случаев, вызванных болезнью, к количеству случаев заболеваний. Однако оба элемента этого соотношения вызывают целый ряд вопросов. С одной стороны, в Мексике имелась тенденция относить к жертвам H1N1 людей, умерших от других форм гриппа или вообще других болезней. Лабораторные тесты показали, что не менее четверти смертей, ранее связывавшихся с действием вируса H1N1, в реальности не имели никаких черт, присущих гриппу. С другой стороны, в ряде случаев данные о заболеваниях, вызванных вирусом H1N1, передавались не в полном объеме. В таких развивающихся странах, как Мексика, не развиты ни такая сложная система отчетов, как в Соединенных Штатах, ни культура посещения врача при первых признаках заболевания{504}. Факт быстрого распространения заболевания после того, как оно оказалось на территории США, заставляет предположить, что в Мексике имелись десятки, а то и десятки тысяч заболевших, о которых не было известно властям.

Фактически вирус H1N1 мог циркулировать по южной и центральной Мексике на протяжении ряда месяцев, пока на него не обратила внимание медицинская общественность (занятая в то время поисками следов птичьего гриппа в Азии). Отчеты о вспышке респираторного заболевания появились сначала в небольшом городке Ла Глория, штат Веракрус, в начале марта 2009 г., после того как гриппом заболело большинство жителей, однако поначалу мексиканские власти полагали, что это вызвано более привычным штаммом вируса под названием H3N2{505}.

Напротив, свиной грипп был навязчивым объектом множества публикаций в СМИ с момента его появления на территории США. Только несколько случаев могло бы остаться без внимания. Так как в США используются более высокие стандарты отчетности, показатель смертности там был более надежным и позволял исключить некоторые плохие сценарии из дальнейшего рассмотрения – но лишь до тех пор, пока не оказалось слишком поздно отказываться от некоторых пугающих прогнозов, ставших доступными широкой публике.

Данный текст является ознакомительным фрагментом.