Простота без изощренности
Простота без изощренности
Финский ученый Ханна Кокко предпочитает использовать статистическую или прогнозную модель рисования карт{514}. Модель должна содержать достаточно деталей, чтобы быть полезной и честно отображать фундаментальную картину: наверняка вы не захотите упустить из внимания крупные города, рельефные реки, высокие горные массивы и главные дороги.
Однако чрезмерное количество деталей иногда может запутать путешественника, а порой и сбить его с пути. Как было отмечено в главе 5, эти проблемы носят не только эстетический характер.
Без необходимости усложненные модели способны оставить в системе больше шумов, чем сигналов, и в результате плохо воспроизводят лежащую в основе структуру, тем самым ухудшая качество прогнозов.
Но какой объем деталей считать недостаточным или, напротив, чрезмерным? Чтобы изучить картографию и научиться сочетать элементы искусства и науки, присущие ей, может уйти целая жизнь. Возможно, говорить о выстраивании модели как о форме искусства – это уже чересчур, но что-то правильное в идее есть.
Однако в идеале на вопросы, подобные тому, что задала Кокко, можно дать эмпирический ответ. Работает ли модель? Если нет, то, возможно, нам стоит изучить ее с другой степенью детализации. В эпидемиологии традиционные модели, используемые докторами, довольно просты – и не работают так, как хотелось бы.
Самое базовое математическое описание инфекционного заболевания называется SIR-моделью (рис. 7.4). В этой модели, сформулированной в 1927 г.{515}, принято следующее допущение: существуют три «состояния», в одном из которых любой человек может находиться в каждый момент времени. S (susceptible) означает восприимчивые к болезни, I (infectiousill) – заразившиеся, a R (recovery) – выздоровевшие после болезни. В рамках этой модели переход от одного состояния к другому происходит всегда в одном направлении – от S к I и затем к R. Вакцинация выступает своего рода «короткой дорожкой»[96], позволяющей человеку перейти от S к R без перенесения заболевания. Математика этой модели сравнительно проста и сводится к ряду дифференциальных уравнений, которые можно решить на ноутбуке за несколько секунд.
Рис. 7.4. Схематическое изображение SIR-модели
Проблема состоит в том, что для нормальной работы модели требуется сделать множество предположений, и некоторые из них на практике выглядят не вполне реалистично. В частности, в модели заложено предположение, что все участники той или иной популяции ведут себя одинаковым образом: то есть они в равной степени подвержены болезням, имеют одинаковый доступ к вакцинации и пересекаются друг с другом случайным образом. Нет никаких различий с точки зрения расы, пола, возраста, религии или сексуальной ориентации, и все ведут себя более-менее одинаково.
Парадокс ВИЧ в Сан-Франциско
Увидеть недостатки этих допущений проще всего при изучении болезней, передающихся половым путем. В конце 1990?х и начале 2000?х гг. был заметен сильный рост незащищенного секса в гомосексуальном сообществе Сан-Франциско{516}, опустошенном пандемией ВИЧ/СПИД двумя десятилетиями ранее. Некоторые исследователи видели причину этого в увеличении темпов потребления наркотиков, особенно кристального метамфетамина, который наиболее часто вызывает более рискованное сексуальное поведение. Другие обращали внимание на повышение эффективности антиретровирусной терапии – коктейлей из различных лекарственных средств, способных продлить жизнь ВИЧ-инфицированных пациентов на многие годы или десятилетия. В результате геи перестали воспринимать диагноз ВИЧ как смертельный приговор. Другие теории концентрировались на поколенческих закономерностях – молодое поколение геев начало воспринимать Сан-Франциско 1980?х гг. с его эпидемией СПИДа как древнюю историю{517}.
Единственное заключение, с которым соглашались эксперты, состояло в том, что при увеличении случаев незащищенного секса должно было увеличиться и количество случаев заражения ВИЧ{518}. Однако этого не случилось, хотя наблюдался рост других заболеваний, передающихся половым путем. В частности, наблюдался всплеск (с девяти случаев в 1998 г. до 502 в 2004 г.{519}) количества вновь поставленных диагнозов «сифилис» среди мужчин, занимавшихся сексом с другими мужчинами (MSM){520}, притом что в 90?е гг. эти болезни почти исчезли в Сан-Франциско. Выросло и количество заболеваний гонореей. Однако, как ни парадоксально, количество новых случаев ВИЧ не увеличилось. В 2004 г., когда заболеваемость сифилисом достигла самого высокого уровня за многие годы наблюдений, количество диагнозов ВИЧ упало до минимального значения с начала эпидемии СПИДа (рис. 7.5). С точки зрения исследователей, это казалось очень странным: сифилис и ВИЧ в обычных условиях обладают достаточно высокой статистической корреляцией. Кроме этого, между ними имеется причинно-следственная связь, поскольку наличие одной болезни может сделать вас более уязвимым к приобретению второй{521}.
Рис. 7.5. Изменение количества вновь поставленных диагнозов ВИЧ и сифилиса, геи, Сан-Франциско, 1998–004 гг.
Как оказалось, решение парадокса заключалось в том, что геи начали активнее использовать так называемый серосортинг, иными словами, они выбирали половых партнеров с тем же статусом ВИЧ, что и у них. Не до конца понятно, как им удавалось это организовать, однако этот факт был задокументирован детальными поведенческими исследованиями, проведенными в Сан-Франциско{522}, Сиднее{523}, Лондоне и других городах с большими популяциями геев. Возможно, что положительную роль сыграли и кампании в области здравоохранения – часть из них переключилась с идеи борьбы с «усталостью от презервативов» на «обсуждаемую безопасность». Также не исключено и влияние интернета, заменившего бары в качестве лучшего места для поиска половых партнеров. В интернете существуют другие нормы по разглашению информации: многие мужчины указывают в профилях на специализированных сайтах свой статус ВИЧ, а кроме того, в интернете проще задавать интимные вопросы (и получать честные ответы), чем на танцполе{524}.
В чем бы ни состояла причина, было ясно, что это специфическое и локализованное поведение не вполне соответствует простым моделям заболевания – к счастью, в данном случае это означало, что прогнозы исследователей в отношении ВИЧ оказались слишком пугающими. Модели, основанные на различных состояниях, предполагают, что у каждого человека имеется свой уровень восприимчивости к болезни. Это допущение не работает столь же точно в случае болезней, требующих более близкого контакта, или в случаях, когда уровень риска является асимметричным для различных групп населения. Иными словами, вы не можете зайти в продуктовый магазин и выйти из него зараженным ВИЧ.
Почему не сработали модели в Форт-Дикс
Однако даже в случае более простых заболеваний компартментальные модели[97] могут оказаться неприменимыми из-за слишком общих и нестрогих допущений, заложенных в них. Рассмотрим, например, корь.
Корь – это первая болезнь, которую (вследствие ее простоты) начинают изучать будущие эпидемиологи в рамках программы PhD[98]. «Корь представляет собой удобную модель для изучения системы инфекционного заболевания, – утверждает Марк Липсиц, коллега Озоноффа по Гарварду. – Она одномерна. Ее можно выявить с помощью анализа крови, у нее имеется лишь один штамм, и у всех заболевших проявляются одни и те же симптомы. Переболев ею, вы не заразитесь второй раз». Если бы нужно было назвать единственную болезнь, идеально описываемую SIR-моделью, то специалисты выбрали бы корь.
Однако в 1980?х и начале 1990?х гг. в Чикаго был зафиксирован ряд необычно тяжелых всплесков кори, которые эпидемиологи не могли предсказать. В соответствии с традиционной моделью, прививки имелись у такого количества жителей города, которого должно было быть достаточного для формирования так называемого коллективного иммунитета – своего рода биологического эквивалента брандмауэра, благодаря которому болезнь не имеет возможности развиваться и затухает сама собой. Однако в отдельные годы на протяжении 1980?х корью заболевало не менее 1000 жителей города – в основном маленькие дети. Проблема показалась настолько тревожной, что власти приказали медсестрам ходить от двери к двери и делать жителям прививки{525}.
Доктор Роберт Даум, педиатр и специалист по инфекционным заболеваниям, работавший в нескольких больницах Чикагского университета, серьезно изучил эти всплески кори. Даум – настоящий идеал врача. У него глубокий голос, огромная борода и потрясающее чувство юмора. Незадолго до встречи со мной в Чикаго Даум вернулся с Гаити, где вместе с коллегами помогал преодолевать последствия землетрясения 2010 г.
Чикаго, в котором я прожил 13 лет, – это город пригородов. Зачастую пригороды бывают достаточно сегрегированы либо по расовому составу, либо по социально-экономическим признакам. Даум обнаружил, что население пригородов также различалось по отношению к прививкам. Небогатые афроамериканцы, жившие в районах типа Саус-Сайд, неохотно разрешали прививать своих детей вакциной MMR (против кори, свинки и краснухи). Непривитые дети вместе ходили в школу, вместе играли, кашляя и чихая друг на друга. Их поведение отвергало одно из предположений модели SAR о так называемом случайном смешивании, согласно которому любые два человека имеют одинаковый шанс вступить в контакт друг с другом. И понятно было, что эти дети как раз и явились распространителями кори.
Именно это явление неслучайного перемешивания и стало причиной «фиаско свиного гриппа» в 1976 г., когда ученые посчитали H1N1 угрозой национального масштаба на основании нескольких случаев заболевания в Форт-Дикс. Штамм свиного гриппа – известный в наши дни под названием A/New Jersey/76 – казался столь угрожающим отчасти потому, что быстро распространился по военной базе: в течение от двух до трех недель было диагностировано 230 подтвержденных случаев{526}. Это дало ученым основание предположить, что у болезни имеется крайне высокое репродуктивное число R0, близкое к 3, что было сопоставимо со значением R0 для пандемии «испанки» 1918 г.
Однако воинское подразделение можно считать средой, предрасположенной к заболеваниям. Солдаты находятся в нетипично тесном контакте друг с другом, в условиях, где им приходится делиться едой и постельными принадлежностями и сложно уединиться. Более того, они часто выполняют тяжелые физические упражнения, которые временно истощают иммунную систему, а социальные нормы в армии предполагают, что вы должны заниматься делом, даже если больны. Таким образом, для передачи инфекционного заболевания появляется множество возможностей, и оно начинает распространяться значительно быстрее.
Последующее изучение{527} событий в Форт-Дикс показало, что бурное распространение заболевания было вызвано этими особыми факторами, а не его вирулентностью. Форт-Дикс нельзя было считать аналогом какого-нибудь американского пригорода. Сам по себе штамм A/New Jersey/76 не был таким уж опасным. Значение R0 для него составляло всего 1,2, то есть было примерно таким же, как у обычного сезонного гриппа. Если бы дело происходило не на военной базе (или в другом месте с похожими условиями, типа тюрьмы или университетского общежития), то болезнь не распространилась бы так широко. В сущности, грипп в Форт-Дикс исчез сам по себе, после того как на базе не осталось инфицированных людей.
Фиаско, связанное с A/New Jersey/76, – как и парадокс в отношении ВИЧ/сифилиса в Сан-Франциско или всплески кори в Чикаго в 1980?е гг. – способно многое сказать об ограничениях моделей, основанных на слишком упрощенных допущениях. Конечно же, я не хочу сказать, что вам всегда стоит предпочитать сложные модели простым; как мы уже видели в других главах этой книги, сложные модели так же успешно могут завести людей в тупик. А поскольку сложные модели часто дают нам более точные (хотя и не обязательно правильные) ответы, они способны слишком повысить самоуверенность исследователя и заставить его ошибочно считать себя отличным прогнозистом.
Тем не менее, хотя и можно считать плюсом модели ее простоту, она должна быть хотя бы изощренно простой{528}. Модели типа SIR, хотя и полезны для понимания болезни, слишком туповаты для того, чтобы помочь нам предсказать ее дальнейшее развитие.
Данный текст является ознакомительным фрагментом.