Глава 4 Обман в исследованиях
Глава 4
Обман в исследованиях
До сего момента я говорил о проведении клинических исследований как о чем-то само собой разумеющемся, как будто в них нет ничего сложного: просто берете несколько пациентов, разделяете их на две группы, даете первой одно лекарство, а второй — другое, потом немного погодя смотрите, есть ли разница в результатах, продемонстрированных обеими группами.
Скоро мы увидим, как можно различными способами фундаментально исказить и ход эксперимента, и анализ результатов так, чтобы преувеличить эффективность лекарств и скрыть вред, приносимый ими. Некоторые из применяемых уловок и приемов являются грубым нарушением закона: мошенничество, например, непростительно и бесчестно. Некоторые трюки балансируют на грани, превращая информацию в полуправду. Некоторые могут пойти на крайние меры в трудной ситуации, чтобы сэкономить деньги или получить результаты как можно быстрее, и поэтому можно судить о каждом конкретном исследовании, только зная все его обстоятельства. Однако, я думаю, ясно то, что во многих случаях люди прибегают к нечестным приемам под давлением ложных стимулов.
Также следует помнить, что многие нечестные исследования, включая те из них, о которых речь пойдет дальше, проводятся независимыми учеными. Фармацевтические компании не устают подчеркивать, что при проведении сравнения методов независимо проспонсированных исследований с методами исследований, оплаченных производителями лекарств, последние оказывались более удачными. Возможно, это и правда, но данная информация почти что не относится к делу по простой причине: независимые исследователи всего лишь статисты в этом спектакле. 97 % клинических исследований, о которых сообщается в печати, спонсируются фармацевтическими компаниями. Они составляют львиную долю всех проверок лекарств, поэтому организующие их специалисты задают тон и устанавливают стандарты.
Наконец, прежде чем мы перейдем к сути дела, хочу предупредить читателей, что следующая глава довольна сложна. В ней излагается сложная для понимания обычного, рядового гражданина информация научного характера, которую по силам усвоить каждому, однако в некоторых случаях от вас потребуется прилагать больше мыслительных усилий, чем обычно. Для особо трудных случаев я привожу краткое резюме в начале, после чего идет изложение всей истории. Если подробная информация окажется слишком сложной для вас, можете пропустить все детали и полагаться на краткую выжимку в начале статьи. Я не обижусь. Что касается последней главы, посвященной уловкам в маркетинге, то она просто нашпигована ужасными историями, которые вам никак нельзя пропустить.
Итак, об обмане в исследованиях.
Явный подлог
Подлог и фальсификация данных — это настоящая пощечина обществу. В этой главе мы познакомимся с различными коварными уловками, с пограничными случаями (балансирующими на грани полуправды и полулжи), и случаями изящного плутовства на грани дозволенного. Из всех способов одурачивания больше всего я не люблю подлог, потому что для подделки чего бы то ни было большого ума не требуется. Мошеннику не нужны ни изощренная методология, ни умение правдоподобно отрицать вину, ни доводы, подкрепляющие факты. Мошенник берет и просто выдумывает результаты. Уничтожать информацию, игнорировать факты, придумывать — и так по кругу — вот и все, что ему нужно уметь делать.
К счастью для меня и для пациентов, такой род подлога сравнительно редок, насколько можно судить по свидетельствам очевидцев. Лучшая на текущий момент оценка распространения случаев фальсификации была сделала авторами систематического обзора 2009 года, в котором были сведены все результаты исследований 21-й работы. В ходе исследования специалистов из различных областей науки опросили на предмет фальсификации данных. Неудивительно, что в зависимости от постановки вопроса люди давали разные ответы. 2 % респондентов признались в том, что занимались фабрикацией, фальсификацией или редактированием данных по крайней мере один раз в своей карьере, однако число утвердительных ответов выросло до 14 %, если интервьюируемых спрашивали, известно ли им о подобного рода поступках их коллег. Треть опрошенных допустила также и применение сомнительных исследовательских практик в ходе эксперимента, и снова эта цифра выросла до 70 %, когда их спросили о коллегах.
Можно частично, если не полностью, объяснить такую большую диспропорцию в количестве ответов на вопросы, адресованные напрямую респондентам, и на те, что касались их коллег, тем фактом, что опрашиваемый — один человек, но у него много знакомых, однако поскольку вопросы обсуждались деликатные, можно допустить, что количество утвердительных ответов занижено. Чтобы быть до конца откровенным, нужно сказать, что представители таких наук, как медицина или психология, склонны к фабрикации данных больше, так как при проведении различных исследований многие факторы разнятся, и это означает, что идеальное воспроизведение предыдущих результатов возможно крайне редко. В итоге никто не заподозрит ничего плохого в том, если ваши результаты будут противоречить результатам другого исследования. В областях науки, где исход экспериментов более очевиден и выражается наличием или отсутствием чего-либо, неудача при воспроизведении результатов выявит мошенника гораздо быстрее.
Специалисты во многих сферах науки склонны к пристрастному отбору данных для отчета, и даже некоторые очень известные ученые совершали манипуляции с результатами своих исследований. Американский физик Роберт Милликен получил Нобелевскую премию в 1923 году после демонстрации эксперимента с капельками масла, доказав, что электричество существует в виде отдельных элементов — электронов. Милликен был ученым среднего уровня (пик, когда совершаются подлоги) и долгое время не мог похвастаться большими достижениями в своей карьере. В своей знаменитой работе, опубликованной в «Физическом обзоре» он написал: «Это не выборочные результаты по отдельной группе капель, а результаты по всем каплям за время эксперимента, который продолжался в течение 60 дней». Это утверждение не соответствовало действительности. В работе упоминалось о 58 капельках, но в его записной книжке значилось 175. Напротив стояли записи типа «Прекрасно! Публиковать эти данные» и «Не совпадает, это не сработает». В научной литературе через несколько лет разгорелись ожесточенные дебаты о том, считать ли это подлогом и насколько Милликену повезло, что его результаты смогли быть воспроизведены впоследствии. Но в любом случае, отобранные им данные для отчета (и их пристрастное толкование), были получены во время проведения непрерывной цепи исследовательских действий, которые кажутся абсолютно невинными, если их не изучать слишком пристально. Что делать исследователю с резко выделяющимися показателями в одной графе таблицы, если цифры во всех остальных ее графах выглядят так безупречно? А если что-то упало на пол? А что если машина была неисправна? По этой причине во многих экспериментах действуют четкие правила относительно исключения данных.
Также существует и такой феномен, как явная фабрикация данных. Так доктор Скотт Ройбен, американский анестезиолог, работавший над созданием обезболивающего средства, за всю свою жизнь не провел и 20 клинических исследований из всех, что были описаны им в статьях, опубликованных за прошедшие 10 лет.1 В некоторых случаях он даже не делал вид, что получил лицензию на проведение тестирования лекарств на пациентах в клинике, где работал, а просто вписывал в отчет о результатах исследования цифры, которые придумывал на ходу. Нам никогда не следует забывать, что данные в медицине добывают не для каких-то абстрактных целей или построения отвлеченных теорий. Ройбен утверждал, что будто бы нашел вещества не из группы опиатов, которые при этом были такими же эффективными для послеоперационного купирования боли, как и опиаты. Новость всех восхитила. Опиаты обычно вызывают зависимость и имеют много побочных эффектов. Практика проведения обезболивания во многих странах изменилась, и сейчас в этой сфере царит настоящая путаница. Мошенничество с фактами имеет место в разных сферах медицины, и оно опасно тем, что в результате подлога данных врач и пациент могут принять неверные решения, однако когда речь заходит о боли, вряд ли можно нанести пациенту больший вред.
Есть различные способы, как можно поймать мошенника, однако постоянный неусыпный контроль со стороны медицинских и научных учреждений — не выход, так как не всегда можно вести достаточно строгий мониторинг нарушений. Часто факт подлога или фальсификации раскрывается коллегами мошенника из корыстных побуждений, становится известен случайно либо разоблачается при возникновении сомнений в правдоподобности результатов. Малкольм Пирс, например, британский хирург-акушер, опубликовал отчет о случае, где утверждал, что он удалил внематочную беременность, затем имплантировал плод женщине, а в результате у нее родился здоровый ребенок. Анестезиолог и хирургическая сестра, работавшие в той же больнице, посчитали случившееся маловероятным и заявили, что наверняка услышали бы о таком примечательном случае. Они проверили все истории болезни, не нашли ни одной записи о проведении подобной операции, и таким образом все усилия хирурга пошли прахом.2 Примечательно, что в том же номере журнала была опубликована еще одна статья Пирса, в которой сообщалось об исследовании, где принимали участие 200 женщин с синдромом поликистозных яичников, которых Пирс лечил от повторяющихся выкидышей. Исследование не имело места, и оказалось, что Пирс не только сочинил всю историю от начала до конца, придумал имена пациентов и результаты, но и выдумал название несуществующей фармацевтической компании, которая якобы финансировала исследование. В эпоху Интернета ложь, подобная этой, будет жить недолго.
Есть и другие методы обнаружения фактов подлога. Человеческий мозг — очень плохой генератор случайных чисел, поэтому простые случаи фальсификации данных часто раскрывались статистиками судебной медицины, которые обращали внимание на частоту повторяемости последних цифр. Если некто будет выдумывать числа на ходу и вписывать их в колонку в случайном порядке, то наиболее часто повторяемой цифрой всегда будет семерка, которая нравится нашему подсознанию больше всего. Чтобы замаскировать подлог, фальсификатору нужен генератор случайных чисел, однако прибегнув к его помощи, он столкнется с другой интересной проблемой, которая называется эффект идеального единообразия в случайных числах. Так немецкий физик Ян Хедрик Шен выступал соавтором приблизительно одной работы каждую неделю на протяжении 2001 года, однако его результаты выглядели слишком уж точными. В конечном счете кто-то заметил, что в двух исследованиях на результаты идеальной модели был наложен один и тот же «шум» из цифровых данных. Оказалось, что многие числа были сгенерированы на компьютере с использованием тех же самых уравнений, которые должны были использоваться для проверки данных вместе с якобы случайными реалистично выглядящими вариациями, встроенными в модель.
Есть множество способов, к которым следует прибегать для выявления случаев явной и наглой фальсификации. Нам нужно проводить более тщательные и качественные расследования; регулярно вести более совершенный мониторинг; налаживать отношения с редакторами журналов, мотивируя их сообщать о подозрительных работах, отвергнутых ими; обеспечивать лучшую защиту тем, кто своевременно подал сигнал; проводить выборочную случайную проверку первичных данных по журналам и т. д. Люди часто говорят обо всех этих методах, но редко кто прибегает к их использованию, а все потому что ответственность за нарушения определена неясно и туманно.
Итак, подлог или фальсификация данных. И то, и другое случается в медицине. Этим занимаются не особо умные люди. И подлог можно смело называть преступлением. И такие преступления случаются при содействии «плохих парней». Однако объем ошибочных данных, попадающих в анналы медицинской литературы благодаря подлогу, не так уж и велик по сравнению с регулярными, изощренными и — больше чем что-либо — правдоподобно отрицаемыми каждодневными методологическими искажениями, примеров которых так много в этой книге. Несмотря на очевидность этого, явный подлог практически единственный источник искаженных данных, который регулярно освещается в СМИ, просто потому что факт фальсификации более доступен уму обывателя. И это одна из причин, чтобы прекратить рассказывать о нем и перейти к главному.
Проверяйте лекарство на ненормально идеальных пациентах
Как мы увидели, принимающие участие в клинических исследованиях пациенты часто не имеют ничего общего с реальными больными, которых наблюдает врач каждый день в ходе обычной клинической практики. Поскольку такие идеальные пациенты с больше вероятностью выздоровеют, это преувеличивает эффект от лекарства и заставляет новые дорогие препараты выглядеть более привлекательными в плане соотношения цены и качества, чем они есть на самом деле.
В реальном мире пациенты часто гораздо «многограннее». У них могут быть другие расстройства организма, они могут принимать множество различных медикаментов, которые могут взаимодействовать друг с другом совершенно непредсказуемым образом. Обычные пациенты могут употреблять алкоголь чаще, чем идеальные больные, либо у них могут быть проблемы с почками. Таковы обычные пациенты. Однако в большинстве исследований, на результаты которых мы полагаемся при принятии конкретных решений, лекарства тестируются на нерепрезентативных, ненормально идеальных пациентах, которые часто слишком молоды, имеют в анамнезе всего лишь одно заболевание, испытывают меньше проблем со здоровьем и т. д.3
Разве результаты таких исследований, проведенных на нетипичных пациентах, могут применяться к обычным больным? Во всяком случае, мы знаем, что различные группы пациентов реагируют на лекарства по-разному. Исследования, проведенные на представителях идеальных групп населения, могут, например, завысить достоинства лекарства или же выявить какие-либо полезные свойства, которых у него нет. Иногда в особо критичных случаях равновесие между опасными свойствами лекарства и его эффективностью может полностью меняться у разных групп населения. Так, например, была подтверждена эффективность лекарств против аритмии — они продлевали жизнь пациентам, у которых наблюдались нарушения частоты сердечного ритма, — однако их часто прописывали также и тем, кто пережил сердечный приступ, но у кого были лишь незначительные нарушения сердцебиения. Когда эти препараты были испытаны на второй группе пациентов, ко всеобщему ужасу, обнаружилось, что они в значительной степени повышают риск наступления преждевременной смерти.4
Врачи и ученые часто закрывают глаза на такие случаи, но когда вы начинаете сопоставлять показатели пациентов, принимавших участие в исследованиях, и обычных пациентов, сравнивая все цифры подряд, проблема сразу приобретает более широкий масштаб.
При проведении одного исследования 2007 года было выбрано 179 астматиков из числа обычных граждан с целью проверки, скольких из них признают годными для участия в исследовании лекарств от астмы.5 Ответ — в среднем 6 %. Что интересно, речь шла не о каких-то старых исследованиях. Большинство больных не было допущено к исследованиям, на основе которых были разработаны единые международные рекомендации для лечения астмы в клиниках общего профиля и специализированных больницах. Этих рекомендаций придерживаются во всем мире, но при этом, как показала проверка, они базируются на результатах исследований, из которых исключили бы почти каждого пациента из числа обычных людей, к которым эти же самые рекомендации и будут применяться при лечении.
Авторы другой работы отобрали 600 пациентов, которых лечили от депрессии в амбулаторной клинике, и обнаружили, что в среднем только треть из них была бы допущена к участию в 39 исследованиях по изучению свойств лекарства от депрессии, материалы которых были недавно опубликованы.6 Организаторы часто жалуются на то, что стало трудно набрать пациентов для проведения исследований, однако в одной научной работе описано, как 186 человек с депрессией в анамнезе попробовали записаться на два тестирования антидепрессантов, и больше 7 человек из 8 не были приняты, так как они не соответствовали требованиям.7
Чтобы увидеть, как все происходит на самом деле, мы можем проследить за группой пациентов с каким-то конкретным заболеванием. В 2011 году несколько исследователей из Финляндии собрали всех пациентов, у которых когда-либо был перелом бедра, и проверили, пройдут ли они по критериям, предъявляемым к кандидатам на участие в исследовании по проверке бисфосфонатов — широко распространенного средства для предотвращения переломов.8 Заявки подали 7411 пациентов, но 2134 были исключены сразу же, так как они были мужчинами, а исследование проводилось на женщинах. Есть ли какая-то разница в реакции на лекарства среди мужчин и женщин? Иногда есть. Из оставшихся 5277 пациентов 3596 были исключены, потому что не подходили по возрасту: он должен был быть между 65 и 75 годами. Наконец, 609 пациентов забраковали, так как у них не было остеопороза. Осталось только 1072 человека. Таким образом, результаты исследования лекарств для профилактики переломов могут строго применяться только к одному из семи пациентов с переломом в анамнезе. Они, конечно, могут подействовать и на тех, которых не допустили к проверке, однако такое допущение будет умозрительным. Даже если лекарства и окажутся эффективными для больных из этой «исключенной» группы пациентов, у разных людей сила эффекта проявится по-разному.
Дело не только в том, что стало затруднительно измерить эффективность лекарств. Проблема гораздо шире: по вышеуказанным причинам искажаются наши оценки соотношения цены и качества (в эпоху растущих затрат в сфере медицинских услуг нам нужно также побеспокоиться и о финансовой составляющей при покупке медикаментов). Вот вам один пример, касающийся одного из новых обезболивающих средств под названием коксиб. Препарат попал на рынок благодаря тому, что вызывает меньше кровотечений желудочно-кишечного тракта по сравнению со старыми дешевыми обезболивающими, как, например, недорогой ибупрофен.
Коксиб, видимо, на самом деле, снижает риск возникновения кровотечений в желудочно-кишечном тракте, что хорошо, так как такие кровотечения могут быть достаточно опасными. На самом деле препарат сокращал такой риск примерно вдвое, как показали результаты исследований. Они проводились, конечно же, на идеальных пациентах, у которых наблюдалась повышенная предрасположенность к возникновению кровотечения в желудке или кишечнике. Для людей, проводивших исследование, такой выбор был вполне обоснован: если вы хотите показать, что лекарство сокращает риск возникновения кровотечений, будет гораздо легче и дешевле продемонстрировать это на группе больных, у которых кровотечения случаются довольно часто. В противном случае действие лекарства будет проявляться редко, поэтому к исследованию понадобится привлечь очень большое количество пациентов.
Но появляется интересная проблема, если использовать цифры, отражающие снижение частоты возникновения кровотечений у ненормально идеальных пациентов, для подсчета стоимости предотвращения кровотечения у больных в реальном мире. NICE подсчитала, что такие затраты будут равняться 20000 долларов на каждый случай предотвращения кровотечения, однако верный ответ, скорее всего, 100000 долларов.9 Можно легко понять, где NICE сделала ошибку, выполняя математические вычисления на нескольких простых приблизительных округленных числах, хотя они выглядят почти в точности как настоящие, что очень удобно. Мы должны считать в долларах, потому что анализ, вскрывающий эту проблему, был опубликован в американском научном журнале.
У пациентов из исследования был высокий риск возникновения кровотечений. В течение года у 50 человек из 1000 наблюдалось по одному случаю. Эта частота была снижена до 25 из 1000, если пациенты принимали коксиб, так как этот препарат снижает вероятность появления кровотечения в два раза. Коксиб обходится каждому пациенту в 500 долларов в год. Поэтому потратив $500000 на 1000 пациентов, вы получаете на 25 кровотечений меньше, а $500000?25 означает, что предотвращенные случаи обходятся вам в $20000 каждый.
Но если посмотреть на обычных пациентов, принимающих коксиб, имена которых есть в базе данных врачей общего профиля, то можно увидеть, что у них риск возникновения кровотечений гораздо ниже. В течение года они случаются у 10 человек из 1000. Эта цифра снижается до 5, если они принимают коксиб, так как препарат снижает вероятность кровотечения вдвое. Так что вы платите $500000 за 1000 пациентов, чтобы те принимали коксиб в течение года, однако при этом получаете на 5 кровотечений меньше, и значит $500000?5. Получается, предотвращенные случаи кровотечений обходятся вам в $100000 каждое. Это гораздо больше, чем $20000.
Проблема нерепрезентативности пациентов, принимавших участие в исследованиях, называется проблемой внешней валидности или генерализуемости (обобщаемости). Она может сделать результаты исследования полностью бесполезными для обычных, среднестатистических больных, хотя такая практика абсолютно обычна при проведении научных изысканий, которые выполняются при урезанном бюджете, в сжатые сроки, с целью получения быстрых результатов и при участии людей, которых не волнует то, что эти результаты не будут иметь ничего общего с реальным миром клинической практики. Вроде бы попахивает скандалом, но не громким, а тихим и незаметным. О нем не напишут статью с броским заголовком, так как в истории нет конкретного лекарства-убийцы. Просто изо дня в день происходит медленное и ненужное загрязнение почти всей базы данных в медицине нерепрезентативной информацией.
Сравнивайте ваше лекарство с чем-нибудь никчемным
Испытываемые лекарства часто сравниваются с каким-нибудь не очень качественным препаратом. Мы уже видели, как компании предпочитают сравнивать свои лекарства с таблетками плацебо — пилюлей с сахаром, которая не содержит никакого действующего вещества, поэтому при таких исследованиях планка для прохождения устанавливается очень низко. Также распространено явление, когда во время исследований новый препарат сопоставляется с его заведомо неэффективным аналогом или же с качественным препаратом, который специально дают испытуемым в нелепо мизерных дозах либо наоборот — в несуразно больших.
Ваше лекарство точно предстанет в выгодном свете, если сравнивать его с каким-нибудь не очень действенным препаратом. Идея может показаться абсурдной и даже жестокой, поэтому мы довольны тем, что исследователь Дэниэл Сейфер собрал большую коллекцию исследований, организаторы которых прибегали к использованию низких доз, специально для демонстрации этого явления.10 В одном исследовании пароксетин сравнивался с амитриптилином. Пароксетин — один из новейших антидепрессантов, который почти не вызывает побочных эффектов, таких как сонливость. Амитриптилин — очень старый препарат, известный тем, что от него клонит в сон, поэтому в обычной клинической практике врачи часто советуют пациентам принимать его на ночь, потому что сонливость не сильно беспокоит, если пациент уже спит. Но в этом исследовании амитриптилин давался дважды днем, утром и на ночь. У пациентов большую часть дня отмечалась сонливость от лекарства, поэтому пароксетин на таком фоне выглядел лучше.
Как один из вариантов, в некоторых исследованиях дорогой новый препарат сравнивается со старым, который дают в необычно больших дозах, и поэтому он вызывает более тяжелые побочные эффекты. Этот прием можно проиллюстрировать на примере широкого спектра антипсихотических средств. К нему прибегало не одно поколение исследователей при проведении сравнения двух препаратов.
Шизофрения подобна раку. Это болезнь, от которой нет идеального лекарства, поэтому польза от приема медикаментов часто должна сопоставляться с вредом от побочных эффектов. У каждого страдающего шизофренией разные цели. Некоторые предпочитают жить в постоянной опасности наступления рецидива, потому что любой ценой хотят избежать неприятных ощущений от побочного действия лекарств. Другие полагают, что рецидивы представляют угрозу для их жизни и могут стоить им дома, друзей, работы, поэтому согласны терпеть в обмен на улучшение в самочувствии.
Часто принять решение сложно, потому что побочные эффекты при приеме препаратов от шизофрении — обычное явление. Особенно распространены двигательные расстройства (которые немного похожи на симптомы болезни Паркинсона) и набор веса. В связи с этим целью инновационных мероприятий на данном поле деятельности было создать таблетки, которые устраняют симптомы болезни, но не вызывают побочных эффектов. Около 20 лет назад произошел прорыв. На рынок была выпущена новая группа лекарств, так называемые атипичные средства, которые обещали больным именно то, что им было нужно больше всего. Был проведен ряд исследований для сравнения новых препаратов со старыми.
Сейфер нашел шесть работ, авторы которых сравнивали антипсихотические лекарства нового поколения со старым, надоевшим всем галоперидолом (всем хорошо известно, что он вызывает сильные побочные эффекты). Препарат давался испытуемым в дозах по 20 мг в день. Нельзя сказать, что это слишком много. Такая доза не вырубит больного немедленно, а ее размер не превышает максимально допустимую норму, указанную в Британском национальном фармакологическом справочнике, стандартной инструкции, которой пользуются все врачи при назначении лечения. Однако 20 мг — очень странная доза. Пациенты, получающие действующее вещество в таких больших количествах, неизбежно будут испытывать ряд различных побочных эффектов.
Интересно, что 10 лет спустя история в точности повторилась: рисперидон был одним из первых препаратов из группы нового поколения антипсихотических средств. Срок действия патента на него закончился, он тут же стал очень дешевым, как все лекарства старого поколения. Как следствие, многие фармацевтические компании хотели показать, что их дорогой антипсихотический препарат нового поколения был лучше, чем рисперидон, который неожиданно стал считаться устаревшим. В связи с этим появились результаты исследований, сравнивавших новые лекарства с рисперидоном (его давали в дозе 8 мг). Снова оговоримся: 8 мг — не очень много, но все равно такая дозировка превышает средний уровень. Пациенты, получающие препарат в таких больших количествах, будут, скорее всего, часто жаловаться на побочные эффекты, в результате чего другое лекарство предстанет в более выгодном свете.
И снова мы имеем дело с тихим и незаметным скандалом. Это не значит, что любой из этих специфических препаратов является верным убийцей больных, о котором нужно немедленно написать статью с броским заголовком. Просто во время проведения исследований факты в целом постоянно искажаются.
Слишком короткие исследования
Исследования, как мы видели, часто длятся очень недолго, потому что компании хотят получить результаты как можно скорее, чтобы представить лекарство в лучшем виде, пока на него действует принадлежащий им патент. Ввиду этого возникает несколько проблем, включая те, что мы уже рассмотрели, а именно: для подтверждения эффективности препарата исследователи используют «суррогатные маркеры» (сопутствующие положительные эффекты), такие как изменения в биохимии крови, вместо «конечных маркеров» (основной эффект), например, сокращения частоты сердечных приступов, отслеживание которых занимает дольше времени. При этом недостаточно длительные исследования могут также исказить полезные свойства лекарства просто из-за своей непродолжительности, если долговременные эффекты отличаются от кратковременных.
Например, при операции по удалению раковой опухоли пациент подвержен кратковременным рискам: он может умереть прямо на операционном столе или после хирургического вмешательства от инфекции, однако люди надеются, что эти кратковременные риски уравновешиваются долговременной оптимистичной перспективой. Если провести исследование и сравнить пациентов, которые были прооперированы, с теми, кто отказался от удаления опухоли, но при этом оценивать результаты, собранные в течение лишь одной недели, то можно заметить, что прооперированные пациенты умирали быстрее, чем воздержавшиеся от хирургического вмешательства. Это происходит потому, что некоторые больные могут жить месяцами и даже годами с опухолью, и преимущества такой операции становятся очевидными лишь через месяцы и годы, в то время как риски, относящиеся к тому малому количеству людей, умерших на операционном столе, проявляются немедленно.
Та же самая проблема возникает и при проведении сравнения лекарств. Может наблюдаться неожиданный, мгновенный, кратковременный полезный эффект, скажем, от лекарства для похудения, который со временем снижается и сводится к нулю. Или же могут возникать кратковременные положительные эффекты и долговременные побочные, которые можно отследить только при более длительном наблюдении за пациентами. Так, например, препарат для похудения «Фенфен» вызывал снижение веса при весьма успешных кратковременных исследованиях, но когда принимающие его пациенты наблюдались на протяжении более длительных сроков, таблетки начинали негативно сказываться на состоянии сердечных клапанов.11 Бензодиазепин, лекарство вроде валиума, очень хорош для устранения чувства тревоги в короткие сроки. Исследование, длившееся 6 недель, выявило огромный положительный эффект от него, однако на протяжении последующих месяцев и лет положительное действие снижалось, и пациенты привыкали к препарату. Такие нежелательные явления, проявляющиеся в долгосрочной перспективе, можно обнаружить только во время проведения долговременных исследований.
Однако это не означает, что длительные исследования автоматически выигрывают по сравнению с кратковременными. Все дело в клиническом вопросе, на который вы ищете ответ, или, может быть, пытаетесь уйти от него. Если вы имеете дело с таким дорогим противораковым препаратом, как «Герцептин», вам наверняка захочется узнать, будет ли лечение этим лекарством в течение короткого периода так же эффективно, как и на протяжении более долгого временного отрезка, чтобы не покупать много таблеток без особой надобности и не подвергаться при этом воздействию побочных эффектов в течение более длительного времени. Чтобы узнать это, нужно провести быстрые исследования или, по меньшей мере, исследования с результатами, собранными в течение долгого периода наблюдения, но после проведения не очень длительного лечения. Roche подала заявку на лицензию на «Герцептин», предоставив данные по 12-месячным исследованиям. В Финляндии проверка лекарства проводилась только 9 недель. Обнаружился значительный положительный эффект от препарата, и ведомство Новой Зеландии, аналогичное NICE (Национальный институт здравоохранения и качества медицинской помощи), решило согласовать 9-недельный курс лечения для раковых больных. Компания Roche в свою очередь аннулировала результаты кратковременного исследования и организовала новые продолжительностью 2 года. Как вы догадываетесь, если нам хочется узнать, являются ли 9 недель лечения «Герцептином» такими же эффективными, как лечение тем же препаратом в течение 12 месяцев, нужно провести несколько исследований для сравнения режимов этих двух видов лечения. Спонсирование подобных мероприятий — часто рискованное и смелое предприятие.
Исследования, прекращающиеся раньше срока
Если исследования прекращаются раньше или позже намеченной даты, потому что проводящие их специалисты следят за результатами и выбирают наиболее подходящие по мере их поступления, шансы получить удовлетворительные для организаторов данные повышаются. Это происходит благодаря случайным колебаниям в числовых показателях. Речь идет о несколько усложненном способе, как можно повысить свои шансы выиграть в «орел — решку», используя вышеупомянутую стратегию: «Бросаем! Так, две из трех. Бросаем! Три из пяти? Бросаем! Пять из семи».
Снова и снова мы будем возвращаться в этой книге к одному и тому же принципу: если создать такую ситуацию, при которой у исследователя будет много шансов получить положительный результат, но использовать статистические тесты, предполагающие, что была лишь одна возможность, то можно очень сильно повысить вероятность получения ложноположительного результата. В этом состоит суть проблемы, с которой сталкиваются люди, скрывающие отрицательные результаты. Аналогичная проблема наблюдается и при выборе метода анализа результатов исследований, данные которых не были сокрыты.
Например, если подбрасывать монетку достаточно долго, то очень скоро можно дождаться, когда выпадут четыре орла подряд. Это не одно и то же, если сказать: «Сейчас я брошу монетку и выброшу четыре орла подряд» и сделать это. Мы знаем, что временной промежуток, в течение которого были собраны данные, позволяет выбрать ряд привлекательных для исследователя результатов, и это, как мы тоже знаем, приведет к созданию неправильного представления о лекарстве и неверному толкованию данных.
В исследовании CLASS на протяжении шести месяцев сравнивали новое обезболивающее под названием целекоксиб с двумя старыми препаратами. При приеме нового лекарства наблюдалось меньше проблем с желудочно-кишечным трактом, поэтому его прописывало все больше врачей. Годом позже выяснилось, что изначально планировалось провести еще одно исследование продолжительностью в один год. В течение более длительной проверки целекоксиб не подтвердил свою эффективность, но когда в отчет были включены только результаты за шесть месяцев, препарат засиял во всем великолепии. Именно эти результаты и были указаны в научной статье для публикации.
Нужно признать, что прекращение исследований раньше срока иногда может быть обоснованным. Например, часто прекращают проверку, если у пациентов двух различных групп наблюдаются очень весомые и явные различия в проявленном положительном эффекте, особенно если разница такая большая, такая недвусмысленная и информативная, что даже если отнести ее на счет побочных эффектов, ни один терапевт в здравом уме не продолжит прописывать неудачное лекарство и никто не станет пробовать дать его пациенту снова.
Однако тут надо быть очень осторожным. Некоторые ужасно искаженные данные просочились в науку благодаря людям, которые слишком полагались на такие случайно полученные результаты. Например, исследования по изучению свойств бисопролола во время сосудистой хирургии были остановлены раньше срока, когда в одной группе пациентов сильный сердечный приступ случился всего у двоих, а в контрольной группе, принимавшей плацебо, — у 18 человек. Был сделан вывод, что похоже, препарат очень эффективный и спасает жизни людей, поэтому в рекомендации по лечению были внесены соответствующие поправки. Но когда начали возникать подозрения, что во время предыдущих тестирований полезные свойства препарата были завышены, провели два новых больших исследования, которые обнаружили, что от бисопролола на самом деле не было никакой пользы.12 Первоначальные результаты оказались неверными и заставили исследователей прекратить проверку раньше срока после череды смертей, произошедших по случайному совпадению.
Здесь нужно прояснить, что комитет по этике, контролирующий проведение исследования, может сам иногда потребовать остановить проверку раньше срока, а проверка данных во время исследования представляет собой сложный этический вопрос. Если врачу кажется, что нашлись факты, подтверждающие наличие вреда от того или иного препарата, до окончания исследований (или же сходный этический вопрос — если обнаружено, что один препарат гораздо лучше другого), нужно ли в таком случае продолжать подвергать пациентов воздействию лекарства, которое может представлять серьезную опасность, только для того, чтобы дойти до конца, либо же отнести эти результаты на счет случайного совпадения? И нужно ли закрывать всю лавочку и завершать исследования, при этом зная о существовании потенциальной возможности, что такие случайные результаты могут попасть в медицинские статьи и создать неверное впечатление о лекарстве, а на их основе будут приниматься неверные решения о лечении больных в будущем? Особенно это беспокоит, если вспомнить, что после сокращенных исследований все равно нужно проводить более масштабные и длительные, подвергая риску новых людей, только для того чтобы проверить, были ли результаты аномальными.
Одним из способов, как можно уменьшить нежелательные последствия, вызываемые досрочным прекращением исследований, является разработка правил остановки экспериментальных работ, которые должны быть внедрены еще в самом начале. Эти правила должны быть тщательно разработанными и достаточно строгими, чтобы исключить возможность их применения при возникновении случайной вариации данных, которую можно наблюдать в любом исследовании на каком-нибудь этапе его проведения. Такие правила полезны, так как они ограничивают степень влияния человеческого суждения, которое может быть необъективным и предвзятым.
Однако какие бы мероприятия ни проводились для сокращения последствий от досрочных прекращений исследований, они все равно будут приводить к загрязнению данных. В обзоре от 2010 года были рассмотрены около 100 прерванных исследований и 400 сходных исследований, проведенных до конца в соответствии с планом. Результаты остановленных раньше срока исследований были лучше и завышали эффективность проверяемых лекарств примерно на четверть.13 При проведении другого недавнего обзора выяснилось, что количество исследований, остановленных раньше срока, удвоилось с 1990 года,14 что не очень хорошая новость. В любом случае к результатам исследований, остановленных раньше срока, нужно относиться по меньшей мере с большой долей скепсиса. В особенности потому, что в вышеупомянутых систематических обзорах отмечается, что исследования были прекращены досрочно без указания каких-либо причин.
Наконец, все эти факты нагнетают еще большую тревогу, если посмотреть на то, какие именно исследования останавливались раньше срока, кто их останавливал и для чего используются их результаты в настоящий момент.
В 2008 году четверо итальянских ученых свели вместе все рандомизированные исследования по проверке противораковых препаратов, которые были опубликованы в предыдущие 11 лет и были остановлены ради блага пациентов.15 Больше половины были опубликованы в течение трех прошедших лет, и это лишний раз свидетельствует о том, что данный вопрос становится все более актуальным. Отрасль разработки противораковых препаратов — быстро развивающая сфера медицины, которая постоянно находится на виду. Здесь время — деньги, а новые лекарства могут принести прибыль в кратчайшее время. Результаты 86 % исследований, остановленных раньше срока, использовались при обосновании подачи заявки на лицензию для выпуска новых препаратов на рынок.
Продленные исследования
Было бы ошибкой думать, что какой-то из описанных выше случаев представляет собой пример нарушения простых правил, которые должны бездумно выполняться. Исследование может прекратиться раньше по глупым, необоснованным причинам, однако его могут остановить до срока и по вполне объективным обстоятельствам. Подобным же образом может произойти обратное: иногда исследование может быть продлено обоснованно, но иногда продление исследования или включение в него результатов последующих периодов могут разбавить значимые данные и сделать их менее заметными в общей массе. Салметерол — ингаляторный препарат, используемый для лечения астмы и эмфиземы легких. То, что описано далее16 — если вы сможете понять все технические подробности до конца, — может испугать многих людей, поэтому помните, что это не руководство и здесь не приводится конкретных рекомендаций относительно того, какое лекарство хорошее, а какое плохое. Мы выявляем необъективные методы, которые иногда применяются компаниями при исследованиях всех типов лекарств.
Салметерол — бронхолитическое средство. Принцип его действия основан на расширении воздухоносных путей, благодаря чему астматику становится легче дышать. В 1996 году то тут, то там начали появляться сообщения о том, что салметерол иногда начинает оказывать противоположное действие, вызывая так называемый «парадоксальный бронхоспазм», и только ухудшает самочувствие пациентов. Критики-дилетанты часто игнорируют такие сообщения, так как, по их мнению, они не имеют отношения к науке, но они поступают неправильно. Вовсе не означает, что сообщения о таких случаях не имеют никакой ценности, так как их возникновение часто свидетельствует о первых признаках появления проблемы (или неожиданно выявленной эффективности).
Производитель салметерола, компания GSK, решила расследовать ранние отчеты о негативном действии препарата и организовала рандомизированные исследования. В них состояние пациентов, пользовавшихся аэрозолем салметерола, сравнивалось с самочувствием пациентов, в ингаляторах которых было лекарство-плацебо, то есть без активных веществ. Первичная конечная точка исследования была предварительно определена как «смерть от остановки дыхания и опасные для жизни состояния». Вторичная конечная точка исследования — такие случаи, как смерть от астмы (подгруппа смертей от остановки дыхания), смерть по любым причинам и смерть от астмы и опасные для жизни состояния, — опять все собрано в одну кучу.
Для исследования предполагалось набрать 60000 больных и понаблюдать за ними в течение 28 недель. Исследователи должны были встречаться с пациентами через каждые 4 недели, чтобы узнать о динамике и проблемах. На протяжении 6 месяцев этого 28-недельного периода исследователей попросили докладывать о любых серьезных отрицательных явлениях у больных, которые были им известны, однако они не искали такие явления специально.
Потом случилась темная история, о которой в подробностях рассказали на страницах журнала Lancet несколькими годами позднее Питер Лурие и Сидни Вольф, изучив документы Управления по контролю за качеством пищевых продуктов и лекарственных веществ. В сентябре 2002 года внутренний Комитет по контролю за исследованиями устроил заседание, на котором просмотрел результаты по всем 26000 пациентам, обследованным в ходе проверки. Судя по конечной первичной точке — «смерть от остановки дыхания и опасные для жизни состояния», — салметерол был хуже плацебо, хотя разница была не очень статистически значимой. То же самое можно было сказать и о «смертях от астмы». Комитет уведомил GSK о следующем: вы можете проверить правильность результатов на еще 10000 пациентах, чтобы подтвердить догадку, или завершить исследования с «дальнейшей публикацией результатов в кратчайшие сроки». GSK выбрала последнее и представила внутренний отчет об анализе данных на одной из научных конференций, заявив, что он «незавершенный и неокончательный». В Управлении по контролю за качеством пищевых продуктов и лекарственных веществ забеспокоились и решили внести изменения в текст на этикетке лекарства, где теперь должно было содержаться упоминание о том, что препарат вызывает «небольшое, но значительное повышение количества случаев смерти от астмы».
С этого момента начинаются интересные вещи. GSK выслала статистику по исследованию в Управление, однако предоставленные расчеты были произведены не при помощи метода, указанного в плане исследования, предоставленного до начала работ, который предполагал, что общее количество случаев этих неблагоприятных событий должно учитываться за 28-недельный период исследований, когда такие события тщательно отслеживались, что вполне логично. Вместо этого GSK выслала цифры за весь 12-месячный период: и за 28 недель, когда неблагоприятные эффекты тщательно отслеживались, и за 6 месяцев после окончания исследования, когда поиск неблагоприятных событий активно не велся, поэтому они реже фиксировались в отчете. Это означает, что большое количество неблагоприятных состояний, имевших место в течение 28-недельного периода исследований, понизилось за счет данных более позднего периода, в результате чего проблема стала выглядеть гораздо менее значимой.
Если вы посмотрите на таблицу, приведенную в статье из журнала Lancet, вы увидите, как уловка GSK отразилась на данных. Не расстраивайтесь, если поймете не все. В таблице есть и простая, и сложная для понимания информация. «Относительный риск» описывает, насколько чаще у пациента возникло бы какое-либо событие (например, смерть), если бы он находился в группе, принимавшей салметерол, в сравнении с группой, которая получала плацебо. Так, значение относительного риска, равное 1,31, означает, что вероятность наступления этого события (например, смерти) на 31 % выше.
Данный текст является ознакомительным фрагментом.