Серендипность и риски
Серендипность и риски
Серендипность нам нужна, потому что из-за склонности концентрировать внимание на уже знакомом мы можем пропустить что-то в хорошем смысле провокационное и вдохновляющее просто потому, что это что-то неизвестное и незнакомое. В самой метафоре блуждания содержится мысль о том, что серендипность непредсказуема, требует времени и не может быть гарантирована никем и ничем.
Значительная часть усилий, направленных на создание онлайн-рекомендаций, тратится на снижение рисков. Мы знаем, что юные пользователи социальных сетей часто просят совета у своих друзей, прежде чем принять какое-либо решение. Если большинство ваших друзей считают, что T. G. I. Fridays на углу вполне себе приличное заведение, то пойти туда будет менее рискованным решением, нежели в турецкое кафе в следующем квартале. Стремление избегать рисков вполне оправданно, когда речь идет о выборе чего-то дорогостоящего. Не стоит покупать машину, о происхождении которой вы ничего не знаете, а вот обед в незнакомом ресторане может привести к неожиданному открытию.
Занимающаяся видеопрокатом в сети компания Netflix использует рекомендации, чтобы помочь своим клиентам найти (и взять) фильмы, о которых они могли и не слышать. Это серьезная проблема для компании, поскольку многие клиенты, начиная пользоваться сервисом, берут сразу несколько десятков фильмов, которые они хотели посмотреть, после чего перестают пользоваться и оплачивать ежемесячную подписку. А высококачественный рекомендательный сервис может помочь Netflix удержать клиента.
Netflix дает рекомендации на основе принципа «коллективного фильтра». Принцип работает так: вы обозначаете свои предпочтения, назвав несколько фильмов, которые вам нравятся, и несколько, которые не нравятся, и система ищет пользователей с похожими на ваш вкусами, потом собирает информацию об их любимых фильмах и рекомендует вам те, что вы не видели. Вся фишка в том, как вычислить пользователей с похожими вкусами.
Один из популярных методов подобных вычислений называется «коэффициент Отиаи» или «косинус сходства». Компьютерная программа собирает ваши рейтинги ряда фильмов и сравнивает с рейтингами всех остальных пользователей. Если ваши рейтинги полностью совпали с рейтингами другого пользователя – к примеру, вы оба присвоили фильму «Касабланка» пять звезд, а киноленте «Миссия невыполнима» одну, – вы получаете одно очко. Если у вас вообще нет совпадений – получаете ноль. За этим стоят потрясающе эффектные, хоть и слегка головоломные математические расчеты. Представьте себе мир, в котором есть только два фильма – «Касабланка» и «Миссия невыполнима». Первой картине я даю пять звезд, второй одну. Теперь на графике, где «Касабланка» – это ось X, а «Миссия невыполнима» – ось Y, ставим точку в месте пересечения 5 и 1 и проводим линию, проходящую через точки 0,0 и 5,1. Получился вектор моих кинопредпочтений.
Теперь представим, что «Миссия невыполнима» вам очень понравилась, а «Касабланку» вы считаете сильно переоцененной. Тогда вы ставите точку на пересечении 1 и 5, а вектор, проходящий через 0,0 и 1,5, представляет ваши кинопредпочтения. Угол между вашим вектором и моим является мерой нашей с вами схожести, а с помощью косинуса этого угла легко будет вычислить точное выражение этой схожести в диапазоне между 0 и 1 для углов от 0 до 90 градусов. Сложность, конечно, в том, что в мире много больше двух фильмов. С помощью косинуса сходства можно добавить к нашему графику по измерению на каждый новый фильм. Поэтому, когда мы сравниваем наши с вами вкусы в кинематографе, мы играем с векторами, существующими в стотысячемерном пространстве, где на каждый фильм из коллекции Netflix приходится по одному измерению. Можете даже не пытаться представить себе стотысячемерное пространство. Достаточно будет представить трехмерное, в котором два вектора выходят из точки 0, 0, 0 и оба проходят через конкретную точку в обозначенном осями X, Y и Z пространстве. А потом просто поверьте на слово, что математически то же самое можно сделать и в гораздо более многомерном пространстве.
Отбор фильмов с помощью линейной алгебры может привести к самым неожиданным результатам. Вам нравятся старые фильмы со Стивом Мартином и японский мультсериал FLCL? Мне тоже. А еще мне нравятся эпические роуд-муви Вима Вендерса. Ни одна здравая система, основанная на истории кинематографа, не предложит вам новое немецкое кино, исходя из вашего увлечения американским фарсом и японским аниме… а вот коллективный фильтр может, если в системе будет по крайней мере несколько людей с похожими на мой вкусами.
Коллективный фильтр работает, и работает неплохо. Если вы когда-нибудь покупали книгу, рекомендованную Amazon на основе ваших предыдущих покупок, эта система знакома вам, и, скорее всего, с хорошей стороны. Однако Netflix хочет, чтобы коллективный фильтр работал еще лучше. Компания пообещала приз в 100 тысяч долларов любому, кто сможет существенно улучшить алгоритм их системы. Netflix располагает огромными массивами данных о персональных рейтингах, поэтому сравнить новый алгоритм с уже существующим не составляет труда: на основе 50 оцененных пользователем фильмов спрогнозируйте, какую оценку он поставит «Клубу “Завтрак”»? Сравните ваш прогноз с реальным поведением пользователя, и вы поймете, насколько оказались близки. Если предложенные вами прогнозы будут заметно точнее сегодняшнего алгоритма Netflix, считайте, что приз ваш.
Приз выиграла команда компьютерщиков из AT&T и Yahoo!. Ни одного концептуального прорыва они не предложили, тем не менее, найдя сотни мелких недочетов в действующем алгоритме Netflix и исправив их, они добились заметного результата. Компания выплатила полагающийся приз, система стала работать лучше, однако ничего такого сотрясающего основы представлений о коллективном фильтре мы не узнали.
Мой друг Натан Курц не входил в команду победителей, хотя в начале конкурса его алгоритмы входили в первую двадцатку претендентов. Примерно на полпути к финалу Курц понял, что его представления о проблемах рекомендации расходятся с принципами Netflix. Чтобы выиграть объявленный ими конкурс, нужно, чтобы ваш прогноз максимально точно отражал реальные рейтинги пользователей. Таким образом, сведения о том, что пользователь поставит некоему фильму три звезды, – что в качественном выражении означает «так себе», – важны не менее, чем прогноз, что пользователь, скорее всего, поставит фильму пять. Компании нужна эта информация, потому что она хочет предугадывать ваши впечатления о фильме. Но Курцу такая постановка вопроса казалась абсурдной: «Кто станет брать фильм, которому вы дадите три звезды? Мне нужно кино, которое изменит мою жизнь. Я хочу посмотреть фильм, о котором никто никогда не слышал, и полюбить его так глубоко, что придется искать других пользователей, поставивших ему пять звезд, потому что это, скорее всего, родные мне по духу люди».
В ходе обсуждения проблем среди претендентов на приз Netflix стало понятно, что существует небольшая категория фильмов, которые с большим трудом поддаются алгоритмическому подсчету. Один из таких фильмов – «Наполеон Динамит», культовая картина о взрослении в маленьком американском городке, которую пользователи Netflix либо обожают, либо ненавидят. Очень немногие ставят этому фильму три звезды, если уж вы решили поставить ему оценку, то, скорее всего, это будет либо пять, либо единица. Поскольку условием конкурса был максимально близкий прогноз по предпочтениям пользователя, проблема «Наполеона Динамита» стала для многих участников ключевой. Многие из них настраивали систему так, чтобы минимизировать влияние вызывающих наибольшие противоречия фильмов на другие прогнозы, поскольку пять звезд, поставленные «Наполеону Динамиту», практически не влияют на другие предпочтения пользователя.
Для Курца фильмы, подобные «Наполеону Динамиту», стали толчком к пониманию того, что существуют другие способы прогнозирования с помощью коллективного фильтра. Ведь можно замахнуться на высший балл и предлагать только те фильмы, которым вы поставили бы пять, при этом придется пойти на риск, что некоторые, а возможно и многие, фильмы не оправдают прогноз на высочайшую оценку. Жизнь пользователей созданной Курцем системы была бы менее предсказуемой, зато более интересной и насыщенной.
Сам Курц, к сожалению, совершенно непредсказуемо попал в полосу невезения еще до окончания конкурса Netflix. От комаров, живущих в канаве позади его дома в Лас-Крусес, Нью-Мексико, он подхватил лихорадку Западного Нила, после чего два года приходил в себя. Пока Курц боролся с болезнью, его мыслительные способности снизились. «Я уже не мог писать код, – признается он, – а уж о новом, не имеющем аналогов алгоритме не было и речи. Кроме того, я не знал, смогу ли я восстановиться, так что мне пришлось подумать о новом способе зарабатывать себе на жизнь».
Курц выбрал кулинарию и начал делать сорбет с использованием высоких технологий, которые мог бы по-настоящему оценить только Дэвид Арнольд. В его сорбете нет ни эмульгаторов, ни связующих веществ. Там только фруктовый сок, иногда подслащенный свекольным сахаром, замороженный в твердые ледяные цилиндры и измельченный специальным устройством Pacojet, которое титановым ножом перемалывает лед в два слоя микроном толщиной. В результате получается субстанция, которая тает во рту, как крем, но сохраняет вкус первоначального ингредиента.
Верный своим рекомендательным принципам, Курц делает сорбет, который вызывает противоположные чувства. Такие вкусы, как «Миндаль и розовый перец», «Анахаймский чили», «Сладкий стручковый горох», «Цитрусовый укроп», «Нектарин и перец хабанеро», «Ревень и имбирь», «Кокос и тайский базилик», могут и не понравиться каждому встречному-поперечному, но в любой большой группе людей практически обязательно найдется человек, для которого «Свекольный лимон» станет вкусовым откровением и лучшим кулинарным впечатлением в жизни.
«Это работает, потому что мы настойчиво предлагаем клиентам попробовать все вкусы», – говорит Курц, пока я доедаю «Лимон и шисо» в его оклендском заведении Scream Sorbet. «Некоторые им могут совсем не понравиться, но всегда найдется вкус, который они, скорее всего, полюбят. Я не хочу, чтобы мои клиенты пробовали что-то посредственное. Я хочу, чтобы они нашли свой новый любимый вкус».
Вы не откроете пенициллин, если в вашу чашку Петри не залетят посторонние споры. И вам, вероятно, придется сглотнуть пару ложек «Жареной японской редьки» (которую сам Курц считает наименее успешным экспериментом), прежде чем вы откроете для себя «Миндаль и розовый перец» (мой любимый вкус). Чтобы пережить состояние серендипности, нам придется взять на себя риски, связанные с неудачами, неуверенностью в успехе и потраченным впустую временем. Если мы хотим переформатировать медиа, с которыми мы сталкиваемся, с тем, чтобы они повышали вероятность серендипности, то ключевым моментом может стать повышение нашей терпимости к рискам, чтобы фиаско не было таким болезненным, или по крайней мере – таким невкусным.
По моим прогнозам, в ближайшие десять лет инструменты, повышающие вероятность серендипности и помогающие нам сталкиваться с неизвестной и полезной информацией, станут не менее важными, чем поисковики и социальные сети сегодня. В Массачусетском технологическом институте мы со студентами работаем над созданием систем, которые тщательно отслеживают все, что вы читаете в сети и каким контентом вы делитесь с друзьями, но не с тем, чтобы найти пользователей со схожими предпочтениями, но чтобы помочь вам обнаружить доселе неизвестные вам сообщества. Мы исследуем способы обнаружения сотен сообществ в Twitter и Facebook, чтобы вычленить истории, которые были бы интересны прежде ничем не связанным группам пользователей. Иными словами, мы ищем локальные максимумы, которые иначе сложно было бы обнаружить.
В этом направлении нас ждет огромный объем работ, связанный как с разработкой инструментов, которые помогали бы читателям и исследователям видеть, что им доступно, а что они упускают, так и с помощью, оказываемой кураторам в их деятельности по привлечению людей в неизвестные районы и самые удивительные места интернета. Нам нужны как технологические прорывы, так и новые пути подхода к проблемам исследования и открытия. Чрезвычайно важны для нас системы, которые визуализировали бы то, что мы уже видели, но не менее важны инструменты, которые помогли бы нам находить наводящих мосты и переводчиков, способных контекстуализировать наши находки. Наши первые шаги по созданию благоприятных условий для серендипности начинаются с понимания того, что тот, кто способен осуществлять новые, не имеющие аналогов типы связей, обладает новой силой.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКДанный текст является ознакомительным фрагментом.
Читайте также
Идеологические риски Путина
Идеологические риски Путина В целом основные параметры формулы Путина сохранены и отступление от устойчивого состояния этой формулы, связанное с либеральной имитацией последующих четырех лет, пока некритично. Но если речь идет не о вынужденном колебании, а о тренде, о
Риски при создании двух государств
Риски при создании двух государств Уникальность конфликта между Палестиной и Израилем состоит в том, что каждая из сторон претендует на обладание одной и той же территорией. Для палестинцев это часть их большой родины, а для евреев – их историческая родина, земля
Риски «суверенного долга»
Риски «суверенного долга» В немецкой традиции в области валютной политики со времен Второй мировой войны не подлежало никакому сомнению и даже считалось пагубным, что в задачи Бундесбанка не входит прямо или косвенно участие в финансировании государственного долга. В
Риски денежного финансирования со стороны ЕЦБ
Риски денежного финансирования со стороны ЕЦБ Итак, правы ли те, которые считают покупку государственных облигаций ЕЦБ не вызывающей опасений для политики стабилизации? Конечно, нет! Ситуация такая же, как и с курением: риски более опасны, так как они проявляются не
«Ползучая демократизация»: возможности и РИСКИ
«Ползучая демократизация»: возможности и РИСКИ «Ползучая демократизация» [243] представляет собой долгий и извилистый путь – сложный поэтапный, иногда довольно длительный во времени, процесс перехода от авторитаризма к демократии посредством серии стратегических
БЫТЬ В ОППОЗИЦИИ: РИСКИ И УГРОЗЫ?
БЫТЬ В ОППОЗИЦИИ: РИСКИ И УГРОЗЫ? («Эхо Москвы», 6 августа 2012)Е. Альбац: В эфире радиостанция «Эхо Москвы» и телекомпания RTVi, начинаем нашу программу, посвященную ключевым событиям недели, тем событиям, которые будут иметь влияние на политику ближайших недель и месяцев.У нас
Риски нормальности
Риски нормальности Более века тому назад британский эссеист Уолтер Бэджет сказал, что монархия – «это вразумительное правление», потому что «значительная часть человечества понимает его, и едва ли на земле найдется другое правление, которое будут так понимать». Сейчас
Глава седьмая. Серендипность в большом городе
Глава седьмая. Серендипность в большом городе Уильям Гибсон в опубликованной в 1984 году книге «Нейромантик» живописал интернет как физическое пространство, огромный, красочный город, где в величественных зданиях располагаются принадлежащие глобальным корпорациям
Серендипность
Серендипность Свою последнюю книгу, написанную в соавторстве с Элинор Барбер и опубликованную посмертно, Роберт К. Мертон посвятил серендипности. Для знаменитого социолога такая тема исследования может показаться странной, с другой стороны, большой вклад в эту область
Риски и страхи пассажира
Риски и страхи пассажира Симптоматично: нынешний пассажир озабочен поиском информации. Об авиакомпании, о самолетах, об экипажах. Откуда у него такая специфическая любознательность?В стародавние времена народ знал о нашем Аэрофлоте только то, что наши самолеты — самые
Глава 11 Риски, связанные с программой SETI
Глава 11 Риски, связанные с программой SETI В 2008 году выходит очередной номер авторитетного журнала по прогнозированию Futures, посвященный рискам человеческого вымирания. Составитель этого выпуска Брюс Тонн объявил, что принимает на рассмотрение статьи любой тематики,
Риски и пути их преодоления
Риски и пути их преодоления Aon Analytics, Global Risk Management Survey, 2009Bernstein, Peter L, Against the Gods: the remarkable story of risk, John Wiley & Sons, 1996Taleb, Nassim Nicholas, The Black Swan: the impact of the highly improbable, Allen Lane, 2007World Economic Forum, Global Risks 2008, WEF, 2007. (The 2009 report is available online at
Кредитные деньги: риски ростовщиков и общества
Кредитные деньги: риски ростовщиков и общества Возникает естественный вопрос: затрагивает ли кризис кредиторов, не возникает ли «эффект домино», когда обанкротившийся получатель кредита тянет за собой в яму банкира? Ничего подобного! Банкиры не любят рисковать, а для
Риски частных инвестиций
Риски частных инвестиций Люди, в отличие от экспертов, банкиров или чиновников, подразделяют средства, остающиеся после текущих расходов, на сбережения и накопления. И пусть деньги одни и те же, задачи у каждой «кучки» разные.Сбережения – это средства «на черный день», та
Алексей Гордеев -- Выгоды и риски
Алексей Гордеев -- Выгоды и риски За препирательствами демократов и республиканцев по поводу повышения лимита государственного долга и предотвращения дефолта США можно было наблюдать почти бесконечно. Однако "час Х" всё-таки пришёл, и проблема была решена. Лимит