Мир-фильтр. Как алгоритмы уплощают культуру (страница 6)
Пейдж и Брин хотели, чтобы их система была относительно нейтральной и оценивала каждый сайт исключительно с точки зрения его релевантности. Задача алгоритма заключалась в предоставлении пользователю наилучшей информации. Ориентирование поиска на определенный сайт или бизнес испортило бы результаты. “Мы полагаем, что поисковые системы, финансируемые за счет рекламы, будут по своей сути отдавать предпочтение рекламодателям и не учитывать нужды потребителей”, – писали предприниматели в 1998 году. И тем не менее в 2000 году они запустили Google AdWords – пилотный продукт компании для рекламодателей (сейчас он называется Google Ads). Забавно читать их критику сегодня, когда именно реклама обеспечивает подавляющую часть доходов компании – более 80 % в 2020 году. Поскольку алгоритм PageRank привел в поисковую систему Google миллиарды людей, компания также получила возможность отслеживать, что ищут пользователи, и таким образом продавать рекламодателям позиции в выдаче при определенных поисковых запросах. Как и результаты поиска, рекламные объявления, показываемые пользователю, тоже определяются алгоритмом. И эта реклама, построенная на поисковом алгоритме, сделала Google настоящим левиафаном.
К началу 2000-х годов наш цифровой опыт уже определялся алгоритмической фильтрацией. Сайт Amazon еще в 1998 году начал использовать совместную фильтрацию при рекомендациях товаров клиентам. Однако система компании не пыталась обнаруживать сходные профили пользователей, чтобы приблизительно оценивать вкусы, как это делала Ringo; она определяла товары, которые часто покупают вместе, – например, погремушка и детская бутылочка. Статья 2017 года, созданная одним из сотрудников Amazon, описывает подобные предложения на сайте:
На главной странице выделялись рекомендации, основанные на ваших прошлых покупках и просмотренных товарах… Корзина рекомендовала добавить другие товары – возможно, спонтанные покупки, которые делаются в последнюю минуту, а возможно, дополнения к тому, что вы уже рассматривали. По окончании заказа появлялись дополнительные рекомендации, предлагающие заказать товары позже.
Такие алгоритмические рекомендации напоминают полки, расположенные непосредственно перед кассой в супермаркетах, – последний стимул купить товары, которые могут вам пригодиться. Но в данном случае рекомендации подбирались индивидуально для каждого пользователя сайта, и в результате, как утверждала статья, получался “магазин для каждого покупателя”. Amazon обнаружила, что персонализированные рекомендации товаров гораздо эффективнее с точки зрения количества кликов и продаж, чем неперсонализированные методы маркетинга – например, реклама на баннерах и списки наиболее популярных товаров, которые нельзя нацелить столь же точно. Алгоритм рекомендаций продвигал бизнес и оказался удобен для покупателя, который получил возможность находить вещи, о необходимости которых даже не подозревал. (Прямо сейчас главная страница Amazon рекомендует мне мойку с аккумуляторным питанием и японскую сковороду для омлета.)
Первые подобные алгоритмы сортировали отдельные электронные письма, музыкантов (в отличие от конкретных песен), веб-страницы и коммерческие товары. По мере развития цифровых платформ рекомендательные системы переместились в более сложные области культуры и стали оперировать гораздо большими скоростями и объемами, обрабатывая миллионы твитов, фильмов, загруженных пользователями видеороликов и даже потенциальных партнеров на свиданиях. Фильтрация стала стандартным способом работы в интернете.
Эта история напоминает также о том, что рекомендательные системы – это не всезнающие сущности, а инструменты, созданные группами технических специалистов. Они могут ошибаться. Ник Сивер – социолог и профессор Университета Тафтса, изучающий рекомендательные системы. Его исследования посвящены человеческой стороне алгоритмов – тому, что думают об алгоритмических рекомендациях создающие их инженеры. В наших беседах Сивер всегда старался прояснить двусмысленную суть алгоритма, отделяя индивидуальное уравнение от корпоративных мотивов, лежащих в основе его разработки, и конечного воздействия на пользователя. “Алгоритм – это метонимическое обозначение для компаний в целом, – говорил он мне. – Алгоритма Фейсбука не существует; существует Фейсбук. Алгоритм – это способ рассказать о решениях Фейсбука”.
Речь здесь не о технологии – нельзя обвинять сам алгоритм в плохих рекомендациях, как нельзя обвинять мост в его инженерных недостатках. Чтобы огромные хранилища контента на цифровых платформах стали доступными, необходима определенная степень упорядочивания. Негативные аспекты Мира-фильтра, возможно, возникли потому, что технология применяется слишком широко, учитывая скорее интересы рекламодателей, нежели опыт пользователей. Рекомендации в том виде, в котором они сейчас существуют, больше не работают для нас; они вызывают у нас все большее отчуждение.
Первые социальные сети
Мои первые значимые воспоминания о социальных сетях связаны с Фейсбуком, в котором я зарегистрировался после того, как поступил в колледж при Университете Тафтса. Дело было летом 2006 года, и в то время потенциальным пользователям требовался официальный адрес электронной почты в домене. edu, чтобы получить доступ к части платформы, которая относилась к колледжам. Тот первый вариант Фейсбука почти неузнаваем по сравнению с сегодняшней структурой. Аудитория строго ограничивалась; я использовал сеть в основном как средство связи с другими студентами университета. Если сегодня Фейсбук можно сравнить с лихорадочной трассой с выездами и заездами через каждые несколько секунд, то в нулевые годы он больше напоминал школьную комнату отдыха, где одновременно могли общаться лишь несколько человек. Вы создавали профиль, обновляли свой статус в нем, вступали в группы по общим интересам – но не более того.
Фейсбук стал едва ли не первым способом социального общения в интернете. Его предшественниками были Friendster и MySpace. Сервисы обмена сообщениями – Instant Messenger компании AOL и gChat компании Google – обеспечивали увлекательные способы общения с друзьями в режиме реального времени. К 2006 году я уже провел сотни часов на более старых форумах, где обсуждались видеоигры и музыка. Однако именно Фейсбук Цукерберга первым грамотно и последовательно связал онлайн-идентичность с офлайновым миром. Платформа поощряла пользователей использовать свои настоящие имена, а не таинственные псевдонимы, и влияла на реальные планы в маленьком мире колледжа: организацию вечеринок, планирование учебной деятельности и завязывание отношений. Тем самым она проложила путь к распространению социальной жизни в интернете для миллионов, а затем и миллиардов пользователей.
В сентябре 2006 года, вскоре после моего появления в Фейсбуке, там появилось одно из крупнейших нововведений – функция, которая определила его будущее в качестве онлайн-гипермаркета, торгующего всем подряд. Главным атрибутом платформы стала лента новостей, бегущий список обновлений, постов и оповещений. Ею нельзя было пренебречь – как только что построенным шоссе, прорезавшим тихую деревню. “Теперь всякий раз, когда вы входите в систему, вы получаете последние новости, связанные с активностью ваших друзей и социальных групп”, – сообщалось в официальном обновлении Фейсбука.
Патент на ленту новостей, поданный в том же году, но полученный только в 2012-м, описывал ее назначение: “Система и метод предоставляют динамически выбранный медиаконтент человеку, использующему электронное устройство в среде социальной сети”. Иными словами, лента новостей представляла собой поток информации, продиктованный алгоритмом, который определял, что именно показывать пользователю. В другом патенте была заявлена возможность “генерировать динамический контент, основанный на взаимоотношениях и персонализированный для участников социальной сети на веб-основе”. Сначала эта лента новостей представляла собой просто поток уведомлений об изменении статуса отношений и новых фотографий в профиле. Это не вызывало особых подозрений.
Более полное описание патентной заявки на ленту новостей говорит о системе совместной фильтрации, действующей в гораздо больших масштабах, нежели системы электронной почты 1990-х годов. Его стоит процитировать полностью, потому что оно предсказывает, во что превратится в следующем десятилетии большая часть онлайн-жизни (от социальных сетей до потоковой передачи данных и электронной торговли): множество автоматизированных лент, диктуемых в большей степени корпорациями, а не пользователями, которые постепенно формируют более пассивные отношения между пользователями и подачей контента.
Элементы медиаконтента выбираются для пользователя на основе его отношений с одним или несколькими другими пользователями. Эти отношения пользователя с другими пользователями отражаются в выбранном медиаконтенте и его формате. Элементам медиаконтента присваивается некоторый порядок (например, на основе их предполагаемой важности для пользователя), и именно в этом порядке их представляют пользователю. Пользователь может изменить порядок элементов медиаконтента. Взаимодействие пользователя с медиаконтентом, доступным в среде социальной сети, отслеживается, и это взаимодействие используется для выбора дополнительных элементов медиаконтента для пользователя.
Этот фрагмент содержит все элементы алгоритмической ленты – системы, которая прогнозирует относительную важность информации для конкретного пользователя, определяемую на основе наблюдения за контентом, который он просматривал в прошлом; затем система продвигает в начало списка тот контент, который, на ее взгляд, с максимальной вероятностью будет столь же интересен. Цель – отфильтровать контент, чтобы выбрать наиболее вовлекающий. Это побуждает пользователя потреблять больше информации и подписываться на большее количество аккаунтов в целом. Социальные сети обрели жизнеспособность, поскольку пользователи могли чаще пользоваться ими и дольше оставаться на сайтах. Если наши друзья не активны в Фейсбуке (у меня, например, как раз такой случай), то и мы, скорее всего, снизим свою активность.
Сначала ленту новостей упорядочивали исключительно в хронологическом порядке, и на первом месте находились самые свежие обновления; однако постепенно она стала подчиняться более алгоритмической логике. По мере развития Фейсбука и увеличения активности пользователей, которые добавляли все больше связей, переходя от личных отношений к публикациям и брендам, объем отдельных обновлений увеличивался. Со временем обычные заметки от друзей дополнились сообщениями от групп, ссылками на новости и объявлениями о распродажах. Обычные пользователи уже не могли рассчитывать, что им удастся следить за хронологической лентой при таком объеме и разнообразии сообщений, но даже если бы попытались, то их либо завалило бы информацией, либо они пропустили бы важное сообщение – что могло вызвать недовольство платформой. В конце концов масштаб и скорость потребления в Фейсбуке привели к тому, что агрессивная алгоритмическая фильтрация стала необходимой.
В 2009 году в Фейсбуке появилась кнопка Like в виде поднятого большого пальца; она стала показывать, насколько пользователю интересен тот или иной контент. Порядок в ленте определяла вовлеченность пользователей, измеряемая лайками, комментариями и предыдущими взаимодействиями аккаунтов между собой. Эта алгоритмическая система получила название EdgeRank, и Фейсбук определил ее основные параметры: совместимость, вес действий и время. Под действием понималось любая деятельность людей в Фейсбуке, которая затем отправляется в ленту новостей в виде фиксируемого обновления. Совместимость отражала степень связи пользователя с автором поста и силу этой связи (например, постоянное комментирование постов друзей). Комментарий оценивался выше, чем лайк, а недавние взаимодействия – выше, чем старые. Показатель веса оценивал различные категории взаимодействий: обновление у друга, разместившего новую фотографию, могло иметь больший вес для алгоритма, нежели размещение ссылки на новость или вступление в новую группу. Время отражало возраст действий: при прочих равных условиях недавние действия с большей вероятностью оказывались в верхней части ленты новостей, нежели старые. Показатель EdgeRank не оставался вечным, как результат баскетбольного матча в турнире; он постоянно менялся. И эти три категории – не просто отдельные, нейтральные единицы данных; это совокупность данных, упакованных и интерпретированных Фейсбуком особым образом.