Душа машины (страница 4)

Страница 4

Между тем на переднем крае исследований природа машинного интеллекта становится абсолютно человеческой – менее искусственной и более разумной, походящей не на беспилотный автомобиль, который нужно кропотливо тренировать, а на человеческого младенца, обладающего удивительно эффективной способностью к обучению.

Все это должно заставить топ-менеджеров задуматься о расходах на технологии в ближайшие три-пять лет. С одной стороны, стоящие перед глубоким обучением проблемы огромны и для многих компаний непреодолимы. С другой – глубокое обучение дало так много открытий и ценных результатов, что в ближайшее время оно не уйдет из практики. Согласно планам участвовавших в нашем опросе компаний, эти технологии из разряда необязательных перешли в необходимые.

Однако поиски искусственного интеллекта, наиболее близкого к человеческому, откладывались несколько десятилетий. Теперь же они обрели новую жизнь в попытках преодолеть ограничения нынешних подходов к интеллекту. Для высших руководителей это преодоление начинается с понимания имеющихся ограничений.

Проблема с интеллектом

Авторы MIT Technology Review проанализировали исследования в области искусственного интеллекта за последние 25 лет (а это 6625 научных работ) и пришли к выводу: глубокое обучение, доминировавшее в этой области последние десять лет, может пойти на спад[13]. Однако оно не исчезнет – останется мощным инструментом для решения некоторых узкоспециальных задач.

Оно будет важным элементом в широком спектре сложных методов, которые в машинном интеллекте склонят чашу весов в пользу человеческого, а не искусственного. Но идея, что глубокое обучение – если ему только дать достаточно времени и скормить достаточно данных – приведет нас к созданию всеобъемлющего искусственного интеллекта, выглядит все менее вероятной.

Многие системы искусственного интеллекта не так уж и умны

Начнем с того, что системы глубокого обучения по необъяснимым причинам часто заходят в тупик. Рассмотрим, как искусственный интеллект распознает объекты на изображениях, – в последнее время это один из самых успешных примеров его применения, хотя с 2017 года прогресс здесь незначительный.

Проект ImageNet, поддерживаемый Стэнфордским университетом, представляет собой общедоступную базу вручную аннотированных изображений из более чем 14 миллионов экземпляров более чем 20 тысяч категорий. Этот массив данных использовался для обучения многих знакомых нам инструментов для идентификации изображений – таких, как Bing от Microsoft, например.

Однако около 7500 реальных фотографий, собранных исследователями, сбивают с толку современные системы компьютерного зрения (так, бегущий юноша на фото был принят за одноколесный велосипед), и при использовании подобных изображений точность падает с 95 до 2 %[14]. То есть отдельные из самых мощных в мире систем компьютерного зрения правильно идентифицируют эти изображения только в двух случаях из ста. А когда на кону не просто корректная классификация, а подлинное распознавание объекта, как в случае с управляемыми искусственным интеллектом автомобилями или дронами, неудачи могут иметь фатальные последствия.

Проблема черного ящика и работа сложных систем

Системы искусственного интеллекта часто используют при принятии важных решений. Кому одобрят кредит? Кого возьмут на работу? Кто получит условно-досрочное освобождение? На какой срок человек попадет в тюрьму? Почему беспилотный автомобиль совершает опасный маневр? Каким именно образом реклама компании распространяется в социальных сетях? И так далее. Однако многие из этих систем (особенно те, которые используют глубокое обучение) непрозрачны.

Невозможно объяснить, как алгоритмы, работающие с огромным количеством параметров и множеством хитросплетенных уровней абстрагирования, делают те или иные выводы. А ведь они иногда могут обернуться катастрофой – приводить к расовой дискриминации в сфере кредитования и судебных решений по уголовным делам, к чудовищным ДТП или к тому, что онлайн-реклама уважаемых брендов появится рядом с неонацистским или конспирологическим контентом.

Стремление сделать искусственный интеллект объяснимым, законодательно закрепленное в Общем регламенте Европейского союза о защите данных, вызывает вопрос: объяснимым для кого? Трактовки ищут разные заинтересованные стороны. А трудности возникают даже при использовании относительно простой системы оценки кредитного риска[15].

Разработчики программного обеспечения и системные администраторы хотят получить разъяснение с точки зрения архитектуры и параметров обработки данных. Опытному кредитному специалисту, принимающему окончательное решение, возможно, понадобится информация о том, как система учитывала разные факторы, выдавая рекомендацию. Заявитель хочет понять, почему ему отказали: из-за возраста, расы, места проживания, плохой кредитной истории?

Регулятору важно быть уверенным, что система не нарушает конфиденциальности данных и антидискриминационных законов и что она неуязвима для финансовых мошенников. Неспециалист, размышляющий о проблеме черного ящика в целом, может захотеть узнать, зачем кому-то создавать машину, действий которой он не понимает.

Системы глубокого обучения не умеют читать

Мы можем собрать все книги мира в огромную базу данных с возможностью поиска (как в Google Books) и разработать программы машинного чтения, чтобы обнаружить все присутствующие виды взаимосвязей. Но ни одна из существующих систем искусственного интеллекта не может читать и понимать прочитанное даже на уровне маленького ребенка.

Исследователи Гэри Маркус и Эрнест Дэвис задали сервису Google Talk to Books простой вопрос: «Где Гарри Поттер встретил Гермиону Грейнджер?» Ни один из двадцати предложенных ответов не относился к книге «Гарри Поттер и философский камень» и ни в одном не содержалось информации, где же произошла встреча[16].

Смартфоны могут относительно хорошо исправлять опечатки или предлагать следующее слово в предложении. Программы-переводчики выдают вполне сносные переводы со многих языков. Но ни одно из этих приложений – как и никакие другие – не дает базовых знаний, чувства контекста и бесчисленных предположений о реальности, необходимых для понимания прочитанного.

Им не хватает базовых знаний

А именно: понимания пространства, времени и причинно-следственных связей – того, чему люди, подобно младенцу, достающему карандаш, научаются без видимых усилий[17].

Возьмем причинно-следственные связи – важнейший компонент рационального мышления. Во многом успех глубокого обучения был обусловлен мощной способностью находить корреляции, например между совокупностью симптомов и конкретным заболеванием. Но корреляция – это не причинно-следственная связь. Если бы машины понимали, что одно является следствием другого, их не нужно было бы переучивать под каждую новую задачу[18]. Вместо этого они могли бы применять свои знания из одной области к другим областям.

Будущее радикально человеческого интеллекта

Несмотря на достижения когнитивной психологии и нейронаук, мы так и не знаем, каким образом человеческий мозг с его очень ограниченными вычислительными ресурсами творит удивительные вещи. Нам в целом известно, что представляют собой некоторые из основных структурных блоков человеческого разума, и первопроходцы начинают создавать их машинные аналоги.

Авторы работы «Создание машин, которые учатся и думают как люди», основополагающей в этом новом направлении в развитии машинного интеллекта, считают: «До тех пор, пока естественный интеллект остается непревзойденным, реверсивный инжиниринг[19] человеческих решений для сложных вычислительных проблем будет продолжать информировать и развивать искусственный интеллект»[20].

Вопрос уровня топ-менеджеров: какие из описанных ниже когнитивных способностей, более похожих на человеческие, актуальны для создания ценности и предоставления ее клиентам в их бизнесе?

Обобщение в условиях реального мира

Пока теоретики яростно спорят о глубоком обучении и некой идеальной версии искусственного интеллекта, способной сделать его похожим на человеческий, практики действуют. Они используют все дисциплины ИИ как средство поиска новых перспектив, расширяющих возможности и увеличивающих производительность машин.

Рассмотрим в качестве примера грядущее поколение логистических и складских роботов, созданных по технологии, которая может оказать огромное влияние на деятельность и прибыль компаний во многих отраслях. В автоматизированных центрах обработки и выполнения заказов с многокилометровыми складскими стеллажами роботы выполняют большую часть тяжелой работы и начальные этапы комплектации.

Но автоматизированные системы сталкиваются с сотнями тысяч артикулов, которые часто меняются. А значит, либо эти системы должны быть разработаны для подбора определенной категории товаров, либо их придется обучать подбору каждого товара. Но тогда при добавлении новых товаров их необходимо будет вносить в систему вручную, что крайне нерационально.

Именно поэтому складские работники во многих отношениях превосходят нынешнее поколение роботов-сборщиков. Людей не нужно переучивать под каждый новый товар. Они могут обобщать свой опыт, легко отличать один объект от другого и быстро определять, как лучше обращаться с предметом, чтобы его не повредить. Но центры обработки заказов, нацеленные на доставку в тот же день или даже в течение часа, страдают от текучки кадров и ограничений в объеме и скорости работы, связанных с человеческими возможностями.

Немецкая компания Obeta, занимающаяся оптовыми продажами электроники, совместно с австрийской логистической компанией KNAPP AG запустила на своих складах новое поколение роботов-сборщиков, способных менять правила игры. От предыдущих поколений их отличает искусственный интеллект от Covariant – стартапа, основанного робототехниками из Калифорнийского университета в Беркли и исследовательской лаборатории Open AI.

Благодаря ИИ от Covariant роботы обучаются 3D-восприятию, пониманию физических возможностей объектов, планированию движения в реальном времени, а также методу «на раз-два-три»: освоению задачи в результате выполнения нескольких тренировочных примеров. Наличие общих способностей позволяет роботам быстро научиться манипулировать объектами без команд извне[21]. Задача роботов заключается в том, чтобы выбрать товары на оптовом складе и добавить их в индивидуальные заказы для отправки.

Один из посетителей штаб-квартиры Covariant описал технологию в действии: «Я наблюдал, как три разных робота мастерски собирают заказ из всевозможных товаров. За считаные секунды алгоритм анализирует положение предметов, рассчитывает угол атаки и последовательность движений, а затем вытягивает руку, чтобы захватить товар с помощью присоски. Он движется уверенно и точно, меняя скорость в зависимости от хрупкости покупки»[22].

В роботах используются готовый промышленный манипулятор, захват с присоской и система технического зрения. Система технического зрения соединена с захватом с помощью Covariant Brain – программной платформы, не зависящей от аппаратного обеспечения. Она призвана стать универсальным искусственным интеллектом для роботов в любой клиентской среде – единой нейросетью, способной адаптироваться к разнообразным условиям.

[13] Karen Hao, “We Analyzed 16,625 Papers to Figure Out Where AI Is Headed Next”, MIT Technology Review, January 25, 2019, https://www.technologyreview.com/2019/01/25/1436/we-analyzed-16625-papers-to-figure-out-where-ai-is-headed-next/.
[14] Tristan Greene, “AI Fails to Recognize These Nature Images 98 % of the Time,” TNW, July 18, 2019, https://thenextweb.com/artificial-Intelligence/2019/07/18/ai-fails-to-recognize-these-nature-images-98-of-the-time/.
[15] Carlos Zednick, “Solving the Black Box Problem: A Normative Framework for Explainable Artificial Intelligence,” arXiv, 2020, https://arxiv.org/ftp/arxiv/papers/1903/1903.04361.pdf.
[16] Gary Marcus and Ernest Davis, Rebooting AI: Building Artificial Intelligence We Can Trust (New York: Pantheon Books, 2019), 69.
[17] Marcus and Davis, Rebooting AI, 162.
[18] Brian Bergstein, “What AI Still Can’t Do”, MIT Technology Review, February 19, 2020, https://www.technologyreview.com/s/615189/what-ai-still-cant-do/.
[19] Реверсивный инжиниринг (обратный инжиниринг, обратная разработка) – изучение готового устройства с целью понять принципы работы в устройстве и создать его копию. Прим. ред.
[20] Brenden M. Lake, Tomer D. Ullman, Joshua B. Tenenbaum, and Samuel J. Gershman, “Building Machines That Learn and Think Like People”, arXiv, April 1, 2016, https://arxiv.org/abs/1604.00289.
[21] “Covariant Launches from Stealth to Bring Universal AI to Robots”, Covariant, January 29, 2020, https://www.prnewswire.com/news-releases/covariant-launches-from-stealth-to-bring-universal-ai-to-robots-300995185.html.
[22] Karen Hao, “AI-Powered Robot Warehouse Pickers Are Now Ready to Go to Work”, MIT Technology Review, January 29, 2020, https://www.technologyreview.com/s/615109/ai-powered-robot-warehouse-pickers-are-now-ready-to-go-to-work/.