Baidu - Робин Ли

- Автор: Робин Ли
- Серия: Top Business Awards
- Жанр: зарубежная публицистика, интернет, истории успеха
- Размещение: фрагмент
- Теги: искусственный интеллект, поисковые системы, технологии будущего
- Год: 2017
Baidu
Позднее появился SMT (статистический машинный перевод). Его основная идея заключается в том, чтобы посредством статистического анализа выявить общие правила использования слова или словосочетания и попытаться избежать появления нелогичных фраз. SMT имеет основные функции машинного обучения – обучение и декодирование. Этап обучения позволяет компьютеру построить модель перевода с помощью статистических данных, а затем использовать ее для перевода. Этап декодирования использует расчетные параметры, чтобы получить наиболее подходящий результат от перевода.
Исследование SMT продолжается уже более 20 лет. Для фраз и коротких предложений уже достигнут значительный прогресс. Но перевод длинных предложений, особенно со сложных языков, вроде китайского или английского, все еще оставляет желать лучшего. До недавнего времени никто не задумывался о подходе NMT (переводе, основанном на нейронных сетях). В его основе – нейронная сеть с бесчисленным количеством узлов. Исходное предложение векторизуется и передается через средний слой сети компьютеру в виде выражения, понятного для него. Затем проходит сквозь многослойную операцию и переводится на другой язык.
При таком переводе объем данных должен быть огромным, иначе система окажется бесполезной. Поисковые системы, вроде Baidu или Google, могут собирать перевод из огромного количества человеческих высказываний в интернете. Только такие объемы данных способны прокормить NMT. Система сможет самостоятельно отладить механизм перевода. И результат будет лучше, чем при SMT. Особенно, если будет достаточно информации на языке перевода.
SMT использует локальную информацию. Фраза расчленяется на сегменты. Сегменты обрабатываются и переводятся. И только потом сшиваются вместе. NMT использует общую информацию. Система кодирует фразу полностью (как люди во время перевода сначала читают предложение целиком). А потом на основе закодированной информации генерирует перевод. За счет этого достигается более высокий уровень читаемости текста.
Например, один из важных аспектов в переводе – порядок слов. Китайцы размещают определения перед определяемым словом. А в английском определение находится после. Машины часто путают этот порядок. Преимущество NMT в его способности к обучению порядку слов в языке. Это обеспечивает плавность перевода в длинных предложениях.
Традиционные методы перевода не бесполезны. Каждый из них выполняет свою функцию. Например, при переводе идиом нельзя использовать дословный перевод. Они всегда имеют устойчивое значение. Потребности пользователей интернета разнообразны: перевод разговорного языка, резюме, новостей и прочего. Поэтому одним методом сложно удовлетворить все запросы. Baidu сочетает в себе сразу несколько традиционных методов перевода: перевод, основанный на грамматических правилах, на примерах, на статистике и на нейронных сетях.
В такой модели машинного перевода человек не ищет грамматические правила, а устанавливает математические модели и параметры, чтобы помочь компьютерной сети выявить правила самостоятельно. Когда человек вводит предложение и получает на выходе его перевод, он не думает, что происходит в середине цепочки. Это называется сквозным переводом. Этот удивительный подход называется байесовским, или скрытой марковской моделью. Для решения проблемы здесь используется теория вероятностей.
С помощью байесовского метода распределения информации можно построить модель личности по вероятностным характеристикам. Например, модель мужчины предполагает, что при чтении новостей он остановится на чтении статей, посвященных войне с вероятностью в 40 %. Женская модель – только 4 %. После того как читатель выберет военные новости, в соответствии с формулой Байеса (рис. 1-2), можно более точно рассчитать его пол и другие характеристики, используя другие поведенческие данные и комплексные расчеты. Это «волшебство» математики. Но, конечно, компьютерные нейронные сети используют не только математические методы.
Рис. 1-1. Байес и байесовская формула [2 - Используется для представления условной вероятности случайных событий A и B, где P (A | B) – это вероятность того, что в случае B произойдет А. ]
Метод использования искусственного интеллекта, подобный машинному переводу, предполагает использования огромных объемов информации. Интернет сейчас способен такие объемы предоставить. Раньше ученые только мечтали о них.
Интернет был создан для того, чтобы облегчить обмен информацией. В результате произошел информационный взрыв, который способствовал ускорению развития искусственного интеллекта.
В качестве доказательства приведу игру в шахматы. В 1952 году сир Сэмюэл написал программу для игры в шашки, чтобы повысить уровень собственного мастерства. Правила игры были относительно просты. И в этом отношении у компьютера было внушительное преимущество перед человеком. Но правила шахмат гораздо сложнее. Когда президент Baidu Чжан Яцин был директором института Microsoft, он пригласил на работу талантливого компьютерщика Сюй Фэн Сюна родом из Тайваня. Этот специалист во времена IBM (International Business Machines Corporation) разработал известного робота под названием «Шахматы втемную». В 1990-х гг. искусственный интеллект не представлял собой разновидность «Шахмат втемную». Его «мудрость» была заключена в суперкомпьютере (с использованием нескольких процессоров и параллельных вычислительных технологий), благодаря которому ИИ побеждал людей-шахматистов, а в 1997 году выиграл партию у Каспарова, чемпиона мира по шахматам. Вскоре после известной игры IBM отправила технологию «Шахматы втемную» в отставку. Чжан Яцин сказал Сюй Фэн Сюну: «Изобрети технологию для игры в Го, а потом найди меня и выиграй». Пока Чжан Яцин не покинул Microsoft, Сюй Фэн Сюн его так и не искал.
Технология «Шахматы втемную» сталкивается с некоторыми трудностями, которые на сегодняшний день не могут быть преодолены. Достичь прорыва в этом направлении так же сложно, как покорить Вселенную. Модель, которая опирается на алгоритм дерева решений, исчерпывает свои возможности и выходит за пределы пропускной способности компьютера. Алгоритм постоянно совершенствуется, но проблему в вычислениях решить пока не удается. У искусственного интеллекта есть все предпосылки для того, чтобы быть устойчивым перед лицом восточной мудрости. И новая эра уже не за горами.
Интернет-конференция
Технология «Шахматы втемную» представляла собой модель искусственного интеллекта, но, кажется, не имела ничего общего с интернетом. Но развитие облачных вычислений и возможности управления большими объемами информации наконец-то объединили ИИ и интернет в одну устойчивую технологию, которая существенно отличается от «Шахмат втемную». Распределенные вычисления в сочетании с большими объемами информации и новым алгоритмом принятия решений демонстрируют успешное сочетание человеческого и машинного интеллекта.
В 2016-2017 годах AlphaGo (программа для игры в го) всколыхнула человечество. Процесс ведения игры AlphaGo отличается и от человеческого мышления, и от «Шахмат втемную». Проще говоря, механизм питается десятками миллионов человеческих шахматных партий. Выражаясь более профессионально, успеху AlphaGo способствовали алгоритм поиска Монте-Карло и механизм распознавания образов, основанные на глубоком обучении. Однако ни его предшественники, ни «Шахматы втемную» к технологии глубоко обучения отношения не имели.
Согласно исследованиям, AlphaGo не изобретает собственный механизм игры, а изучает десятки миллионов игроков (массивы данных). Он запоминает каждый ход, каждую игру из миллионов ситуаций и использует данные для обучения с помощью нейронной сети. Все это делается для того, чтобы иметь возможность предсказать, как мастер-человек сумеет выйти из той или иной ситуации. На практике компьютер анализирует текущую ситуацию и находит ее аналоги в прошлом. Затем ищет возможные варианты развития и выбирает несколько наиболее оптимальных. Таким образом, вместо того, чтобы пробовать все возможные варианты, он останавливается на наиболее выгодных. Тем самым сокращает объем вычислений. Система не истощается и получает защиту от поражения. Этот подход похож на человеческий. Мы не пробуем все подряд, а выбираем несколько вариантов, опираясь на опыт и чувства. Но после того, как сделаем свой выбор, мы все еще должны производить подсчеты и сравнения в поисках оптимального хода. Машина же передаст эти расчеты алгоритму поиска Монте-Карло.
Читать похожие на «Baidu» книги

Классический набор Таро, созданный замечательной художницей Робин Вуд, стал одним из самых популярных во всем мире. Структура колоды основана на традиционной системе Райдера – Уэйта, но наполнена уникальными образами, отражающими языческое восприятие природы и божественного мира. Каждая иллюстрация проникнута необычайной энергией и силой, благодаря чему их легко интерпретировать даже новичку. Колода отличается эмоциональностью, яркими цветами и обилием деталей – работая с каждой картой, вы

Более 25 лет Робин Шарма, легендарный ведущий консультант по лидерству и личностному росту, обучает титанов бизнеса, суперзвезд профессионального спорта, королей эстрады и мировых селебрити революционной системе, которая помогает этим людям превращать свои грандиозные амбиции в реальные результаты. «Манифест героя нашего времени» – уникальная книга, в которой Робин Шарма объединил лучшие практики, принципы и методы своей работы. Эта книга одновременно является и планом по достижению

Жители Геттиса поверили, что Невар Бурв, их кладбищенский сторож, виновен в чудовищных злодеяниях. В этом пограничном городе-крепости расправа над преступником никогда не заставляла себя ждать, но на этот раз она не состоялась – ярость толпы уступила колдовству незримых властителей, решивших взять судьбу юноши в свои руки. Невар отправляется в лес – маги хотят превратить его в оружие, которое поможет остановить гернийское нашествие на земли народа спеков. И Невар близок к тому, чтобы покориться

Все хотят знать, когда им лгут. Умение распознавать обман – это навык, который можно прокачать. Робин Дрик воспитал не одну плеяду агентов ФБР, которые успешно раскрыли террористические заговоры и предотвратили множество мировых конфликтов. В этой книге автор делится своим опытом агента и наставника, показывает внутреннюю кухню ФБР и учит вести переговоры даже с самыми сложными личностями.

Эпидемия чумы, порожденная магией спеков, опустошила Королевскую Академию каваллы. Многие кадеты умерли, а у тех, кому посчастливилось ее пережить, здоровье подорвано настолько, что они вынуждены распроститься с военной карьерой и вернуться в свои семьи, где их ждет прозябание. Только Невар Бурвиль доволен судьбой – он на удивление быстро восстанавливает силы после болезни и мечтает поскорее встретиться со своей невестой, красавицей Карсиной. Но, вернувшись под родной кров, он с ужасом

Королевство Герния расширяет свои владения, покоряя и принуждая к оседлости, а то и уничтожая кочевые племена. Жители равнин владеют природной магией; Герния же сделала ставку на современное оружие, и она уверенно одерживает верх. Но ей по-прежнему нужны профессиональные воины. Уже давно сложилась традиция: в благородной семье первый сын получает отцовское наследство, третий становится священником, а второму достается удел солдата. Невар Бурвиль, второй сын человека, за военные заслуги

«Я надеюсь помочь читателям лучше понять личность, которая стоит за лицом Уитни, за ее голосом и образом. Да, ее история закончилась трагедией, но ее мечта и восхождение к ней были прекрасны». Уитни Хьюстон, обладательницу множества престижных премий, всеми любимую, коммерчески успешную и безумно популярную суперзвезду, обнаружили мертвой в гостиничном номере в Беверли-Хиллз в 2012 году. Она погибла накануне 54-й церемонии Grammy. В ее крови нашли наркотики, с которыми певица пыталась бороться

«История – это не просто используемый нами инструмент, она крайне важна, поскольку во многом определяет, кто мы. В некотором смысле это объясняет, почему тираны сжигают книги и в конечном счете тех, кто их пишет». Р. Махержи Вся наша жизнь: от общения с друзьями в баре до писем деловым партнерам, от первых свиданий до игр с детьми – состоит из историй. Истории – это то, что нам приходится рассказывать постоянно. Кто-то делает это лучше, кто-то хуже, а кто-то превращает это искусство в свою

Если для нас «любить» означает «страдать», значит, мы любим слишком сильно. В этой книге рассматриваются причины, которые побуждают столь многих женщин, ищущих любви и любящего мужчину, роковым образом неизбежно находить невнимательных, эгоистичных партнеров, не отвечающих им взаимностью. Мы узнаем, почему, даже если наши отношения с близким человеком не удовлетворяют нас, нам все же трудно порвать их. Мы поймем, как наше желание любить и сама любовь становятся страстью, зависимостью, пагубной