От «Энигмы» до ChatGPT (страница 3)

Страница 3

Конечно, нет ничего проще, чем, используя алгоритмы больших языковых моделей (Large language model, LLM), нейронных сетей, натренированных на тексте и применяющих в анализе миллиарды параметров систематизирования текстовой информации, разобрать связь между словами, фразами в больших массивах текста, таких как сценарий фильма, текст книги, комментарии в интернете. Несложно развернуть на домашнем компьютере LLM, натренировать ее преимущественно на текстовом материале, который необходимо разобрать, попросить провести анализ через серию запросов. Получится даже немного романтично: искусственный интеллект изучает человеческие представления о себе. Но не стоит слишком усложнять простую задачу. Грубый пересчет, как у Реккья, вполне нам подойдет, чтобы произвести первичную оценку и наметить дальнейшее направление исследования.

Считаем слова

Ключевое слово

Любой фильм, сериал или шоу на специализированных сайтах, таких как «Кинопоиск» и IMDb, могут быть отсортированы и найдены по названию, дате выхода, жанру и ключевым словам. Ключевые слова в анализе играют важнейшую роль, поскольку именно они сортируют и организуют фильмы по тем качествам, которые им присущи. К сожалению, на страницах отечественного «Кинопоиска» найти удобный функционал работы с ключевыми словами не удалось, поэтому использовался IMDb, который на момент написания этой книги имеет базу в более чем 14 млн фильмов, шоу и сериалов и более дружественный интерфейс для чтения ключевых слов.

Мы повторяли некоторые шаги, описанные в оригинальном исследовании Реккья. Это означает почти полную воспроизводимость результатов исследования.

В IMDb ключевое слово – это слово или группа слов, с которыми ассоциируется фильм, шоу, сериал или даже эпизод многосерийного произведения. Они используются для описания значимых объектов, событий и идей, которые показаны в кинокартине. Ключевые слова назначаются в ряде случаев автоматически, но часто их вводят и уточняют пользователи ресурса для большей детализации. В нашем случае вышеназванные кинокартины имеют следующее количество ключевых слов.

Конец ознакомительного фрагмента.
Текст предоставлен ООО «ЛитРес».
Если вам понравилась книга, то вы можете

ПОЛУЧИТЬ ПОЛНУЮ ВЕРСИЮ
и продолжить чтение, поддержав автора. Оплатили, но не знаете что делать дальше? Реклама. ООО ЛИТРЕС, ИНН 7719571260