Нейросети. Выстрой свою систему из 5 уровней автоматизации (страница 3)

Страница 3

• Любая крупная компания, которая хочет обучать и запускать свои модели, оказывается в очереди за чипами.

• Пропускная способность этой «очереди» определяется не только деньгами, но и политикой экспортного контроля США и их союзников[10].

• NVIDIA фактически стала инфраструктурной компанией нового типа: она не продаёт конечный продукт пользователю, но контролирует критически важный слой – тот, через который проходит всё остальное.

Спрос настолько велик, что:

• компании строят целые дата-центровые кластеры под ИИ-сервера;

• капитальные затраты на ИТ-инфраструктуру (серверы, сети, системы хранения) занимают более 70–80% расходов на новые дата-центры[11];

• любая задержка в поставке GPU может стоить компаниям миллионы долларов упущенной выручки.

Война за GPU – это уже не метафора, а ежедневная реальность: топ-менеджеры договариваются о партиях чипов, как раньше договаривались о доступе к месторождениям.

Уровень 3. Модели (LLM) – мозг этой системы

На третьем уровне находятся модели – те самые большие языковые модели (LLM – large language models) вроде ChatGPT или Claude, Gemini, DeepSeek, QWEN, а также модели для работы с изображениями (которые “видят” и генерируют картинки и видео: Midjourney, Sora, VEO, Kling, NanoBanana и др), модели для звука (распознавание и синтез речи, музыка: ElevenLabs, Suno, и др) и мультимодальные модели, которые одновременно воспринимают и комбинируют текст, изображение, звук и иногда видео.

Чтобы обучить одну фронтирную модель:

• нужны тысячи GPU, работающих недели или месяцы;

• общий бюджет на обучение может превышать десятки-сотни миллионов долларов (учитывая железо, энергию, инженеров, инфраструктуру).

Но самое важное:

Модель – это кристаллизованное знание мира плюс стоимость всех вычислений, которые в неё вложены.

Отсюда вытекают ключевые черты:

• У единиц игроков есть ресурсы, чтобы строить модели мирового уровня (США, Китай, Россия, несколько крупных компаний).

• Остальные становятся пользователями моделей через API или используют открытые/местные варианты.

• Доступ к самым мощным моделям оказывается завязан на те самые GPU, электричество и политические решения наверху пирамиды.

Это похоже на ситуацию, когда определённое число стран контролирует производство самолётов, а все остальные покупают у них билеты.

Уровень 4. Приложения – интерфейсы к мозгу

Четвёртый уровень – это всё, что видит обычный человек:

• чат-боты, ассистенты, GPT-приложения;

• сервисы для маркетинга, дизайна, программирования, образования;

• голосовые помощники, аватары, системы поддержки клиентов.

Здесь происходит настоящее разнообразие и креатив:

• одни делают узкие решения под юристов, врачей, маркетологов;

• другие – системы, которые автоматизируют целые бизнес-процессы;

• третьи – инструменты для творчества и развлечения.

Но важно понимать: ни одно приложение не живёт само по себе.

Оно опирается:

• либо на API крупных моделей (OpenAI, Anthropic, Google, QWEN, локальные провайдеры);

• либо на самостоятельный развёрнутый стек (открытые модели + свои сервера).

Отсюда главный риск для разработчиков приложений:

«Ты строишь бизнес на чужой платформе. Если платформа поднимет цены или ограничит доступ – твой бизнес может исчезнуть за ночь».

И наоборот – отсюда же рождаются возможности:

Если ты понимаешь, как устроена инфраструктура, ты можешь проектировать такие приложения и системы, которые масштабируются, не убивая тебе маржу:

• заранее закладывать работу не с одной моделью, а с несколькими провайдерами;

• разделять “тяжёлые” задачи, которые действительно требуют дорогих мощных моделей, и “рутинные”, которые можно гонять через более простые и дешёвые решения;

• продумывать, что можно кэшировать, переиспользовать и считать локально, а не каждый раз оплачивать полный цикл обработки;

• строить ценовую модель продукта так, чтобы рост числа пользователей не превращал каждый новый запрос в удар по вашему же кошельку.

В результате вы делаете не красивую игрушку на модной нейросети, а систему, которая выдерживает и рост нагрузки, и изменения тарифов, и очередной виток гонки за мощностями.

Уровень 5. Пользователь – вершина и одновременно топливо

На вершине – мы с вами:

• предприниматели, специалисты, фрилансеры, студенты;

• компании, которые внедряют ИИ в процессы;

• государства, которые перестраивают сервисы, налоговые системы, образование.

По данным Всемирного экономического форума, уже сейчас около 34% бизнес-задач в среднем выполняется машинами, а оставшиеся 66% – людьми[12]

Конец ознакомительного фрагмента.
Текст предоставлен ООО «ЛитРес».
Если вам понравилась книга, то вы можете

ПОЛУЧИТЬ ПОЛНУЮ ВЕРСИЮ
и продолжить чтение, поддержав автора. Оплатили, но не знаете что делать дальше? Реклама. ООО ЛИТРЕС, ИНН 7719571260

[10] https://cset.georgetown.edu/article/bis-2023-update-explainer/
[11] https://iot-analytics.com/data-center-infrastructure-market/