6 терминов, которые нужно усвоить для понимания нейросетей

Если вам непонятно, чем промпт отличается от токена или если вы пытаетесь разобраться, что значит «галлюцинация» и «мультимодальность» у ИИ – вам точно сюда.

LLM (large language model, англ. «большая языковая модель»)

Нейросеть, которая обучена на огромном объеме данных, способная принимать запросы пользователя и предоставлять ему ответы на естественном («человеческом») языке.

На рынке существует множество LLM – коммерческих и бесплатных, которые распространяются по модели open-source.

LLM (языковая модель)Разработчик
GPT-o3OpenAI
Claude 3.7 SonnetAnthropic
Grok-3xAI
DeepSeek R1DeepSeek
LLaMA 3.1Meta AI

Нейросеть – это математическая модель, которая подражает мозгу: в ней виртуальные клетки-нейроны уложены в несколько слоев и соединены огромным количеством связей. Обучение LLM – это и есть процесс выстраивания связей. Например, хорошо натренированная модель GPT 4.0 имеет 1,8 трлн связей и 120 слоев нейронов.

Информация о связях закодирована в виде числовых значений – параметров. К примеру, версии нейросети LLaMA 8B, 70B, 405B обладают 8 млрд, 70 млрд и 405 млрд параметров соответственно. Чем больше параметров – тем более «образованная» и «прожорливая» LLM.

Языковые модели отличаются также размером своего контекстного окна (context window) – его можно сравнить с вниманием и памятью. Чем больше окно – тем лучше модель учитывает свой опыт, понимает нюансы задачи. Для понимания: окно модели Claude 3.5 Sonnet достигает 200 тыс. токенов, DeepSeek-R1 – 128 тыс.

Чат-бот

Программа на основе ИИ, которая способна общаться с человеком на понятном ему языке. В основе чат-бота лежит конкретная LLM или несколько их разновидностей – одна, к примеру, лучше рассуждает, другая – дает быстрые ответы на основе собранных фактов.

Чат-ботLLM (языковая модель)
ChatGPTGPT-4o mini, GPT-o3, GPT-4.5
Google GeminiGemini 2.5 Pro,
PerplexitySonar Large
ClaudeSonnet 3.7, Opus-4
QwenQwen-max, Qwen-turbo

Сегодня чат-боты, как правило, мультимодальны – это значит, что они способны обрабатывать и создавать контент различного формата – текст, изображение, аудио, видео.

Токен

Минимальная единица текста, которую понимает ИИ – символ, буква или слово. Разбивка на токены нужна, чтобы эффективно преобразовать текст в ряд чисел, понятных машине. Например, для ChatGPT один токен – это примерно 4 символа.

Многое зависит от языка: на русском языке предыдущий абзац содержит 114 токенов, а на английском – только 60. Это имеет значение, так как тарифы за использование LLM часто опираются на количество токенов, которые они обрабатывают («$ за тысячу токенов»).

В токенах измеряется объем ответа, который LLM может дать на ваш запрос. Так, максимальный объем ответа у ChatGPT – около 4 тыс. токенов.

Fine-tuning

Процедура дообучения LLM на небольшом, специализированном наборе данных, что позволяет ей лучше решать узкие задачи. Некоторые компании дорабатывают общедоступные LLM (Gemma, LLaMA) и получают нишевый инструмент.

Один из популярных методов – LoRA или Low-Rank Adaptation. Вместо того, чтобы переобучать всю модель, что сложно и дорого, делается небольшая надстройка, которая изменяет отдельные слои нейросети. Если вы генерируете изображения, то это может быть, к примеру, новый персонаж или стиль.

Если говорить о пользовательском опыте, то в большинстве случаев не нужно и такого: достаточно создать проект – тематический чат-бот, куда загружаются дополнительные файлы и прописываются правила.

Промпт

Запрос к сервису ИИ, команда, инструкция, описание того, что вы хотите от нейросети. Искусство ведения беседы с чат-ботом, когда пользователь постоянно задает дополнительные вопросы или просит внести коррективы в ответ (своего рода сократовская майевтика) получило название «промпт-инжиниринг» (prompt engineering).

Как правило LLM имеют внутренние инструкции, которые запрещают давать неэтичные ответы или обсуждать темы, связанные с нарушениями закона. Jailbreak prompting (от англ. «побег из тюрьмы») – это попытки заставить чат-бот вовлечься в «запретное» обсуждение.

Промптинг в каком-то смысле – это программирование машины на естественном языке. Неудивительно, что в 2025 году появилось понятие вайб-кодинга (vibe coding): инженеры-программисты начали таким образом создавать код.

Галлюцинирование

Ситуация, при которой нейросеть не знает ответ и начинает приводить вымышленную информацию, генерировать абсурдные результаты. Сейчас галлюцинации могут составлять от 1,5 до 3% ответов нейросетей.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *