
LLM (large language model, англ. «большая языковая модель»)
Нейросеть, которая обучена на огромном объеме данных, способная принимать запросы пользователя и предоставлять ему ответы на естественном («человеческом») языке.
На рынке существует множество LLM – коммерческих и бесплатных, которые распространяются по модели open-source.
| LLM (языковая модель) | Разработчик |
| GPT-o3 | OpenAI |
| Claude 3.7 Sonnet | Anthropic |
| Grok-3 | xAI |
| DeepSeek R1 | DeepSeek |
| LLaMA 3.1 | Meta AI |
Нейросеть – это математическая модель, которая подражает мозгу: в ней виртуальные клетки-нейроны уложены в несколько слоев и соединены огромным количеством связей. Обучение LLM – это и есть процесс выстраивания связей. Например, хорошо натренированная модель GPT 4.0 имеет 1,8 трлн связей и 120 слоев нейронов.
Информация о связях закодирована в виде числовых значений – параметров. К примеру, версии нейросети LLaMA 8B, 70B, 405B обладают 8 млрд, 70 млрд и 405 млрд параметров соответственно. Чем больше параметров – тем более «образованная» и «прожорливая» LLM.
Языковые модели отличаются также размером своего контекстного окна (context window) – его можно сравнить с вниманием и памятью. Чем больше окно – тем лучше модель учитывает свой опыт, понимает нюансы задачи. Для понимания: окно модели Claude 3.5 Sonnet достигает 200 тыс. токенов, DeepSeek-R1 – 128 тыс.
Чат-бот
Программа на основе ИИ, которая способна общаться с человеком на понятном ему языке. В основе чат-бота лежит конкретная LLM или несколько их разновидностей – одна, к примеру, лучше рассуждает, другая – дает быстрые ответы на основе собранных фактов.
| Чат-бот | LLM (языковая модель) |
| ChatGPT | GPT-4o mini, GPT-o3, GPT-4.5 |
| Google Gemini | Gemini 2.5 Pro, |
| Perplexity | Sonar Large |
| Claude | Sonnet 3.7, Opus-4 |
| Qwen | Qwen-max, Qwen-turbo |
Сегодня чат-боты, как правило, мультимодальны – это значит, что они способны обрабатывать и создавать контент различного формата – текст, изображение, аудио, видео.
Токен
Минимальная единица текста, которую понимает ИИ – символ, буква или слово. Разбивка на токены нужна, чтобы эффективно преобразовать текст в ряд чисел, понятных машине. Например, для ChatGPT один токен – это примерно 4 символа.
Многое зависит от языка: на русском языке предыдущий абзац содержит 114 токенов, а на английском – только 60. Это имеет значение, так как тарифы за использование LLM часто опираются на количество токенов, которые они обрабатывают («$ за тысячу токенов»).
В токенах измеряется объем ответа, который LLM может дать на ваш запрос. Так, максимальный объем ответа у ChatGPT – около 4 тыс. токенов.
Fine-tuning
Процедура дообучения LLM на небольшом, специализированном наборе данных, что позволяет ей лучше решать узкие задачи. Некоторые компании дорабатывают общедоступные LLM (Gemma, LLaMA) и получают нишевый инструмент.
Один из популярных методов – LoRA или Low-Rank Adaptation. Вместо того, чтобы переобучать всю модель, что сложно и дорого, делается небольшая надстройка, которая изменяет отдельные слои нейросети. Если вы генерируете изображения, то это может быть, к примеру, новый персонаж или стиль.
Если говорить о пользовательском опыте, то в большинстве случаев не нужно и такого: достаточно создать проект – тематический чат-бот, куда загружаются дополнительные файлы и прописываются правила.
Промпт
Запрос к сервису ИИ, команда, инструкция, описание того, что вы хотите от нейросети. Искусство ведения беседы с чат-ботом, когда пользователь постоянно задает дополнительные вопросы или просит внести коррективы в ответ (своего рода сократовская майевтика) получило название «промпт-инжиниринг» (prompt engineering).
Как правило LLM имеют внутренние инструкции, которые запрещают давать неэтичные ответы или обсуждать темы, связанные с нарушениями закона. Jailbreak prompting (от англ. «побег из тюрьмы») – это попытки заставить чат-бот вовлечься в «запретное» обсуждение.
Промптинг в каком-то смысле – это программирование машины на естественном языке. Неудивительно, что в 2025 году появилось понятие вайб-кодинга (vibe coding): инженеры-программисты начали таким образом создавать код.
Галлюцинирование
Ситуация, при которой нейросеть не знает ответ и начинает приводить вымышленную информацию, генерировать абсурдные результаты. Сейчас галлюцинации могут составлять от 1,5 до 3% ответов нейросетей.
