🎁 Бесплатные модели

Бесплатное под каждую задачу

Подобрано по назначению: обработка голоса, генерация картинок, видео, код, текст и эмбеддинги. Честно про лимиты — где open source без ограничений, а где скромный free-tier облачного API. Данные на июнь 2026.

Qwen3 (235B / 32B / 8B)

Alibaba

Open Sourceбез ключа

Лучшее открытое семейство LLM общего назначения 2026: рассуждения, многоязычность (включая русский), длинный контекст и вызов инструментов. Есть размеры под любое железо — от 0.6B до 235B.

Полностью открытые веса под Apache 2.0: запуск локально без лимитов, без платы за токены, коммерческое использование разрешено.

Как получить: Локально через Ollama / LM Studio / vLLM; малые версии (8B) идут на одной видеокарте. Также доступно бесплатно через OpenRouter и Together.

Чат-ассистент и суммаризация на своём сервере
Перевод и работа с русским текстом
RAG-пайплайн с приватными данными без отправки в облако

Открыть

DeepSeek V4

DeepSeek

Open Sourceбез ключа

Сильная открытая модель с фокусом на рассуждения и математику, 1M контекста, лицензия MIT. Pro и Flash варианты под разные бюджеты железа.

Веса открыты под MIT — локально бесплатно и без ограничений. Бесплатный доступ к R1/V4 также есть через OpenRouter (free-модели).

Как получить: Локально (нужны мощные GPU для Pro) или через OpenRouter / провайдеров инференса. Flash-вариант (13B активных) реальнее для self-host.

Глубокие математические и логические задачи
Анализ больших документов в 1M контекста
Агентные цепочки рассуждений

Открыть

Gemini 2.x Flash (free tier)

Google

Free tierнужен ключ

Быстрая мультимодальная модель (текст, картинки, аудио на вход) с лучшим бесплатным тиром на рынке — контекст до 1M токенов даже бесплатно.

1500 запросов/день на Flash, без карты и без срока истечения. Контекст до 1M токенов. Самый щедрый free-tier среди облачных API.

Как получить: API-ключ в Google AI Studio (бесплатно, нужен Google-аккаунт). OpenAI-совместимый эндпоинт.

Мультимодальный чат: разбор скриншотов и PDF
Прототипы и пет-проекты без затрат
Обработка длинных документов целиком

Открыть

Llama 3.3 70B на Groq

Groq

Open Sourceнужен ключ

Открытая модель Llama 3.3 70B на сверхбыстрых LPU-чипах Groq — отдача токенов почти мгновенная. Удобно для коротких быстрых вызовов в продукте.

Бесплатный тир: ~30 запросов/мин и 1000 запросов/день (в 2026 лимиты урезали). Без карты.

Как получить: API-ключ на console.groq.com, OpenAI-совместимый. Веса Llama открыты — можно и self-host.

Низколатентный чат-бот в реальном времени
Быстрая классификация и роутинг запросов
Стриминг ответов с минимальной задержкой

Открыть

Mistral (Experiment free tier)

Mistral AI

Open Sourceнужен ключ

Европейские открытые и закрытые модели. Бесплатный план Experiment даёт доступ ко всем моделям, включая Mistral Large и Codestral.

Около 1 млрд токенов/мес — один из самых щедрых постоянных free-квот. Нужен только верифицированный телефон, но требуется согласие на обучение на ваших данных.

Как получить: API-ключ в Mistral AI Studio. Малые модели (Mistral Small 4, Apache 2.0) можно запускать локально.

Генерация и редактура текста на ЕС-инфраструктуре
Прототипы с большим объёмом токенов
Локальный self-host малых open-weight моделей

Открыть

Gemma 3 / 4 (27B и меньше)

Google

Open Sourceбез ключа

Лёгкое открытое семейство от Google, заточенное под локальный запуск на одной видеокарте. Хороший баланс качества и требований к железу.

Открытые веса — локально бесплатно. Gemma 3 27B помещается в 16 ГБ VRAM, малые версии идут даже на ноутбуке.

Как получить: Локально через Ollama / LM Studio / llama.cpp. Доступна и в облачных free-tier (OpenRouter, Google AI Studio).

Локальный ассистент на домашнем ПК
Приватная обработка текста офлайн
Лёгкий бэкенд там, где 70B+ не тянет железо

Открыть