🎁 Бесплатные модели
Бесплатное под каждую задачу
Подобрано по назначению: обработка голоса, генерация картинок, видео, код, текст и эмбеддинги. Честно про лимиты — где open source без ограничений, а где скромный free-tier облачного API. Данные на июнь 2026.
Qwen3 (235B / 32B / 8B)
Alibaba
Open Sourceбез ключа
Лучшее открытое семейство LLM общего назначения 2026: рассуждения, многоязычность (включая русский), длинный контекст и вызов инструментов. Есть размеры под любое железо — от 0.6B до 235B.
Полностью открытые веса под Apache 2.0: запуск локально без лимитов, без платы за токены, коммерческое использование разрешено.
Как получить: Локально через Ollama / LM Studio / vLLM; малые версии (8B) идут на одной видеокарте. Также доступно бесплатно через OpenRouter и Together.
- Чат-ассистент и суммаризация на своём сервере
- Перевод и работа с русским текстом
- RAG-пайплайн с приватными данными без отправки в облако
DeepSeek V4
DeepSeek
Open Sourceбез ключа
Сильная открытая модель с фокусом на рассуждения и математику, 1M контекста, лицензия MIT. Pro и Flash варианты под разные бюджеты железа.
Веса открыты под MIT — локально бесплатно и без ограничений. Бесплатный доступ к R1/V4 также есть через OpenRouter (free-модели).
Как получить: Локально (нужны мощные GPU для Pro) или через OpenRouter / провайдеров инференса. Flash-вариант (13B активных) реальнее для self-host.
- Глубокие математические и логические задачи
- Анализ больших документов в 1M контекста
- Агентные цепочки рассуждений
Gemini 2.x Flash (free tier)
Google
Free tierнужен ключ
Быстрая мультимодальная модель (текст, картинки, аудио на вход) с лучшим бесплатным тиром на рынке — контекст до 1M токенов даже бесплатно.
1500 запросов/день на Flash, без карты и без срока истечения. Контекст до 1M токенов. Самый щедрый free-tier среди облачных API.
Как получить: API-ключ в Google AI Studio (бесплатно, нужен Google-аккаунт). OpenAI-совместимый эндпоинт.
- Мультимодальный чат: разбор скриншотов и PDF
- Прототипы и пет-проекты без затрат
- Обработка длинных документов целиком
Llama 3.3 70B на Groq
Groq
Open Sourceнужен ключ
Открытая модель Llama 3.3 70B на сверхбыстрых LPU-чипах Groq — отдача токенов почти мгновенная. Удобно для коротких быстрых вызовов в продукте.
Бесплатный тир: ~30 запросов/мин и 1000 запросов/день (в 2026 лимиты урезали). Без карты.
Как получить: API-ключ на console.groq.com, OpenAI-совместимый. Веса Llama открыты — можно и self-host.
- Низколатентный чат-бот в реальном времени
- Быстрая классификация и роутинг запросов
- Стриминг ответов с минимальной задержкой
Mistral (Experiment free tier)
Mistral AI
Open Sourceнужен ключ
Европейские открытые и закрытые модели. Бесплатный план Experiment даёт доступ ко всем моделям, включая Mistral Large и Codestral.
Около 1 млрд токенов/мес — один из самых щедрых постоянных free-квот. Нужен только верифицированный телефон, но требуется согласие на обучение на ваших данных.
Как получить: API-ключ в Mistral AI Studio. Малые модели (Mistral Small 4, Apache 2.0) можно запускать локально.
- Генерация и редактура текста на ЕС-инфраструктуре
- Прототипы с большим объёмом токенов
- Локальный self-host малых open-weight моделей
Gemma 3 / 4 (27B и меньше)
Google
Open Sourceбез ключа
Лёгкое открытое семейство от Google, заточенное под локальный запуск на одной видеокарте. Хороший баланс качества и требований к железу.
Открытые веса — локально бесплатно. Gemma 3 27B помещается в 16 ГБ VRAM, малые версии идут даже на ноутбуке.
Как получить: Локально через Ollama / LM Studio / llama.cpp. Доступна и в облачных free-tier (OpenRouter, Google AI Studio).
- Локальный ассистент на домашнем ПК
- Приватная обработка текста офлайн
- Лёгкий бэкенд там, где 70B+ не тянет железо