Llama Lite (Yandex) llama-lite/latest

Модель Llama Lite (Yandex) от YandexGPT (семейство yandex) доступна через единый OpenAI-совместимый API НейроГейт — без VPN, с оплатой в рублях, единым ключом для всех 353+ моделей платформы.
YandexGPT — главная российская LLM. Лучшее понимание русского контекста.

👁 Зрение 🧠 Рассуждение 🎨 Генерация изображений 🎙 Аудио-вход 🔊 Синтез речи 🆓 Бесплатно
8K
контекст, токенов
100 ₽
за 1 млн входных токенов
100 ₽
за 1 млн выходных токенов
0
возможностей

Что такое Llama Lite (Yandex)

Лёгкие текстовые задачи в российской облачной среде, где важны скорость отклика и низкая стоимость запроса.

Llama Lite от Yandex — компактная языковая модель на базе архитектуры Llama, запущенная через инфраструктуру Яндекса. Это российский сервис: модель обслуживается на серверах Яндекса, что может быть важно с точки зрения требований к локализации данных и соответствия российскому законодательству.

Модель ориентирована на лёгкие текстовые задачи с контекстным окном 8 000 токенов. Компактный размер предполагает быстрый отклик и низкую стоимость инференса, однако возможности по сложным рассуждениям и работе с длинными документами ограничены по сравнению с полноразмерными моделями семейства. Поддерживает только текстовый ввод и вывод — мультимодальные сценарии не предусмотрены.

Подходит для проектов, где важна скорость, предсказуемость затрат и работа в российской облачной инфраструктуре, а задачи не требуют глубокого контекста или сложной логики.

Когда брать эту модель

Пример работы

Реальный сценарий, на котором модель проявляет себя:

Перефразируй следующий абзац пресс-релиза в более деловом стиле, сохранив ключевые факты.

Использование Llama Lite (Yandex) через НейроГейт

OpenAI-совместимый эндпоинт https://api.neuralgate.ru/v1 — замени base_url в любом SDK и используй модель по её id.

# Chat completion
curl https://api.neuralgate.ru/v1/chat/completions \
  -H "Authorization: Bearer $NEURALGATE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-lite/latest",
    "messages": [{"role":"user","content":"Привет!"}]
  }'

Похожие модели

Сравнить Llama Lite (Yandex) с другими

Llama Lite (Yandex) vs YandexGPT 32K Llama Lite (Yandex) vs YandexGPT Lite Llama Lite (Yandex) vs YandexGPT Pro Все сравнения →

Кейсы использования

Где Llama Lite (Yandex) часто применяется:

Чат-боты Генерация контента Перевод Поддержка клиентов

Подключить Llama Lite (Yandex) через единый API

Без VPN. Оплата в рублях. 30 минут до первого запроса. Один ключ — 353 модели.

Получить API-ключ →