Llama Lite (Yandex) llama-lite/latest
Модель Llama Lite (Yandex) от YandexGPT
(семейство yandex) доступна через единый OpenAI-совместимый API НейроГейт —
без VPN, с оплатой в рублях, единым ключом для всех 353+ моделей платформы.
YandexGPT — главная российская LLM. Лучшее понимание русского контекста.
Что такое Llama Lite (Yandex)
Лёгкие текстовые задачи в российской облачной среде, где важны скорость отклика и низкая стоимость запроса.
Llama Lite от Yandex — компактная языковая модель на базе архитектуры Llama, запущенная через инфраструктуру Яндекса. Это российский сервис: модель обслуживается на серверах Яндекса, что может быть важно с точки зрения требований к локализации данных и соответствия российскому законодательству.
Модель ориентирована на лёгкие текстовые задачи с контекстным окном 8 000 токенов. Компактный размер предполагает быстрый отклик и низкую стоимость инференса, однако возможности по сложным рассуждениям и работе с длинными документами ограничены по сравнению с полноразмерными моделями семейства. Поддерживает только текстовый ввод и вывод — мультимодальные сценарии не предусмотрены.
Подходит для проектов, где важна скорость, предсказуемость затрат и работа в российской облачной инфраструктуре, а задачи не требуют глубокого контекста или сложной логики.
Когда брать эту модель
- ✓ Быстрая классификация и маршрутизация входящих обращений
- ✓ Генерация коротких текстов: описания товаров, шаблонные ответы, подписи
- ✓ Простые задачи извлечения информации из небольших фрагментов текста
- ✓ Прототипирование чат-ботов с базовой логикой диалога
- ✓ Проекты с требованиями к размещению данных в российской инфраструктуре
Пример работы
Реальный сценарий, на котором модель проявляет себя:
Перефразируй следующий абзац пресс-релиза в более деловом стиле, сохранив ключевые факты.
Использование Llama Lite (Yandex) через НейроГейт
OpenAI-совместимый эндпоинт https://api.neuralgate.ru/v1 — замени base_url в любом
SDK и используй модель по её id.
# Chat completion curl https://api.neuralgate.ru/v1/chat/completions \ -H "Authorization: Bearer $NEURALGATE_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "llama-lite/latest", "messages": [{"role":"user","content":"Привет!"}] }'
from openai import OpenAI client = OpenAI( api_key="sk-...your-neuralgate-key...", base_url="https://api.neuralgate.ru/v1", ) response = client.chat.completions.create( model="llama-lite/latest", messages=[{"role": "user", "content": "Привет!"}], ) print(response.choices[0].message.content)
import OpenAI from "openai"; const client = new OpenAI({ apiKey: process.env.NEURALGATE_API_KEY, baseURL: "https://api.neuralgate.ru/v1", }); const resp = await client.chat.completions.create({ model: "llama-lite/latest", messages: [{ role: "user", content: "Привет!" }], }); console.log(resp.choices[0].message.content);
Похожие модели
Сравнить Llama Lite (Yandex) с другими
Кейсы использования
Где Llama Lite (Yandex) часто применяется:
Подключить Llama Lite (Yandex) через единый API
Без VPN. Оплата в рублях. 30 минут до первого запроса. Один ключ — 353 модели.
Получить API-ключ →