NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 nvidia/llama-3.3-nemotron-super-49b-v1.5

Модель NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 от NVIDIA (семейство llama-3) доступна через единый OpenAI-совместимый API НейроГейт — без VPN, с оплатой в рублях, единым ключом для всех 353+ моделей платформы.
Nemotron — open-модели от создателя GPU для AI.

👁 Зрение 🧠 Рассуждение 🎨 Генерация изображений 🎙 Аудио-вход 🔊 Синтез речи 🆓 Бесплатно

131K

контекст, токенов

10 ₽

за 1 млн входных токенов

40 ₽

за 1 млн выходных токенов

возможностей

2024-03

база знаний до

Что такое NVIDIA: Llama 3.3 Nemotron Super 49B V1.5

Агентные и аналитические задачи с глубоким рассуждением, где важен баланс между качеством и вычислительной эффективностью.

NVIDIA Llama 3.3 Nemotron Super 49B V1.5 — это 49-миллиардная языковая модель, созданная NVIDIA на базе Meta Llama 3.3 70B Instruct. В процессе постобучения модель была существенно доработана: через SFT по математике, программированию и естественным наукам, а также специализированную настройку под агентные сценарии — RAG, вызов инструментов и многошаговые рассуждения. Контекстное окно составляет 128K токенов.

Ключевая особенность модели — встроенный режим внутреннего рассуждения (reasoning), позволяющий решать сложные задачи с промежуточными цепочками мыслей. При этом за счёт дистилляции из 70B-модели Nemotron Super 49B сохраняет конкурентоспособное качество при меньших вычислительных затратах. Модель ориентирована на английский язык и хорошо подходит для построения автономных агентов, аналитических пайплайнов и технических приложений, где важна точность рассуждений.

Когда брать эту модель

✓ Агентные пайплайны с вызовом инструментов и RAG
✓ Решение сложных математических и научных задач с пошаговым рассуждением
✓ Генерация и отладка кода в технических проектах
✓ Многошаговые аналитические задачи, требующие chain-of-thought
✓ Сценарии, где нужен баланс между качеством 70B-класса и меньшей стоимостью инференса

Пример работы

Реальный сценарий, на котором модель проявляет себя:

Реализуй агента на Python, который использует вызов инструментов для поиска актуальных данных о компании, анализирует финансовые показатели и формирует структурированный отчёт с выводами.

Использование NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 через НейроГейт

OpenAI-совместимый эндпоинт https://api.neuralgate.ru/v1 — замени base_url в любом SDK и используй модель по её id.

# Chat completion
curl https://api.neuralgate.ru/v1/chat/completions \
  -H "Authorization: Bearer $NEURALGATE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "nvidia/llama-3.3-nemotron-super-49b-v1.5",
    "messages": [{"role":"user","content":"Привет!"}]
  }'

from openai import OpenAI

client = OpenAI(
    api_key="sk-...your-neuralgate-key...",
    base_url="https://api.neuralgate.ru/v1",
)
response = client.chat.completions.create(
    model="nvidia/llama-3.3-nemotron-super-49b-v1.5",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(response.choices[0].message.content)

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.NEURALGATE_API_KEY,
  baseURL: "https://api.neuralgate.ru/v1",
});
const resp = await client.chat.completions.create({
  model: "nvidia/llama-3.3-nemotron-super-49b-v1.5",
  messages: [{ role: "user", content: "Привет!" }],
});
console.log(resp.choices[0].message.content);