Qwen: Qwen Plus 0728 (thinking) qwen/qwen-plus-2025-07-28:thinking

Модель Qwen: Qwen Plus 0728 (thinking) от Qwen (Alibaba) (семейство qwen) доступна через единый OpenAI-совместимый API НейроГейт — без VPN, с оплатой в рублях, единым ключом для всех 353+ моделей платформы.
Открытые модели Alibaba. Лучшие в open-source для китайского и кода.

👁 Зрение 🧠 Рассуждение 🎨 Генерация изображений 🎙 Аудио-вход 🔊 Синтез речи 🆓 Бесплатно

контекст, токенов

26 ₽

за 1 млн входных токенов

78 ₽

за 1 млн выходных токенов

возможностей

2025-03

база знаний до

Что такое Qwen: Qwen Plus 0728 (thinking)

Задачи, требующие глубокого рассуждения над большими объёмами текста или кода, когда полноценный флагман избыточен по цене.

Qwen Plus 0728 (thinking) — гибридная модель рассуждений от Alibaba на базе архитектуры Qwen3, сочетающая расширенный контекст в 1 миллион токенов с режимом внутреннего chain-of-thought. Модель позиционируется как сбалансированное решение между производительностью, скоростью и стоимостью — то есть занимает нишу между лёгкими быстрыми моделями и тяжёлыми флагманами.

Режим thinking означает, что перед финальным ответом модель выполняет скрытое пошаговое рассуждение, что заметно улучшает качество на задачах с многоступенчатой логикой, математикой и анализом сложных документов. Контекстное окно в 1M токенов позволяет работать с очень большими кодовыми базами, длинными юридическими или техническими документами, а также многоходовыми диалогами без потери контекста.

Семейство Qwen3 от Alibaba демонстрирует конкурентоспособные результаты на задачах рассуждения и программирования, при этом модели линейки Plus традиционно ориентированы на практическое применение в продакшн-сценариях, где важен баланс между качеством ответа и затратами на инференс.

Когда брать эту модель

✓ Анализ и суммаризация больших документов — юридических контрактов, технической документации, научных отчётов
✓ Многоступенчатые задачи рассуждения: математика, логические цепочки, структурированный анализ
✓ Работа с крупными кодовыми базами: ревью, рефакторинг, поиск багов на уровне всего проекта
✓ Сложные RAG-пайплайны, где нужно удерживать большой контекст из множества источников
✓ Продакшн-сценарии, где требуется баланс качества и стоимости без перехода на самый дорогой флагман

Пример работы

Реальный сценарий, на котором модель проявляет себя:

Проанализируй весь этот репозиторий (вставлен исходный код 200+ файлов) и найди потенциальные узкие места производительности в логике обработки запросов, объяснив цепочку вызовов пошагово.

Использование Qwen: Qwen Plus 0728 (thinking) через НейроГейт

OpenAI-совместимый эндпоинт https://api.neuralgate.ru/v1 — замени base_url в любом SDK и используй модель по её id.

# Chat completion
curl https://api.neuralgate.ru/v1/chat/completions \
  -H "Authorization: Bearer $NEURALGATE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen-plus-2025-07-28:thinking",
    "messages": [{"role":"user","content":"Привет!"}]
  }'

from openai import OpenAI

client = OpenAI(
    api_key="sk-...your-neuralgate-key...",
    base_url="https://api.neuralgate.ru/v1",
)
response = client.chat.completions.create(
    model="qwen/qwen-plus-2025-07-28:thinking",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(response.choices[0].message.content)

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.NEURALGATE_API_KEY,
  baseURL: "https://api.neuralgate.ru/v1",
});
const resp = await client.chat.completions.create({
  model: "qwen/qwen-plus-2025-07-28:thinking",
  messages: [{ role: "user", content: "Привет!" }],
});
console.log(resp.choices[0].message.content);