Персональные ИИ-ассистенты: помощники с памятью
ИИ-аватары, личные коучи, секретари с долговременной памятью через единый API.
Персональный ИИ-помощник — не «чат с моделью», а система с памятью: помнит факты о пользователе, контекст прошлых разговоров, цели. Обычно это: vector store для долговременной памяти + LLM для размышления + tools для действий (календарь, почта, заметки).
Рекомендуемые модели для этой задачи
Пример кода
python# Ассистент с инструментами + памятью (упрощённо)
tools = [{
"type": "function",
"function": {
"name": "recall_memory",
"description": "Получить факты о пользователе из vector store",
"parameters": {"type": "object", "properties": {
"query": {"type": "string"},
}},
},
}]
resp = client.chat.completions.create(
model="anthropic/claude-sonnet-4.6",
messages=[{"role": "user", "content": "Напомни что ты знаешь про мою цель на квартал."}],
tools=tools,
)
Замените ng-... на свой ключ из личного кабинета. Полная документация — /api/.
Запустите свой Персональные ИИ-ассистенты
Один OpenAI-совместимый эндпоинт, любая из 401+ моделей, биллинг ИП/ООО в рублях.
Получить API-ключ → Документация APIЧасто задаваемые вопросы
Как реализовать долговременную память?
Vector store (Qdrant, pgvector, Weaviate) + извлечение фактов через background-LLM. На каждое сообщение запрос топ-k релевантных фактов передаётся в system prompt.
Какие модели лучше для роли «персонажа»?
Claude (Sonnet/Opus) лучше всех держит характер и стиль. GPT-5 универсальнее. Haiku/Flash — для дешёвой массовой генерации реплик.
Можно ли иметь разные модели в одном диалоге?
Да, через НейроГейт легко роутить: дешёвая модель для типовых ответов, Sonnet/Opus для сложных. Один ключ.
Что с обработкой голоса?
Pipeline: ElevenLabs/OpenAI TTS-1 для синтеза, Whisper для распознавания. Все через тот же НейроГейт API.