Персональные ИИ-ассистенты: помощники с памятью

ИИ-аватары, личные коучи, секретари с долговременной памятью через единый API.

Персональный ИИ-помощник — не «чат с моделью», а система с памятью: помнит факты о пользователе, контекст прошлых разговоров, цели. Обычно это: vector store для долговременной памяти + LLM для размышления + tools для действий (календарь, почта, заметки).

Рекомендуемые модели для этой задачи

Пример кода

python
# Ассистент с инструментами + памятью (упрощённо)
tools = [{
    "type": "function",
    "function": {
        "name": "recall_memory",
        "description": "Получить факты о пользователе из vector store",
        "parameters": {"type": "object", "properties": {
            "query": {"type": "string"},
        }},
    },
}]

resp = client.chat.completions.create(
    model="anthropic/claude-sonnet-4.6",
    messages=[{"role": "user", "content": "Напомни что ты знаешь про мою цель на квартал."}],
    tools=tools,
)

Замените ng-... на свой ключ из личного кабинета. Полная документация — /api/.

Запустите свой Персональные ИИ-ассистенты

Один OpenAI-совместимый эндпоинт, любая из 401+ моделей, биллинг ИП/ООО в рублях.

Получить API-ключ → Документация API

Часто задаваемые вопросы

Как реализовать долговременную память?
Vector store (Qdrant, pgvector, Weaviate) + извлечение фактов через background-LLM. На каждое сообщение запрос топ-k релевантных фактов передаётся в system prompt.
Какие модели лучше для роли «персонажа»?
Claude (Sonnet/Opus) лучше всех держит характер и стиль. GPT-5 универсальнее. Haiku/Flash — для дешёвой массовой генерации реплик.
Можно ли иметь разные модели в одном диалоге?
Да, через НейроГейт легко роутить: дешёвая модель для типовых ответов, Sonnet/Opus для сложных. Один ключ.
Что с обработкой голоса?
Pipeline: ElevenLabs/OpenAI TTS-1 для синтеза, Whisper для распознавания. Все через тот же НейроГейт API.