Анализ данных и текстов: ИИ для BI и аналитики

Sentiment-анализ, классификация, извлечение сущностей, summarization больших отчётов.

LLM — универсальный аналитический инструмент: суммаризация многостраничных отчётов, извлечение структурированных данных из неструктурированного текста (PDF, скриншоты, переписка), классификация и оценка тональности.

Пример кода

python

# Извлечение структурированных данных из отчёта
resp = client.chat.completions.create(
    model="anthropic/claude-sonnet-4.6",
    messages=[{
        "role": "system",
        "content": "Извлеки из отчёта в JSON: revenue, gross_margin_pct, top_3_risks (массив строк). Если данных нет — null."
    }, {
        "role": "user", "content": pdf_text_2024
    }],
    response_format={"type": "json_object"},
)
import json
data = json.loads(resp.choices[0].message.content)

Замените ng-... на свой ключ из личного кабинета. Полная документация — /api/.

Запустите свой Анализ данных и текстов

Один OpenAI-совместимый эндпоинт, любая из 401+ моделей, биллинг ИП/ООО в рублях.

Получить API-ключ → Документация API

Часто задаваемые вопросы

Как анализировать сканы документов и PDF?

Используйте vision-модели (GPT-4o, Gemini 2.5 Pro, Claude Opus): передавайте изображения страниц как image_url в content.

Reasoning-модели стоят дороже — когда они нужны?

Multi-step рассуждения: финансовый анализ с условиями, юридические заключения, диагностика инцидентов. DeepSeek R1, OpenAI o1, Claude Opus.

Сколько стоит обработать 1000 отзывов?

При среднем отзыве 300 слов ≈ 400 токенов: на Haiku ≈ 25 руб; на Sonnet ≈ 120 руб; на Opus ≈ 600 руб.

Стоит ли использовать LLM вместо традиционного NLP?

Для прототипа — всегда LLM. Для прод-нагрузки больше 100K объектов в день — считайте затраты, иногда классический pipeline дешевле.

Рекомендуемые модели для этой задачи

Пример кода

Запустите свой Анализ данных и текстов

Часто задаваемые вопросы

Другие кейсы использования