Компания "Эксор ЛТД"
Описание:
Мы — сервисная IT-компания, занимаемся разработкой web-приложений для клиентов из Европы и Северной Америки.
Сейчас ищем AI-инженера, который сможет взять на себя весь цикл работы с LLM, RAG, генерацией текста, аудио и изображений для нашего нового продукта в сфере EdTech.
Нужен специалист, который умеет самостоятельно проектировать, разрабатывать и поддерживать полноценные AI-модули: от ingestion и RAG до QA, TTS и image generation.
Обязанности:
Работа над AI-частью крупного web-продукта (образовательная платформа).
Основные задачи:
1. Разработка AI-функционала
построение RAG-системы: ingestion, OCR, chunking, embeddings, vector store, retrieval;
генерация текстов при помощи LLM (TOC, главы, параграфы, переработки, QA);
построение citation-движка (привязка chunkId к абзацам, coverage%, distance rules);
реализация AI QA (проверка фактов, ссылок, структуры, стиля, автоматические исправления).
2. Оркестрация и пайплайны
разработка AI Orchestrator: очереди, ретраи, idempotency, fallback, SLA;
построение многошаговых процессов: генерация → цитирование → QA → упаковка.
3. Аудио и изображения
генерация аудиоконтента (TTS + SSML), сегментация, склейка, нормализация;
проверка аудио на ACX-совместимость, LUFS, Peak;
генерация изображений (обложки, иллюстрации) через DALL·E 3 / аналогичные сервисы.
4. Интеграции
работа с OpenAI API, ElevenLabs (или аналогами), DALL·E 3;
взаимодействие с backend через REST API;
работа с S3-хранилищами и векторными БД (Pinecone / Qdrant).
5. Аналитика, качество и стабильность
логирование, трассировка, мониторинг AI-метрик;
контроль стоимости (token budget), производительности, корректности генераций;
участие в планировании задач, оценке и улучшении архитектуры AI-модулей.
Требования
Python (обязательно)
Уверенный Senior-уровень:
Python 3.10+
FastAPI
Pydantic
Asyncio
Работа с очередями (Celery / RQ / Dramatiq / async pipeline)
Работа с Postgres (SQL, JSONB)
RAG (обязательно)
Опыт разработки полноценных RAG-систем:
chunking (token-based, semantic-based, overlap)
embeddings (OpenAI, Cohere, Sentence Transformers)
vector DB: Qdrant / Pinecone / PGVector
retrieval настройки (Top-K, similarity threshold, recency bias, boosts)
защита от галлюцинаций и blending
построение pipeline: ingestion → embeddings → vector store → retrieval → generation
LLM-engineer навыки
генерация длинных текстов (2–10k tokens)
многошаговые пайплайны (TOC → Chapters → QA → Regen)
JSON schema output
обработка markdown
промтинг для QA, стилевой обработки, факт-чека, TTS, изображений
Citation / Fact-grounding
привязка chunkId к тексту
coverage%
dedup
distance rules
обработка устаревших источников (staleness)
AI QA
правила проверки фактов, ссылок, структуры
LLM-classification
Heuristics-линтеры
автоисправления (autofix pipelines)
Audio (обязательно)
опыт работы с TTS (ElevenLabs / Play.ht / OpenAI)
SSML
ffmpeg, pydub, librosa
LUFS / Peak / noise validation
Image generation (обязательно)
DALL·E 3 / Midjourney / Stability API
генерация изображений по структуре
вариации, апскейлы
авто-alt-text
MLOps & Observability
работа с Docker
логирование, трассировка (OpenTelemetry, Sentry)
контроль токенов, стоимости, производительности
Условия:
- работа удаленная, гибкий график
- первый месяц испытательный период
- если проявите свою производительность и ответственность перейдём на работу full-time
- работа в команде программистов. Используeм в работе методологию управления проектов Scrum
- возможности для повышения квалификации и профессионального роста
20 Января
Гродно
Компания "Смартум Про" The company Smartym Pro has been involved in software development for european and USA customers for 11 years. We...
21 Января
Гродно
Компания "ВЭЙ БИТ СОЛЮШЕНС" Мы- Way Bit Solutions , IT-компания с амбициозными планами, создающая технологичные продукты с нуля, разрабатываем...
Вакансия размещена в отрасли