Python AI Engineer (RAG / LLM / TTS / Image Generation)
Город:
Гродно
Занятость:
Полная занятость
Компания "Эксор ЛТД"
Описание:
Мы — сервисная IT-компания, занимаемся разработкой web-приложений для клиентов из Европы и Северной Америки.
Сейчас ищем AI-инженера, который сможет взять на себя весь цикл работы с LLM, RAG, генерацией текста, аудио и изображений для нашего нового продукта в сфере EdTech.
Нужен специалист, который умеет самостоятельно проектировать, разрабатывать и поддерживать полноценные AI-модули: от ingestion и RAG до QA, TTS и image generation.
Обязанности:
Работа над AI-частью крупного web-продукта (образовательная платформа).
Основные задачи:
1. Разработка AI-функционала
-
построение RAG-системы: ingestion, OCR, chunking, embeddings, vector store, retrieval;
-
генерация текстов при помощи LLM (TOC, главы, параграфы, переработки, QA);
-
построение citation-движка (привязка chunkId к абзацам, coverage%, distance rules);
-
реализация AI QA (проверка фактов, ссылок, структуры, стиля, автоматические исправления).
2. Оркестрация и пайплайны
-
разработка AI Orchestrator: очереди, ретраи, idempotency, fallback, SLA;
-
построение многошаговых процессов: генерация → цитирование → QA → упаковка.
3. Аудио и изображения
-
генерация аудиоконтента (TTS + SSML), сегментация, склейка, нормализация;
-
проверка аудио на ACX-совместимость, LUFS, Peak;
-
генерация изображений (обложки, иллюстрации) через DALL·E 3 / аналогичные сервисы.
4. Интеграции
-
работа с OpenAI API, ElevenLabs (или аналогами), DALL·E 3;
-
взаимодействие с backend через REST API;
-
работа с S3-хранилищами и векторными БД (Pinecone / Qdrant).
5. Аналитика, качество и стабильность
-
логирование, трассировка, мониторинг AI-метрик;
-
контроль стоимости (token budget), производительности, корректности генераций;
-
участие в планировании задач, оценке и улучшении архитектуры AI-модулей.
Требования
Python (обязательно)
Уверенный Senior-уровень:
-
Python 3.10+
-
FastAPI
-
Pydantic
-
Asyncio
-
Работа с очередями (Celery / RQ / Dramatiq / async pipeline)
-
Работа с Postgres (SQL, JSONB)
RAG (обязательно)
Опыт разработки полноценных RAG-систем:
-
chunking (token-based, semantic-based, overlap)
-
embeddings (OpenAI, Cohere, Sentence Transformers)
-
vector DB: Qdrant / Pinecone / PGVector
-
retrieval настройки (Top-K, similarity threshold, recency bias, boosts)
-
защита от галлюцинаций и blending
-
построение pipeline: ingestion → embeddings → vector store → retrieval → generation
LLM-engineer навыки
-
генерация длинных текстов (2–10k tokens)
-
многошаговые пайплайны (TOC → Chapters → QA → Regen)
-
JSON schema output
-
обработка markdown
-
промтинг для QA, стилевой обработки, факт-чека, TTS, изображений
Citation / Fact-grounding
-
привязка chunkId к тексту
-
coverage%
-
dedup
-
distance rules
-
обработка устаревших источников (staleness)
AI QA
-
правила проверки фактов, ссылок, структуры
-
LLM-classification
-
Heuristics-линтеры
-
автоисправления (autofix pipelines)
Audio (обязательно)
-
опыт работы с TTS (ElevenLabs / Play.ht / OpenAI)
-
SSML
-
ffmpeg, pydub, librosa
-
LUFS / Peak / noise validation
Image generation (обязательно)
-
DALL·E 3 / Midjourney / Stability API
-
генерация изображений по структуре
-
вариации, апскейлы
-
авто-alt-text
MLOps & Observability
-
работа с Docker
-
логирование, трассировка (OpenTelemetry, Sentry)
-
контроль токенов, стоимости, производительности
Условия:
- работа удаленная, гибкий график
- первый месяц испытательный период
- если проявите свою производительность и ответственность перейдём на работу full-time
- работа в команде программистов. Используeм в работе методологию управления проектов Scrum
- возможности для повышения квалификации и профессионального роста
20 Января
Гродно
Компания "Смартум Про" The company Smartym Pro has been involved in software development for european and USA customers for 11 years. We...
21 Января
Гродно
Компания "ВЭЙ БИТ СОЛЮШЕНС" Мы- Way Bit Solutions , IT-компания с амбициозными планами, создающая технологичные продукты с нуля, разрабатываем...
Вакансия размещена в отрасли