AI-разработчик (Разработчик систем искусственного интеллекта)
от 300000 ₽ до 322000 ₽
Дата обновления: 14.07.2025, 11:17
АКЦИОНЕРНОЕ ОБЩЕСТВО "КОРПОРАЦИЯ ТУРИЗМ.РФ"
Город Москва, Красная Пресня улица, дом: Д. 22;офис/квартира: ЭТАЖ 3 ПОМЕЩЕНИЕ 24;
Должностные обязанности
Проектирование, разработка и поддержка бекенд-сервисов платформы на базе Python и выбранных технологий (Ollama, FastAPI/Flask/Django, PgVector). Разработка и интеграция фронтенд-интерфейсов для взаимодействия с платформой. Интеграция и настройка ключевых компонентов платформы: Ollama (работа с локальными LLM), Langflow (визуальное создание цепочек/агентов), n8n (оркестрация рабочих процессов, интеграции), PgVector (векторные базы данных), S3 (хранение моделей, данных, документов). Обеспечение отказоустойчивости, масштабируемости и производительности платформы, особенно при работе с GPU-интенсивными LLM. Создание и совершенствование ETL/ELT пайплайнов для обработки структурированных и неструктурированных данных (текст, документы). Реализация и оптимизация векторного поиска и семантической категоризации данных с использованием PgVector и техник Embedding. Интеграция и настройка OCR (Optical Character Recognition) и ASR (Automatic Speech Recognition) сервисов для извлечения текста из изображений, PDF и аудио/видео контента. Проектирование, разработка и внедрение интеллектуальных агентов для решения бизнес-задач (управление проектами, анализ рисков, поддержка принятия решений) с использованием Langchain, LlamaIndex или аналогичных фреймворков. Реализация и оптимизация RAG (Retrieval-Augmented Generation) систем для обеспечения агентов и чат-интерфейсов релевантной контекстной информацией из корпоративных источников. Автоматизация рабочих процессов агентов и интеграция их с другими системами. Интеграция платформы с корпоративными системами: LDAP/Active Directory (аутентификация/авторизация), базы данных, системы документооборота (1С). Разработка и поддержка безопасных API (REST, gRPC) для взаимодействия с платформой и ее компонентами. Обеспечение соответствия платформы корпоративным стандартам безопасности (RBAC, шифрование данных, аудит). Проектирование, разработка и оптимизация баз данных (PostgreSQL с PgVector, возможно другие) для эффективного хранения и поиска: чатов, пользовательских данных, векторных эмбеддингов, документации, метаданных. Контейнеризация сервисов платформы с использованием Docker. Участие в развертывании и управлении платформой в Kubernetes-кластерах. Настройка и оптимизация использования GPU-серверов для работы с локальными LLM (Ollama). Внедрение и настройка систем мониторинга (Prometheus, Grafana) и логирования (ELK stack, Loki) для отслеживания состояния, производительности и использования платформы. Оперативное выявление, диагностика и устранение сбоев и узких мест производительности. Обеспечение резервного копирования и восстановления критических данных платформы. Исследование, прототипирование и внедрение новых AI-возможностей в платформу, таких как расширенные решения для Voice-to-Text (ASR), Text-to-Speech (TTS), анализа тональности, извлечения сущностей и др.
Требования к кандидату
Практический опыт полного цикла разработки и внедрения промышленных ИИ-решений или платформ. Глубокое знание Python и его экосистемы для AI/ML (NumPy, Pandas, PyTorch/TensorFlow). Опыт работы с современными backend-фреймворками (FastAPI, Flask, Django, Node.js). Опыт интеграции или разработки фронтенд-интерфейсов (React.js, понимание принципов работы SPA) и взаимодействия с бекендом. Практический опыт работы с векторными базами данных, обязательно PgVector (или аналоги: FAISS, ChromaDB, Milvus, Weaviate). Опыт разработки и интеграции API (REST, gRPC). Навыки работы с реляционными (PostgreSQL) и NoSQL (MongoDB, Redis) БД. Опыт работы с Docker и контейнеризацией приложений. Опыт работы с Kubernetes (развертывание, управление подами/сервисами) Опыт настройки, развертывания и оптимизации серверов с GPU для запуска LLM. Практический опыт реализации RAG (Retrieval-Augmented Generation) систем. Понимание архитектур и принципов работы современных LLM. Опыт работы с фреймворками для построения LLM-пайплайнов и агентов (Langchain, LlamaIndex, Haystack и др.). Знание принципов обработки естественного языка (NLP). Знание принципов построения высоконагруженных, масштабируемых и отказоустойчивых распределенных систем. Опыт интеграции с корпоративными системами (LDAP/AD, базы данных, REST/SOAP API). Опыт разработки с учетом требований безопасности (аутентификация, авторизация, шифрование). Опыт настройки и использования систем мониторинга (Prometheus, Grafana) и логирования (ELK stack - Elasticsearch, Logstash, Kibana; или Loki/Promtail/Grafana). Опыт работы с технологиями и фремворками типа Ollama, OpenWebUI, Langflow, n8n. Опыт fine-tuning языковых моделей под специфические задачи. Опыт проектирования и разработки микросервисных архитектур и масштабируемых API-шлюзов. Навыки DevOps: построение CI/CD пайплайнов (GitLab CI/CD, Jenkins, GitHub Actions), управление инфраструктурой как код (Terraform, Ansible) - как плюс. Опыт работы с системами очередей сообщений (Kafka, RabbitMQ, Redis Streams) - как плюс. Опыт работы с графовыми базами данных (Neo4j) - как плюс. Опыт работы с библиотеками/сервисами OCR (Tesseract, PaddleOCR, AWS Textract) и ASR (Whisper). Понимание MLOps практик.
Образование: Высшее образование — бакалавриат
Опыт работы (лет): 6
Квалификации
Практический опыт полного цикла разработки и внедрения промышленных ИИ-решений или платформ. Глубокое знание Python и его экосистемы для AI/ML (NumPy, Pandas, PyTorch/TensorFlow). Опыт работы с современными backend-фреймворками (FastAPI, Flask, Django, Node.js). Опыт интеграции или разработки фронтенд-интерфейсов (React.js, понимание принципов работы SPA) и взаимодействия с бекендом. Практический опыт работы с векторными базами данных, обязательно PgVector (или аналоги: FAISS, ChromaDB, Milvus, Weaviate). Опыт разработки и интеграции API (REST, gRPC). Навыки работы с реляционными (PostgreSQL) и NoSQL (MongoDB, Redis) БД. Опыт работы с Docker и контейнеризацией приложений. Опыт работы с Kubernetes (развертывание, управление подами/сервисами) Опыт настройки, развертывания и оптимизации серверов с GPU для запуска LLM. Практический опыт реализации RAG (Retrieval-Augmented Generation) систем. Понимание архитектур и принципов работы современных LLM. Опыт работы с фреймворками для построения LLM-пайплайнов и агентов (Langchain, LlamaIndex, Haystack и др.). Знание принципов обработки естественного языка (NLP). Знание принципов построения высоконагруженных, масштабируемых и отказоустойчивых распределенных систем. Опыт интеграции с корпоративными системами (LDAP/AD, базы данных, REST/SOAP API). Опыт разработки с учетом требований безопасности (аутентификация, авторизация, шифрование). Опыт настройки и использования систем мониторинга (Prometheus, Grafana) и логирования (ELK stack - Elasticsearch, Logstash, Kibana; или Loki/Promtail/Grafana). Опыт работы с технологиями и фремворками типа Ollama, OpenWebUI, Langflow, n8n. Опыт fine-tuning языковых моделей под специфические задачи. Опыт проектирования и разработки микросервисных архитектур и масштабируемых API-шлюзов. Навыки DevOps: построение CI/CD пайплайнов (GitLab CI/CD, Jenkins, GitHub Actions), управление инфраструктурой как код (Terraform, Ansible) - как плюс. Опыт работы с системами очередей сообщений (Kafka, RabbitMQ, Redis Streams) - как плюс. Опыт работы с графовыми базами данных (Neo4j) - как плюс. Опыт работы с библиотеками/сервисами OCR (Tesseract, PaddleOCR, AWS Textract) и ASR (Whisper). Понимание MLOps практик.
Образование: Высшее образование — бакалавриат
Опыт работы (лет): 6
Условия
Тип занятости: Дистанционная (удаленная) работа
График работы: FULL
Количество рабочих мест: 1
Добровольное медицинское страхование
Бонусы
Добровольное медицинское страхование
дистанционная (удаленная) работа
full
Контактное лицо компании
Департамент управления персоналом
Контактное лицо