Выбрать страницу

ML-инженер (GigaChat Search Alignment)

зарплата не указана
Дата обновления: 16.07.2025, 18:55
Общество с ограниченной ответственностью "Хэдхантер"
Кутузовский проспект 32

Должностные обязанности

Мы - команда ML-инженеров GigaChat Data. Наша команда готовит данные для обучения всей линейки моделей LLM GigaChat (GigaChat, GigaChat Vision, GigaChat Audio, Giga Embeddings и др.). Мы собираем данные как для базовых моделей, так и для их адаптации под конкретные сценарии: core модели – базовые модели продукты B2C – WEB-версия GigaChat, персонализированные интеллектуальные ассистенты внутренние банковские задачи – автоматизация обработки документов, анализ финансовых данных, поддержка сотрудников внешние заказчики – кастомные решения для корпоративных клиентов, интеграция LLM в бизнес-процессы. Что предстоит делать внедрять сервиса поиска в работу GigaChat собирать данные для alignment-обучения LLM: Supervised Finetuning (SFT), Reinforcement Learning (DPO, PPO, GRPO и др.) улучшать пайплайны предобработки данных: автоматизация фильтрации, очистки и подготовки для разметки работать в плотной связке с ML-командой: LoRA-finetuning, проверка экспериментальных гипотез, анализ результатов взаимодействовать с командой асессоров/разметчиков: мониторинг качества, корректировка инструкций, настройка разметки (включая SBS/side-by-side) рассчитывать метрики и принимать решения по улучшению качества данных, сравнивая с конкурентами (Perplexity, OpenAI (ChatGPT Search), DeepSeek, YandexGPT (Яндекс Нейро) и пр.) развивать комплекс DeepResearch: создавать глубокие отчёты по пользовательским запросам и бизнес-аналитике. Для нас важно: отличное знание Python и опыт работы с проприетарными и open-source LLM (Llama, Mistral, Qwen, GPT, Anthropic и т. д.) понимание процессов подготовки данных и их использования в больших языковых моделях: фильтрация, шлифовка, версия датасетов навыки в построении пайплайнов для SFT/RL, настройке LoRA-finetuning и работе над многозадачными проектами опыт работы с одной или несколькими модальностями (аудио, vision, видео и пр.). Будет плюсом опыт с LLM-агентами и фреймворками: LangChain, LangSmith, LangGraph, GraphRAG, GPTIndex, FAISS, RAG, ChromaDB опыт работы в поисковых проектах (интеграция поисковых движков, настройка ранжирования, работа с бэкендом поиска). Мы предлагаем: крупнейшее DS&AI community — более 600 DS-специалистов банка дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира возможность выбрать удобный формат работы: гибрид или офис комфортный современный офис: ст. м. Кутузовская, пр. Кутузовский, 32 ежегодный пересмотр зарплаты, годовая премия корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа ипотека выгоднее до 7% для каждого сотрудника бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбера.

Требования к кандидату

Образование: не указано

Квалификации

Образование: не указано

Условия

Тип занятости: Полная занятость
График работы: FULL
Количество рабочих мест: 1
полная занятость
full

Контактное лицо компании

Команда рекрутмента Сбера
Контактное лицо