Павел Саликов
Data Scientist Wildberries
«Быстрый matching товаров на маркетплейсе Wildberries»
— Какую задачу и на каких данных решаем;
— От миллионов пар к тысячам: отбор кандидатов;
— От тысяч пар к единицам: классификация пар;
— От пар к группам: анализ графов;
— Какие результаты имеем от мэтчинга.
Дмитрий Лахвич
Lead Data platform M2
«Floppa the LakeHouse»
— Новая платформа данных, которую строит и на которую мигрирует М2;
— Trino, Dbt, Airflow;
— Организация взаимодействия команд и процессы, погрузимся в технические детали;
— О сложностях и вещах которые пришлось пересмотреть или отложить.
Богдан Глебов
Head of Data RealX
«Как мы съели ПУД соли выстраивая data management (и почти не подавились)»
— Про платформу управления данными (ПУД) выстраиваемую для девелоперской компании STONE.
Даниил Понизов
MLOps Wildberries
«Создание MLOps-платформы для десятка команд на основе Airflow»
— Настройка airflow для пользования, деплоя и запуска различными ds командами;
— Мультикластерный запуск дагов;
— Кастомные решения для интеграции с внутренними сервисами;
— Сложности деплоя дагов;
— Фичастор на базе airflow.
Павел Северилов
NLP Team Lead ecom.tech (ex Samokat.tech)
«Как обрабатывать, фильтровать и генерировать текстовые данные для моделей машинного обучения»
На основе опыта команды NLP из ecom.tech расскажем как работать с текстовыми данными:
— Как обрабатывать текстовые данные
— Как генерировать новые текстовые данные с помощью LLM и классическими способами
— Зачем и как искать похожие данные для ML моделей
Разберем тонкости и методы на примере задач автоматизации клиентской поддержки и аналитики обратной связи клиентов. Поделимся результатами и расскажем, какие методы помогли нам повысить качество ML моделей
16:15 17:00 | Сбор гостей / Регистрация
17:05 17:35 | Павел Саликов «Быстрый matching товаров на маркетплейсе Wildberries»
17:35 18:05 | Павел Северилов «Как обрабатывать, фильтровать и генерировать текстовые данные для моделей машинного обучения»
18:05 18:35 | Богдан Глебов «Как мы съели ПУД соли выстраивая data management (и почти не подавились)»
18:35 19:05 | Даниил Понизов «Создание MLOps-платформы для десятка команд на основе Airflow»
19:05 19:35 | Дмитрий Лахвич «Floppa the LakeHouse»
19:45 21:00 | Офлайн-нетворкинг
Напоминаем, что для того чтобы восстановить билет организатору можно не писать.
Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.