Машинное обучение

Разработка


Андрей Кузнецов
Директор лаборатории FusionBrain @ AIRI
Москва

Выступает ОНЛАЙН

Расскажу про современное состояние GenAI в работе с различными типами данных: текстами, изображениями и видео. Проанализируем, как современные модели используются при создании AI-агентов, виртуальных ассистентов и в прикладных направлениях, например робототехнике. Особое внимание уделим нашумевшему подходу к созданию «размышляющих» моделей, таких как DeepSeek R1, обсудим перспективы применения методов подкрепленного обучения (RL).

Ждём ваш отзыв

  • День выступления: 19.04.2025
  • Время начала: 13:10
  • Время окончания: 13:50
  • Зал : 310. Данные
  • Категории : Разработка
  • Секции: Машинное обучение

  • Сергей Карпович
    CTO @ Rambler
    Москва

    Поделюсь опытом интеграции крупных языковых моделей (LLM) в портал Rambler, а также проведением сравнительных испытаний и тестированием различных моделей. На примере взаимодействия с GigaChat рассмотрим процесс формирования запросов для LLM (prompt engineering), а также этапы выбора наиболее подходящей модели и её настройки. Обсудим критерии оценки качества генерации и суммаризации, включая метрики Meteor и BERTScore, а также настройку систем мониторинга и контроля. Затронем потенциальные риски, связанные с созданием контента, и вопросы соблюдения нормативных требований. Расскажу, как мы обеспечиваем контроль над результатами работы модели и какие гарантии предоставляем.

    Постараюсь ответить на следующие вопросы:

    1. Как выбрать подходящую модель LLM для решения конкретной бизнес-задачи?

    2. Какие метрики использовать для оценки качества работы модели?

    3. Как обеспечить стабильность и надежность функционирования модели в продакшене?

    4. Какие риски связаны с внедрением LLM, и как их можно минимизировать?

    5. Как организовать мониторинг и обновление модели без ущерба для бизнеса?

    Ждём ваш отзыв

    • День выступления: 18.04.2025
    • Время начала: 14:30
    • Время окончания: 15:00
  • Зал : 310. Данные
  • Категории : Разработка
  • Секции: Машинное обучение

  • Карина Садова
    Руководитель направления ИИ @ X5 Digital
    Москва

    Переход от классических рекомендательных систем к использованию интерактивных персонализаций, включающих старые механизмы, но использующих их по новому


    Почему мы все еще подбираем руками, а не пишем в чат любой пришедший в голову запрос о том, что тебе нужно

    ⁃ Стоимость генерации к конверсии в покупку

    ⁃ Большие репутационные риски запуска чатов с генерациями и необходимое количество ресурсов на их нивелирование

    ⁃ Психология пользователя перехода со старых паттернов на новые


    Плавный переход к будущему: встраивание новых технологий в старые, показавшие свою эффективность, интерфейсы

    ⁃ Умный поиск

    ⁃ Персонализированные каталожные категории и фильтры

    ⁃ Небесячие пользователя способы узнать о его целях больше в явном виде


    В ближайшие годы эти интерфейсы будут трансформироваться, плавно могут возникать новые, важно открыто смотреть на новые технологии, приземляя их на реальность, экспериментировать - и делиться полученным опытом для возникновения новых стандартов рекомендаций

    Ждём ваш отзыв

    • День выступления: 18.04.2025
    • Время начала: 15:05
    • Время окончания: 15:35
  • Зал : 310. Данные
  • Категории : Разработка
  • Секции: Машинное обучение

  • Александр Гончаров
    Фаундер, генеральный директор @ СиВижинЛаб
    Ростов-на-Дону

    ⁃ Блиц-обзор основных DevOps-практик в небольшой ИТ-компании: поверх чего наворачиваем ИИ

    ⁃ Какие ревьюшницы мы попробовали и почему в итоге написали свою

    ⁃ Код-ревью до ИИ и после: реальные кейсы из боевых проектов

    • Трудности внедрения или как продать ИИ своей команде разработки

    Ждём ваш отзыв

    • День выступления: 18.04.2025
    • Время начала: 18:30
    • Время окончания: 19:00
  • Зал : 310. Данные
  • Категории : Разработка
  • Секции: Машинное обучение

  • Ирина Николаева
    Chief Data Science @ Рафт
    Казань

    В чем суть локальных LLM, и правда ли, что Open Source >= ChatGPT

    Как выбрать модель опенсорса под свои задачи

    Промпты для open source LLM = промпты для GPT?

    Попробуем использовать опенсорс модели для написания nginx конфига и Docker файлов

    Отыщем DDoS атаки в логах с помощью LLM

    RAG, Fine-Tuning, QLoRa — вот они слева направо. Как увеличить точность выбранной модели

    Ждём ваш отзыв

    • День выступления: 19.04.2025
    • Время начала: 16:00
    • Время окончания: 18:15
  • Зал : 419. Практикум - 1
  • Категории : Разработка
  • Секции: Машинное обучение

  • Максим Крыжановский
    Технический директор @ Нейроцифровые решения
    Москва

    1. ИИ открывает новые возможности для автоматизации задач в архитектуре и проектировании.

    2. Основная цель – сокращение ошибок и повышение эффективности проектных решений.

    3. Генетические алгоритмы активно используются для генеративного дизайна в архитектуре.

    4. Диффузионные модели начинают внедряться в дизайн и позволяют создавать визуальные концепты по текстовому описанию.

    5. Reinforcement Learning помогает оптимизировать проектные решения в реальном времени.

    6. Пример зонирования офисных помещений демонстрирует практическую пользу ИИ.

    7. AI Copilot системы помогут снизить количество ошибок и оптимизировать процесс создания проектов.

    8. Инновационные алгоритмы позволят архитекторам сосредоточиться на творческих аспектах, делегируя рутинные задачи ИИ.

    9. Перспективы развития ИИ открывают возможность создания интеллектуальной среды для проектирования.

    Ждём ваш отзыв

    • День выступления: 18.04.2025
    • Время начала: 15:40
    • Время окончания: 16:10
  • Зал : 310. Данные
  • Категории : Разработка
  • Секции: Машинное обучение

  • Никита Губорев
    Специалист по информационной безопасности @ OZON
    Москва

    В докладе обсудим, какие риски информационной (и не только) безопасности может принести использование машинного обучения в бизнесе, а также какие бывают атаки на ML и как от них обезопаситься.

    Кому будет особенно интересно послушать: разработчикам ML-решений, так как будут раскрыты технические особенности мер защиты и методы атак, а также топ-менеджерам, так как в выступлении подсвечу последствия, которые возникают, если пренебрегать требованиями безопасности в ML.

    Ждём ваш отзыв

    • День выступления: 19.04.2025
    • Время начала: 13:55
    • Время окончания: 14:35
  • Зал : 310. Данные
  • Категории : Разработка
  • Секции: Машинное обучение

  • Дмитрий Медведев
    Директор Департамента прикладных решений @ Ланит-Терком
    Санкт-Петербург

    Искусственный интеллект становится ключевым элементом во многих отраслях, включая и обеспечение безопасности данных. Современные системы на основе больших языковых моделей (LLM) позволяют выявлять потенциальные угрозы путем анализа и категоризации данных в реальном времени. LLM непрерывно отслеживают изменения и перемещения данных, мгновенно уведомляют пользователей о возможных рисках и предлагает способы их устранения. Сегодня ИИ может обеспечить высокую точность мониторинга и защиты данных, что делает его незаменимым инструментом в арсенале любой современной компании.

    Примером такого использования LLM является система мониторинга конфиденциальной информации в текстовых данных различных источников, таких как почтовые клиенты, мессенджеры и чаты, работающую в режиме реального времени.

    В рамках доклада рассмотрим, как система автоматически выявляет участки текста, содержащие уязвимые данные, и какие механизмы используются для формирования вариантов изменений с сохранением исходного смысла. Это позволяет предотвратить утечку конфиденциальной информации и обеспечить её надежную защиту.

    Также мы затронем вопросы выбора моделей для классификатора и задач перефразирования текста, разберем ключевые метрики оценки качества классификации и генерации текста, обсудим методы квантизации и оптимизации для повышения производительности, а также рассмотрим подходы к мониторингу и анализу работы системы в реальном времени.

    Ждём ваш отзыв

    • День выступления: 18.04.2025
    • Время начала: 17:55
    • Время окончания: 18:25
  • Зал : 310. Данные
  • Категории : Разработка
  • Секции: Машинное обучение

  • Михаил Шрайбман
    CEO @ Osmi IT
    Москва

    - Обход централизации Big Tech: Сегодня AI-модели разрабатываются и управляются крупными корпорациями, что создает риски цензуры, зависимости и контроля. Децентрализация позволяет уйти от этих ограничений.

    - Web3, блокчейн и AI: Технологии децентрализованных вычислений и хранения данных открывают новые возможности для распределенных AI-агентов, работающих без единого центра.

    - Будущее AI и экономики: Децентрализованные AI-агенты могут создать новый слой цифровой экономики, где автономные системы взаимодействуют, зарабатывают и принимают решения без вмешательства человека.

    Ждём ваш отзыв

    • День выступления: 18.04.2025
    • Время начала: 17:20
    • Время окончания: 17:50
  • Зал : 310. Данные
  • Категории : Разработка
  • Секции: Машинное обучение

  • Денис Нагаев
    CTO @ Osmi IT
    Москва

    В своём докладе я рассмотрю полный цикл создания AI-агента: от формулировки бизнес-задачи до его внедрения в продакшн и последующей поддержки. Мы начнем с формирования технического задания (ТЗ), подробно разберём, как правильно определять цель и критерии успеха. Особое внимание будет уделено анализу различных больших языковых моделей (LLM): сравним их с точки зрения ключевых метрик и эффективности по результатам смарт-тестов. Я расскажу об этапах разработки AI-агента, включая выбор архитектуры, обучение модели и тестирование. Также мы обсудим актуальную проблему — недостаток компетенций в проектировании микросервисной архитектуры для AI-агентов. Я предложу рекомендации по тому, из каких микросервисов должен состоять AI-агент, чтобы его можно было эффективно эксплуатировать и масштабировать. Завершим доклад вопросами продакшн-развертывания: подключением систем логирования для мониторинга работы модели и организации процесса доставки новых фичей. В результате вы получите чёткое понимание того, как построить и развивать AI-агента, способного решать конкретные бизнес-задачи.

    Ждём ваш отзыв

    • День выступления: 18.04.2025
    • Время начала: 16:45
    • Время окончания: 17:15
  • Зал : 310. Данные
  • Категории : Разработка
  • Секции: Машинное обучение

  • Илья Бадекин
    Data Scientist @ Wildberries
    Москва

    Можно сделать крутую модель, но от нее будет мало проку, если не обеспечить ее интеграцию в реальные бизнес-процессы. В докладе расскажем, откуда и зачем в команде «Товарных рекомендаций» Wildberries текстовый энкодер, на что он способен и как мы сжимали его эмбеддинги для онлайн-доранжирование рекламных баннеров по запросам пользователей: от классических PCA, автоэнкодеров и полносвязных слоев до одного интересного подхода с очень русским названием

    Ждём ваш отзыв

    • День выступления: 19.04.2025
    • Время начала: 14:40
    • Время окончания: 15:20
  • Зал : 310. Данные
  • Категории : Разработка
  • Секции: Машинное обучение

  • Евгений Иванов
    RecSys Team Lead @ Wildberries
    Москва

    При построении персональных рекомендаций зачастую подразумевается, что мы должны получить для каждого пользователя свою, уникальную подборку товаров. Однако в случае, когда пользователей становится слишком много, а в инфраструктуре товары хранятся с обогащением бизнес-факторами, такая схема становится все менее масштабируема. Расскажу о том, как мы без просадки в качестве существенно сократили затраты на инфраструктуру за счет кластеризации пользователей и товаров.

    Основные тезисы:

    - кластеризация пользователей (эмбеддинги WildBERT), создание агрегированной выдачи для кластера;

    - кластеризация товаров (e5) - выделение интересов, отображение пользователя в пространство интересов;

    - сравнение схем "храним подборку для каждого пользователя" и "храним только кластера, юзера описываем как набор кластеров и интересов" в разрезе ранжирующих метрик и затрат на инфраструктуру;

    - как в такой схеме не просадить качество - доранжирование по эмбедингам в онлайне в момент формирования выдачи;

    - зеленый АБ-тест с тестированием описанной схемы, и оценка по экономии на инфраструктуре.

    Ждём ваш отзыв

    • День выступления: 18.04.2025
    • Время начала: 13:55
    • Время окончания: 14:25
  • Зал : 310. Данные
  • Категории : Разработка
  • Секции: Машинное обучение