Как учат большие языковые модели?

Name: Как учат большие языковые модели?
Uploaded: 2024-03-15T21:44:17+03:00
Duration: 1 h 21 min 3 s
Description: Как учат большие языковые модели?

На YouTube канале Artezio 14 марта в 12:00 по МСК состоялась публичная лекция профессора Владимира Крылова, доктора технических наук и научного консультанта Artezio по применению ИИ в разработке ПО. Он рассказал о процессе работы с LLM, который выполняется до того, как модель открывается для использования. И поэтому, как правило, этот процесс не входит в интересы пользователей. Однако именно от него зависит, будет ли успешной ваша работа с LLM. Это процесс обучения модели. В лекции рассмотрим: - основы машинного обучения и глубокого обучения; - особенности и базовые этапы обучения LLM; - проблему обучающего набора данных; - причины чрезвычайно больших затрат на предварительное обучение LLM. «Основное внимание уделим методикам оценивания работы LLM и причинам, по которым разработчики вынуждены расширять обучение дополнительными процессами. Вы познакомитесь с понятием согласования – alignment – и поймете, как дополнительное обучение позволило появиться феномену ChatGPT. Вы узнаете, что такое метод RLHF, обучение с подкреплением на основе обратной связи с человеком, и как его реализовали в OpenAI. Как метод DPO – оптимизация прямых предпочтений – стал новым оружием в войнах за лучший ИИ? Что такое Self-Rewarding Language Models, которые обучаются без участия человека и достигают результатов, сравнимых с моделями-лидерами? Как появляются модели нового типа, названные Contrastive Learning model (CVCL) и основанные на самообучении с активными действиями вместо гигантских датасетов? Почему о моделях генеративного ИИ все больше говорят как о признаках появления гибридной органической и кремниевой культуры? Обо всем этом узнаете на лекции», – рассказал Владимир Крылов. Лекция будет полезна всем, кто связан с развитием информационных технологий или интересуется последними мировыми тенденциями в ИТ. Задавайте вопросы лектору в комментариях к этому посту: https://t.me/LLM4dev/29. Лекция прошла при информационной поддержке ГК «Ланит», АНО «Горький Тех», а также эвент-площадки it52 и площадки itgorky, где компании рассказывают о себе. Если вы хотите работать в ИТ и в Artezio, отправляйте своё резюме по ссылке https://artezio.ru/openings 00:00 Введение. 1:30 Лекция. 45:00 Вопросы зрителей.

12+

38 просмотров

Пожаловаться Нарушение авторских прав

12+

38 просмотров

, чтобы оставлять комментарии