Как мультимодальные модели учатся понимать текст, картинки, видео... — Андрей Кузнецов — Семинар AGI
Как мультимодальные модели учатся понимать текст, картинки, видео и аудио — Андрей Кузнецов (Исполнительный директор по исследованию данных Sber AI, Научный консультант AIRI) Семинар русскоязычного сообщества AGI 14 сентября 2023, 18:00 (время московское) От спикера: С 2010 года занимаюсь исследованиями в области компьютерного зрения, в 2013 г. защитил диссертацию на соискание учёной степени к.т.н., за спиной большое количество научных исследований, работ и более 60 публикаций в журналах и тезисах международных конференций уровней Q2/Q1 и A/A*, индексируемых базами данных Scopus и Web of Science (H-Index = 11). В 2021 году руководил командой Самарского университета в коллаборации с командами Sber AI, SberDevices и AIRI в рамках проекта ruDALL-E. Последние два года руковожу исследованиями в Sber AI и AIRI, где мы разрабатываем такие модели как генеративная модель синтеза изображений и видео по тексту Kandinsky, мультимодальная многозадачная модель RUDOLPH, модель переноса лица с одного фото на фото или видео GHOST и другие решения в области CV, NLP и мультимодальных архитектур. - https://scholar.google.com/citations?user=q0lIfCEAAAAJ - https://orcid.org/0000-0001-6446-8663 - https://t.me/complete_ai https://agirussia.org/ Мы ведем группы и организуем семинары русскоязычного сообщества разработчиков систем AGI (Artificial General Intelligence или Общий Искусственный Интеллект) или Strong AI (Сильный Искусственный Интеллект), а также - являющийся их частным случаем HLAI (Human-Level Artificial Intelligence или Искусственный Интеллект Человеческого Уровня). Группы: https://t.me/agirussianews (новостной канал) https://t.me/agirussia (основная) https://t.me/agiterms (вопросы терминологии) https://t.me/agibots (разговорный интеллект) https://t.me/agifintech (финансовые технологии) https://t.me/collectivei (коллективный интеллект) https://vk.com/agirussia https://www.facebook.com/groups/agirussia (основная) https://www.facebook.com/groups/socialintelligence (коллективный интеллект) https://groups.google.com/g/agirussia Онлайн-семинары идут по четвергам, в 18:00 по Московскому времени. Продолжительность два часа, обычно это либо доклад на один-полтора часа и последующее обсуждение на полчаса-час либо круглый стол с регламентом на усмотрение модератора дискуссии. Технические средства проведения, регламент и модерацию обычно обеспечивает инициатор конкретного семинара либо спикер и его коллеги. Регистрация на семинары (внизу страницы): https://aigents.timepad.ru/event/1412596 Программа следующих семинаров: https://agirussia.org/workshops.html
Как мультимодальные модели учатся понимать текст, картинки, видео и аудио — Андрей Кузнецов (Исполнительный директор по исследованию данных Sber AI, Научный консультант AIRI) Семинар русскоязычного сообщества AGI 14 сентября 2023, 18:00 (время московское) От спикера: С 2010 года занимаюсь исследованиями в области компьютерного зрения, в 2013 г. защитил диссертацию на соискание учёной степени к.т.н., за спиной большое количество научных исследований, работ и более 60 публикаций в журналах и тезисах международных конференций уровней Q2/Q1 и A/A*, индексируемых базами данных Scopus и Web of Science (H-Index = 11). В 2021 году руководил командой Самарского университета в коллаборации с командами Sber AI, SberDevices и AIRI в рамках проекта ruDALL-E. Последние два года руковожу исследованиями в Sber AI и AIRI, где мы разрабатываем такие модели как генеративная модель синтеза изображений и видео по тексту Kandinsky, мультимодальная многозадачная модель RUDOLPH, модель переноса лица с одного фото на фото или видео GHOST и другие решения в области CV, NLP и мультимодальных архитектур. - https://scholar.google.com/citations?user=q0lIfCEAAAAJ - https://orcid.org/0000-0001-6446-8663 - https://t.me/complete_ai https://agirussia.org/ Мы ведем группы и организуем семинары русскоязычного сообщества разработчиков систем AGI (Artificial General Intelligence или Общий Искусственный Интеллект) или Strong AI (Сильный Искусственный Интеллект), а также - являющийся их частным случаем HLAI (Human-Level Artificial Intelligence или Искусственный Интеллект Человеческого Уровня). Группы: https://t.me/agirussianews (новостной канал) https://t.me/agirussia (основная) https://t.me/agiterms (вопросы терминологии) https://t.me/agibots (разговорный интеллект) https://t.me/agifintech (финансовые технологии) https://t.me/collectivei (коллективный интеллект) https://vk.com/agirussia https://www.facebook.com/groups/agirussia (основная) https://www.facebook.com/groups/socialintelligence (коллективный интеллект) https://groups.google.com/g/agirussia Онлайн-семинары идут по четвергам, в 18:00 по Московскому времени. Продолжительность два часа, обычно это либо доклад на один-полтора часа и последующее обсуждение на полчаса-час либо круглый стол с регламентом на усмотрение модератора дискуссии. Технические средства проведения, регламент и модерацию обычно обеспечивает инициатор конкретного семинара либо спикер и его коллеги. Регистрация на семинары (внизу страницы): https://aigents.timepad.ru/event/1412596 Программа следующих семинаров: https://agirussia.org/workshops.html
