Будущее ИИ, компьютерное зрение, Hype Cycle: в Нижнем Новгороде прошли первые лекции по искусственному интеллекту
Дата публикации: 25 июня 2021
25 июня на площадке конференции ЦИПР состоялись лекции по искусственному интеллекту. Мероприятие является частью проекта «Хакатоны и лекции по искусственному интеллекту», запущенного в 2021 году в рамках федерального проекта «Искусственный интеллект».
Организатором проекта выступает Министерство экономического развития РФ, оператором является АНО «Россия – страна возможностей», организационным партнером – Ассоциация электронных коммуникаций (РАЭК).
С вводной лекцией об ИИ и нейронных сетях выступил директор департамента Machine Learning МТС Никита Семенов. Он дал такую формулировку определению искусственный интеллект «свойство интеллектуальных систем на основе данных выполнять творческие функции, которые традиционно считаются прерогативой человека. Это не какой-то непонятный модуль, это комплексная система, которая обучается выполнять творческие функции, то, что нас традиционно отличает от классических машин».
По словам лектора, сегодня технологии искусственного интеллекта наиболее востребованы в сфере внешних коммуникаций с клиентами и потребителями — чат-боты, голосовые боты в колл-центрах. Еще одна сфера — security fraud — когда пытаешься деньги перевести, а перевод блокируют. Сфера, которая на слуху, но при этом там низкое проникновение — беспилотные автомобили.
За чем будущее? Будущее должно быть мультимодальным. Скорость набора символов составляет 40 слов в минуту, средняя скорость речи — 130 символов, скорость чтения — 240 символов.
Комбинация различных модальностей обеспечивает более эффективное взаимодействие с пользователем. Если у нас есть виртуальный ассистент, мы часть информации можем подавать в виде звуковой информации, а часть выводить на экран. Это работает в обе стороны, потому что в своей природе взаимодействие человека и человека всегда мультимодально.
О компьютерном зрении и машинном обучении рассказал директор подразделения компьютерного зрения Intel Алексей Мяков:
Технологический мир пришёл к состоянию, когда данные являются неотъемлемой частью интеллектуальной собственности, данные — это новая нефть.
Лет 5-6 лет назад посчитали стоимость данных и сравнили со стоимостью разведанной нефти: по стоимости данные превысили все запасы нефти. Данные создают, их нужно передавать, принимать, готовить, размечать. Если посмотреть на методы, то они существуют десятки лет. Но по-настоящему глубокое обучение стало мощным инструментом в 2013 году.
Компьютерное зрение стало колыбелью для глубокого обучения и последующего ренессанса ИИ. В 2012 году вероятность ошибки упала кардинально, до 16%, после этого произошёл взрывоподобный рост интереса к глубокому обучению: тысячи статей, десятки новых топологий. Уже в 2014 году ИИ побил уровень человеческой ошибки. Мне очень отрадно, что развитие глубокого обучения произошло на базе компьютерного зрения. Именно в Нижнем Новгороде была разработана библиотека OpenCV в конце 90-х внутри компании Intel. Нижний Новгород сыграл весьма важную роль для развития глубокого обучения.
В чём разница между машинным обучением и глубоким обучением? В машинном обучении модель создаёт учёный: вы хотите детектировать собак, создаёте модель собаки, тренируете классификатор, показываете классификатору разные изображения собак. В глубоком обучении шаг создания модели интегрируется в саму модель. У нас нет учёного, который должен создать модель собаки. Модель собаки создаётся во время тренировки сети: сетка учит, что такое собака, на основе данных, которые мы ей показываем.
Ксения Плесовских, лидер гильдии Data Science в IT-компании LAD, рассказала о Hype Cycle в области искусственного интеллекта:
Hype Cycle — это график, который придумало консалтинговое агентство Gartner. Агентство подметило особенность, что каждая технология проходит определённые этапы и эти этапы примерно одинаковые.
На стадии запуска о технологии мало кто знает, формируется основная концепция, ожидания от неё ползут вверх. Затем они достигают пика — бизнес говорит: “Мы готовы, мы поняли, зачем это нам”. И на рынке начинают появляться продукты с этой технологией, но оказываются ещё настолько сырыми, что задачи решают с трудом. Постепенно ожидания начинают снова падать, мечты не сбываются. В конце технологии попадают в спад интереса. Дальше есть два пути: технология получает второе рождение, люди начинают искать варианты реализации этой технологии, если всё удаётся, она выходит на плато продуктивности. Мы воспринимаем такие технологии как само собой разумеющееся. Но если технология не проходит этап работы над ошибками, то на этом этапе она прекращают своё существование.
По ИИ тоже есть Hype Cycle. Следующее обновление нас ждёт через месяц. Gartner предположил относительно самого ближайшего времени. Например, меньше двух лет у нас всего один продукт — это применение видеокарт для использования в задачах ИИ. Сейчас это технология, дошедшая до плато продуктивности. Ей понадобилось 10 лет, чтобы сюда попасть. Big Data уже сошла с плато, она в своё время раздробилась на множество отдельных направлений, хотя до 2015 года тоже успешно двигалась по Hype Cycle. Теперь появилась Small Data — полная противоположность Big Data, то, что может обработать человек, из огромной выборки данных человеку представляют тот объём, на котором он может принять решение. Ещё дебюты года: композитный ИИ, ответственный ИИ, Generative AI, Things as customers и другие.
Виталий Скиба из Cleverbots поразмышлял о том, может ли нейронная сеть заниматься творчеством и исследовать среду и когда нас ждёт самостоятельный ИИ:
Раньше мы давали нейросети определённые метки картинки на вход, и она на основании этих данных должна была предсказывать.
Сейчас мы генерируем что-то с нуля. Мы говорим о генеративно-состязательной нейронной сети. Мы генерируем пять изображений, берём пять фотографий реальных людей и должны понять, какая из них фейковая. Какими должны быть числа, чтобы получить разные фотографии? Эти числа просто должны быть случайными. Несуществующий человек получился просто из шума данных. Можно подавать не просто случайный вектор на вход, но и различные эскизы. Данный подход называется pix2pix. Таким образом, нейронные сети могут генерировать фотографии (и не только) и решать творческие задачи.
Директор лаборатории высокопроизводительных вычислений Российского исследовательского института Huawei Валерий Черепенников рассказал о том, почему шахматы — одна из самых старых задач в области ИИ:
Шахматы известны около полутора тысяч лет. Впервые они появились в Индии, далее правила модифицировались и дошли до нас в виде доски 8 на 8 с чёрными и белыми фигурами.
Шахматы — это перебор вариантов. Шахматист Владимир Крамник сказал, что, может быть, есть в шахматах стратегия, но, чтобы туда добраться, нужно не зевать мат в один ход. По русским шашкам создана база всех позиций, которые есть в игре, поэтому компьютер будет выбирать абсолютно лучший ход. Шахматы — более сложная вещь, потому что остальные фигуры являются дальнодействующими, пробивают линии, диагонали, ходят буквой Г. Мы пришли в компьютерных шахматах фактически к тому, что имели бы в шахматах человеческих. Есть люди, которые основываются на неком стратегическом подходе. Я бы не сказал, что Leela Zero — стратегический подход, но это, действительно, такой подход, когда ты пытаешься выиграть за счёт преимущества в оценке позиции. И тактический подход больше похож на StockFish NNUE, который перебирает кучу вариантов.
Руководитель направления ML Globus Илья Померанцев раскрыл перспективы и тренды в машинном обучении, а также востребованность технологии бизнесом:
Edge AI — применение периферийного ИИ. Это больше относится к архитектурным моментам, подходам, а не технологиям. Это позволяет запускать простые модели на датчиках, видеокамерах и не гонять весь трафик до сервера, а передавать простое решение.
Сильно помогает, если ограниченный канал передачи данных. Второй тренд, который в 2019 году объявил Gartner, — Augmented intelligence (расширенный интеллект) — технологии, которые помогают в принятии решений, на самом деле достаточно сложная платформа, которая анализирует большие объёмы информации и предлагает оптимальные решения для пользователя. Один из трендов — объяснение работы моделей ИИ. Мы уже достигли такого уровня, что уже нейросети раздуты, но мы не всегда понимаем, как правильно оценить саму модель. Как правильно выбирать модель: более точную, быструю, универсальную? Проблема ML-моделей и ИИ в том, что они почти никогда не дают стопроцентного результата и нам сложно обосновывать бизнесу то или иное решение. Следующий тренд — синтетические данные, которые решают много проблем: конфиденциальность, неполность данных или вообще их отсутствие. Интересная тема — распознавание человеческих эмоций с помощью ИИ. Если у взрослого человека можно собрать обратную связь, то есть проблема, например, с детьми. Чтобы понимать, насколько дети заинтересованы в продукте, используются такие решения.
Хакатоны и лекции по искусственному интеллекту — серия образовательных мероприятий, которые пройдут по всей России. Главными целями проекта являются популяризация технологий ИИ в России среди молодых специалистов и студентов, формирование ИТ-сообщества с фокусом на ИИ, а также генерация решений на основе ИИ для бизнеса и государственного сектора. Всего в рамках проекта в период с 2021 по 2024 гг. запланировано проведение 116 хакатонов по искусственному интеллекту: 85 региональных, 24 окружных и 7 международных, а также 85 лекций от ведущих отечественных специалистов по ИИ.
Подробнее о проекте: https://hacks-ai.ru/
Видеозапись лекций доступна по ссылке.