Чему в России обучают нейронные сети The Village разобрался, как искусственный интеллект меняет экономику, медицину и медиа
В начале февраля российские разработчики напомнили, что нейронные сети способны не только развлекать пользователей забавно отредактированными роликами и снимками, но и решать более важные задачи — например, искать новые лекарства. The Village обратился к экспертам, чтобы узнать, в чем заключаются особенности технологии и как ее используют отечественные компании и университеты.
Что такое нейронные сети?
Чтобы понять, какое место нейронные сети занимают в мире искусственного интеллекта и как они связаны с другими технологиями создания интеллектуальных систем, начнем с определений.
Нейронные сети — один из методов машинного обучения, основы которого зародились в 1943 году, еще до появления термина «искусственный интеллект». Представляют собой математическую модель, отдаленно напоминающую работу нервной системы животных.
По словам старшего научного сотрудника университета Иннополис Станислава Протасова, наиболее близким аналогом человеческого мозга являются сверточные нейронные сети, придуманные математиком Яном Лекуном. «Они лежат в основе многих приложений, претендующих на звание искусственного интеллекта, — например, в FindFace или Prisma», — отмечает он.
Машинное обучение — подраздел искусственного интеллекта на пересечении математики и компьютерных наук. Он изучает методы построения моделей и алгоритмов, основанных на принципе обучения. Машина анализирует скормленные ей примеры, выделяет закономерности, обобщает их и строит правила, с помощью которых решаются разные задачи — например, предсказания дальнейшего развития событий или распознавания и генерации изображений, текста и речи. Помимо нейросетей, здесь также применяются методы линейной регрессии, деревья решений и другие подходы.
Искусственный интеллект — раздел компьютерной науки о создании технологических средств для выполнения машинами задач, которые раньше считались исключительно прерогативой человека, а также обозначение таких разработок. Направление официально оформилось в 1956 году.
Александр Крайнов
глава службы компьютерного зрения «Яндекса»
Что можно назвать искусственным интеллектом, а что нет — вопрос договоренностей. Человечество по большому счету так и не пришло к однозначной формулировке, что такое интеллект вообще, не говоря уже об искусственном. Но если обобщить происходящее, то можно говорить о том, что искусственный интеллект — это глубокие нейронные сети, решающие сложные задачи на уровне, близком к уровню человека, и в той или иной степени самообучающиеся. При этом под самообучением здесь понимается способность самостоятельно извлекать полезный сигнал из сырых данных.
В каком состоянии сейчас находится отрасль?
По оценкам аналитического агентства Gartner, машинное обучение сейчас находится на пике завышенных ожиданий. Характерный для этого этапа ажиотаж вокруг новой технологии приводит к излишнему энтузиазму, который оборачивается неудачными попытками ее повсеместного использования. Предполагается, что на избавление от иллюзий отрасли понадобится от двух до пяти лет. По мнению российских экспертов, в скором времени нейросетям придется пройти проверку на прочность.
Сергей Негодяев
управляющий портфелем Фонда развития интернет-инициатив
Хотя ученые занимаются формализацией и разработкой нейросетей уже 70 лет, можно выделить два переломных момента в развитии этой технологии. Первый — 2007 год, когда в Университете Торонто создали алгоритмы глубокого обучения многослойных нейронных сетей. Второй момент, спровоцировавший сегодняшний бум, — это 2012 год, когда исследователи из того же университета применили глубинные нейросети и выиграли конкурс ImageNet, научившись распознавать объекты на фото и видео с минимумом ошибок.
Сейчас компьютерных мощностей хватает для решения если не любых, то подавляющего большинства задач на базе нейросетей. Теперь главное препятствие — нехватка размеченных данных. Условно говоря, чтобы система научилась распознавать закат на видео или фотографиях, ей надо скормить миллион снимков заката, указав, где именно он находится в кадре. Например, когда вы загружаете в Facebook фотографию, ваши друзья распознают на ней котика в лучах закатного солнца, а социальная сеть видит в ней набор меток: «животное», «кот», «деревянный», «пол», «вечер», «оранжевый». У кого данных для обучения окажется больше, у того нейросеть и будет умнее.
Андрей Калинин
руководитель «Поиска Mail.Ru»
Развлекательные приложения на основе нейросетей — например, наши Artisto или Vinci — это только вершина айсберга, а заодно отличный способ продемонстрировать их возможности широкой аудитории. На самом деле нейросети способны решать целый ряд сложнейших задач. Наиболее «горячие» направления сейчас — это автопилоты, голосовые помощники, чат-боты и медицина.
Александр Крайнов
глава службы компьютерного зрения «Яндекса»
Можно сказать, что бум нейросетей уже настал, но на пик он еще не вышел. Дальше будет только интереснее. Самые перспективные направления сегодня — это, пожалуй, компьютерное зрение, диалоговые системы, анализ текстов, робототехника, беспилотный транспорт и генерация контента — текстов, изображений, музыки.
Перспективные сферы для внедрения нейросетей
Транспорт
Робототехника
Биотехнологии
Сельское хозяйство
Интернет вещей
Медиа и развлечения
Лингвистика
Безопасность
Влад Шершульский
директор программ технологического сотрудничества Microsoft в России
Сегодня уже случилась нейронная революция. Иногда даже трудно отличить фантастику от реальности. Представьте себе автоматизированный комбайн со множеством камер. Он делает по 5 тысяч снимков в минуту и через нейросеть анализирует, сорняк перед ним или зараженное вредителями растение, после чего решает, как поступить дальше. Фантастика? Уже не совсем.
Борис Вольфсон
директор по развитию HeadHunter
Вокруг нейросетей есть определенный хайп и, на мой взгляд, немного завышенные ожидания. Мы еще пройдем через этап разочарования, прежде чем научимся их эффективно использовать. Многие прорывные результаты исследований пока не очень применимы в бизнесе. На практике зачастую разумнее использовать другие методы машинного обучения — например, различные алгоритмы, основанные на деревьях решений. Наверное, это выглядит не так захватывающе и футуристично, но эти подходы очень распространены.
Чему учат нейронные сети в России?
Участники рынка согласны, что многие достижения нейронных сетей пока применимы лишь в академической сфере. За ее пределами технология используется преимущественно в развлекательных приложениях, которые и подогревают интерес к теме. Тем не менее российские разработчики учат нейросети и решению социально-значимых и бизнес-задач. Остановимся подробнее на некоторых направлениях.
Наука и медицина
Школа анализа данных «Яндекса» участвует в эксперименте CRAYFIS совместно с представителями «Сколково», МФТИ, ВШЭ и американских университетов UCI и NYU. Его суть состоит в поиске космических частиц сверхвысокой энергии с помощью смартфонов. Данные с камер передаются ускоренным нейросетям, способным зафиксировать следы слабо взаимодействующих частиц на снимках.
Это не единственный международный эксперимент, в котором задействованы российские специалисты. Ученые университета Иннополис Мануэль Маццара и Леонард Йохард участвуют в проекте BioDynaMo. Заручившись поддержкой Intel и ЦЕРН, они хотят создать опытный образец, способный воспроизвести полномасштабную симуляцию мозговой коры. С его помощью планируется повысить эффективность и экономичность экспериментов, в которых требуется наличие живого человеческого мозга.
Профессор Иннополиса Ярослав Холодов участвовал в разработке компьютерной модели, способной в десятки раз быстрее предсказать образование белковых связей. С помощью этого алгоритма можно ускорить разработку вакцин и лекарств. В этой же сфере отметились разработчики из Mail.Ru Group, Insilico Medicine и МФТИ. Они использовали генеративные состязательные сети, обученные придумывать молекулярные структуры, для поиска веществ, которые могут оказаться полезными при различных болезнях — от онкологии до сердечно-сосудистых заболеваний.
Красота и здоровье
В 2015 году российская компания Youth Laboratories запустила первый международный конкурс красоты Beauty.AI. Фотографии участников в нем оценивались нейросетями. При определении победителей они учитывали пол, возраст, национальность, цвет кожи, симметричность лица и наличие или отсутствие у пользователей морщин. Последний фактор также подтолкнул организаторов к созданию сервиса RYNKL, позволяющего отследить, как старение влияет на кожу и как с ним борются различные препараты.
Также нейросети применяются в телемедицине. Российская компания «Мобильные медицинские технологии», управляющая проектами «Онлайн Доктор» и «Педиатр 24/7», тестирует бота-диагноста, который будет полезен как пациентам, так и врачам. Первым он подскажет, к какому специалисту обратиться при тех или иных симптомах, а вторым поможет определить, чем именно болен пришедший.
Оптимизация бизнес-процессов и рекламы
Российский стартап Leadza сумел применить нейросети для более эффективного распределения бюджета на рекламу в Facebook и Instagram. Алгоритм анализирует результаты прошедших кампаний, строит прогноз ключевых метрик и на их основе автоматически перераспределяет расходы таким образом, чтобы интернет-магазины смогли получить больше клиентов за меньшую стоимость.
Команда GuaranaCam задействовала технологии машинного обучения для оценки эффективности размещения товаров и рекламных материалов в офлайне. Система работает на базе облака Microsoft Azure и анализирует покупательское поведение по камерам видеонаблюдения. Владельцы бизнеса получают отчет о состоянии торговли в режиме реального времени. Проект уже применяется в торговом центре «Мега Белая Дача».
На этом успешные отечественные примеры использования нейросетей в бизнесе не заканчиваются. Компания LogistiX, экспериментирующая с технологиями создания искусственного интеллекта с 2006 года, разработала систему оптимизации работы склада. В ее основе лежит обучающаяся нейронная сеть, которая анализирует полученные с фитнес-трекеров данные о работниках и перераспределяет между ними нагрузку. Теперь команда учит нейросети различать брак.
Холдинг «Белфингрупп» пошел еще дальше. Его «дочка» BFG-soft создала облачную платформу BFG-IS, позволяющую управлять предприятием с помощью его виртуальной модели. Последняя строится автоматически на основании собранных системой данных о производстве и не только показывает, как лучше организовать процессы с учетом заданных целей, но и прогнозирует последствия любых изменений — от замены оборудования до введения дополнительных смен. В конце 2016 года Фонд развития интернет-инициатив решил вложить в компанию 125 миллионов рублей.
Рекрутинг и управление персоналом
Российский агрегатор рекрутеров Stafory заканчивает обучение рекуррентной нейронной сети, способной не только давать односложные ответы на вопросы кандидатов, но и вести с ними полноценный разговор о заинтересовавшей вакансии. А команда портала SuperJob тестирует сервис, который предсказывает, какие из сотен однотипных резюме окажутся востребованы конкретным работодателем.
Транспорт
Российский разработчик интеллектуальных систем Cognitive Technologies применяет нейронные сети для распознавания транспортных средств, пешеходов, дорожных знаков, светофоров и других объектов, попадающих в кадр. Также компания собирает данные для обучения нейросети для беспилотного автомобиля. Речь идет о десятках тысяч эпизодов, описывающих реакцию водителей на те или иные критические ситуации на дорогах. В итоге система должна сформулировать оптимальные сценарии поведения авторобота. Такие же технологии применяются и для создания умного сельскохозяйственного транспорта.
Кроме того, нейронные сети могут использоваться в сфере транспорта и другим образом. Летом 2016 года «Яндекс» добавил в принадлежащую ему доску объявлений «Авто.ру» функцию автоматического определения модели машины по ее фото. На тот момент система знала 100 марок.
Психология и безопасность
Российский стартап NTechLab, обошедший Google в международном конкурсе алгоритмов распознавания лиц The MegaFace Benchmark, использовал технологии машинного обучения в приложении FindFace. Оно позволяет найти человека в социальных сетях по фотографии. Зачастую пользователи обращаются к сервису для выявления фейков, но он может быть полезен и правоохранителям. С его помощью уже установили личность нескольких преступников, в том числе захватчика Ситибанка в Москве. Бизнес-версия FindFace.Pro предоставляется компаниям, заинтересованным в идентификации клиентов. Сейчас систему доучивают определять пол, возраст и эмоции окружающих, что может быть полезно не только при общении с клиентами, но и при управлении персоналом.
Аналогичным образом нейросети применяются и еще одной российской компанией — VisionLabs. Она использует технологии распознавания лиц для обеспечения безопасности в банках и формирования специальных предложений для наиболее лояльных клиентов различных розничных точек.
В схожем направлении работает стартап «Эмотиан». Он дорабатывает систему определения эмоционального состояния городов. Пока нейросеть вычисляет наиболее счастливые районы по публикациям в социальных сетях, однако в дальнейшем компания собирается учитывать и биометрические данные с камер.
Медиа и творчество
Одним из основных игроков на российском рынке нейронных сетей является «Яндекс». Компания использует машинное обучение не только в своих поисковых сервисах, но и в других продуктах. В 2015 году она запустила рекомендательную систему «Дзен», которая формирует ленту из новостей, статей, фотографий и видео, основываясь на интересах конкретного пользователя. Чем чаще он обращается к отобранным алгоритмом материалам, тем точнее нейросеть определяет, что еще ему может понравиться.
Кроме того, «Яндекс» экспериментирует и с творчеством. Сотрудники компании уже успели применить нейросетевой подход к поэзии, а затем и к музыке.
В результате появился альбом «404» несуществующей группы «Нейронная оборона». Все треки на нем записаны в стиле Егора Летова.
Хобби и спорт
Нейронные сети нашли применение и в сугубо нишевых проектах. В начале 2017 года в России запустили сервис для рыбаков Deep.Fish. В ближайшее время уже представленный в нем каталог наиболее популярных мест для рыбалки дополнится инструментами прогнозирования клева и распознания пойманных рыб за счет технологий искусственного интеллекта. Инвестиции основателей в компанию составили миллион долларов.
В свою очередь, создатели проекта Iceberg.Hockey использовали машинное обучение для обработки видео с хоккейных матчей. Их система позволяет спрогнозировать поведение спортсменов на основании более чем 500 параметров, рассчитываемых в режиме реального времени.
Общение
Отечественная команда DeepHackLab использовала глубокие нейронные сети, чтобы автоматизировать обработку запросов, поступающих в службы поддержки различных компаний. Система отличается высокой точностью понимания смысла вопросов пользователей и может применяться как для подготовки подсказок операторам, так и для их полной замены.
Аналогичные технологии применяются в пермском роботе Promobot. Благодаря системе Cognitive Engine андроид способен запоминать собеседников и поддерживать с ними разговоры на русском, английском, немецком и китайском языках. Полученные им ответы служат основой для обучения нейросети.
В свою очередь, создатели ресторанного бота Luka, быстро обросшего новыми функциями, решили применить имеющиеся у них наработки для запуска другого проекта — Replika. Это мобильное приложение, которое позволяет создать собственную цифровую копию. По мере общения с пользователем реплика запоминает факты из его биографии и перенимает его манеры, чтобы однажды продолжить его жизнь после смерти. Запуск iOS-версии сервиса намечен на первый квартал 2017 года. В нем предварительно зарегистрировались более 150 тысяч человек.
обложка: фрагмент промовидео RYNKL