На протяжении последних десяти лет искусственный интеллект переживал очередной подъем (далеко не первый, скажем прямо). Прежде всего, подъем в средствах массовой информации: нейронные сети, распознавание речи, победы алгоритмов в шахматах, го и еще много-много всего так и мелькало в заголовках. Наиболее впечатлительные журналисты продолжают предвещать, что сбудутся все прогнозы, взятые из фантастических рассказов середины прошлого века, с грядущей революцией искусственного интеллекта и угрозой для человечества. Другие продолжают представлять себя за рулем летающего беспилотного автомобиля на улицах футуристического города. Ни того, ни другого пока не произошло. А специалисты и разработчики тем временем, встречаясь на профессиональных конференциях, обсуждают реальные проблемы и достижения последних разработок.
Четыре года назад мы писали о том, что можно считать ИИ, а что им не является. Кажется, что ИИ недавно вошел в нашу повседневную жизнь вместе с голосовыми помощниками и чат-ботами. Но первый ажиотаж вокруг него возник очень давно, почти сразу после появления электронных компьютеров. Ведь теперь машина могла выполнять задачи, которые прежде решал только человек: математические расчеты, поиск в архиве, представление данных в виде графика. За эти долгие годы искусственный интеллект успел пережить несколько «зим» — периодов, когда технологический прогресс в этой области упирался в потолок, не показывал никаких прорывных результатов, терял интерес публики и, следовательно, финансирование. Стоит ли нам ждать следующую «весну»? Или «зиму»?
По словам руководителя направления разработок искусственного интеллекта компании Intel, Стефана Гилиха, ИИ — это всего лишь инструмент для анализа данных, и основная его задача — сделать этот анализ более качественным и быстрым, от простого описания данных до предсказывающей и предписывающей аналитики (когда алгоритм видит закономерности и принимает решение на основе полученной информации).
Мощности
Основные ограничения развития технологий ИИ были связаны с вычислительными мощностями и недостаточным количеством данных: нейронные сети нужно учить на релевантном материале и достаточно большой выборке. Мы преодолели этот рубеж. Удешевление компьютерных мощностей и увеличение количества классифицированных данных позволило воплотить в жизнь алгоритмы, многим из которых сорок и более лет. И с завидной частотой мы видим новости о том, как ИИ выявил, например, снижающие приспособленность мутации в ДНК коров. Это получилось сделать, потому что у нас уже есть большая база данных мутаций человеческой ДНК, а также быстро накапливаются сведения о составе геномов различных видов живых организмов. Точно так же получилось обучить систему отличать родинки от потенциального рака кожи (меланомы и карциномы). Для этого нужна была большая релевантная выборка размеченных данных, в данном случае — 130 тысяч фотографий более двух тысяч различных кожных заболеваний.
Проблему с вычислительными мощностями решают такие крупные компании, как Intel и IBM, создавая усовершенствованные процессоры и программные обеспечения, которые сокращают время обработки информации и справляются со все большими объемами данных.
На Intel EMEA AI DevCon 2019, которая рассчитана в основном на разработчиков и предпринимателей, внедряющих ИИ в свой бизнес, ни о какой приближающейся «зиме» речи не шло. А самыми интересными обычному наблюдателю «с улицы» показались бы, наверное, две темы.
Беспилотники
Первую из них проще сформулировать в виде вопроса: когда нам все же ожидать беспилотный транспорт на улицах города?
Напомним, что в начале января компания «Яндекс» начала демонстрационные поездки своего беспилотного автомобиля в Лас-Вегасе. А осенью компания запустила беспилотное такси на территории инновационного центра «Сколково».
Стефан Гилих и его коллеги очень осторожно отвечают на этот вопрос. Помимо большого количества неразрешенных законодательных и этических вопросов, а также необходимости адаптации всей инфраструктуры под новые технологии, вопрос о релевантном обучении нейронных сетей для беспилотного транспорта, кажется, еще остается открытым. Здесь не может быть права на ошибку и разной степени точности в принятии решений. Выборка должна быть правильной и исчерпывающей.
Если, например, мы учили нейросеть на фотографиях и видео только красных автомобилей, то она начнет причислять цвет к смыслоразличительному признаку целого класса автомобилей. И если появится белая машина, она ее не распознает. Но невозможно предусмотреть все события, которые могут произойти на дороге, и показать их ИИ. Поэтому нейросеть должна быть устойчивой и иметь возможность добавлять новые обучающие выборки и новую информацию, а также уметь классифицировать объекты, которые она еще ни разу не видела.
Как поведет себя машина, впервые столкнувшись с торнадо? Для этого нужны базовые сценарии, как вести себя машине в новых ситуациях. Преимущество состоит в том, что на базе одного автомобиля, который столкнулся с торнадо, можно обучить сразу все машины и заложить в них сценарий, что нужно им делать в такой ситуации.
Медицина
Вице-президент департамента цифровых разработок Siemens Healthcare Томас Фриз рассказал о разработках нового программного обеспечения для врачей-радиологов, которое соединяет ИИ и компьютерную томографию. Компания на протяжении многих лет производит медицинское диагностическое оборудование и специализируется на медицинской визуализации: МРТ, радиография, УЗИ и т.д.
Но с помощью радиологических методов очень сложно обследовать, например, область грудной клетки: на изображении видны все органы, врачи в основном рассматривают и оценивают снимок, исходя из первичных жалоб пациента, и вполне могут что-то пропустить. Фриз заявляет, что новый виртуальный помощник врачей AI-Rad Companion Chest CT с искусственным интеллектом на основе общей компьютерной томографии грудной клетки может различать и выделять отдельно каждый орган, отслеживать и обнаруживать потенциальные патологии и отклонения в каждом из них. При этом, в отличие от врача, чье внимание зачастую направлено на какой-то один орган, программа не отдает никому «предпочтений» и в равной степени обследует сердце, легкие, аорту, позвоночник и так далее.
Это приложение обучалось на широкой базе клинических данных, более 500 000 снимков. Предполагается, что оно поможет рентгенологам быстрее и точнее интерпретировать снимки, ставить более точный и полный диагноз с меньшей вероятностью ошибок и выявлять болезни на ранних стадиях.
По словам Томаса Фриза, ИИ не заменит специалистов, но избавит их от рутинных ежедневных задач и таким образом повысит их эффективность и качество диагностики.
Читайте также: Искусственный интеллект начал убивать на дорогах. Что произошло, кто виноват и стоит ли теперь бояться ИИ на колесах.
Еще одни разработки «на грани фантастики» ведутся в области создания трехмерных цифровых двойников разных органов, которые имитируют физиологические особенности конкретного пациента. Такая цифровая симуляция сможет позволить моделировать и отслеживать разные сценарии лечения и его последствия до фактического медикаментозного или хирургического вмешательства.
Первым органом с цифровым двойником стало сердце, его смоделировали на основе снимков МРТ и показателей ЭКГ. Такой двойник можно использовать, чтобы проверить, например, подойдет ли сердечная ресинхронизационная терапия конкретному пациенту, страдающему хронической сердечной недостаточностью. Для лечения используется кардиостимулятор, который ресинхронизирует биение сердца с помощью двух электродов, один из которых имплантирован в правый желудочек, а другой — в левый. Такое исследование провели кардиологи в Гейдельбергском университете. Они создали цифровой двойник сердца пациента, виртуально имплантировали электроды, которые посылали электрические импульсы. Если виртуальное сердце при этом работало исправно, то это могло означать, что терапия может быть успешной для пациента.
Пока это только разработки, и пройдет немало времени, прежде чем они воплотятся в жизнь и начнут применяться повсеместно.
Физика высоких энергий
Интересно было послушать не только про те области, которые непосредственно скажутся на нашей повседневной жизни. София Валлекорса из ЦЕРН (Европейской организации по ядерным исследованиям) рассказала про применение ИИ в физике высоких энергий.
Объем генерируемой информации в экспериментах по физике высоких энергий сложно себе представить. На Большом адронном коллайдере происходит примерно несколько десятков миллионов событий в секунду. Вспомним, что коллайдер разгоняет частицы (например, протоны) в вакуумной трубе до максимальной скорости и сталкивает их друг с другом. Столкновения порождают процессы, которые в обычных условиях зафиксировать невозможно, и помогают физикам изучать, как устроена наша материя, какие бывают частицы, какие у них параметры, как они взаимодействуют.
Читайте также: Ловись, частица новая. Чем занимается Большой адронный коллайдер после открытия бозона Хиггса.
Детекторы БАКа регистрируют все происходящие во время и после столкновения события. Чтобы сопоставить информацию (энергию, направление движения, распад вторичных частиц и так далее) и установить природу конкретного события, нужен сложный анализ. А обнаружить при этом нужное событие (с интересным эффектом, которое подтверждает или опровергает теории исследователей, или просто не походит ни на что, случавшееся ранее) — это задача совсем уж сложная.
Для этого ученые используют компьютерную симуляцию, в которую закладываются уже известные физические процессы и параметры. После чего эту информацию сравнивают с тем, что зарегистрировал детектор. Если в данных обнаруживаются какие-то большие расхождения, возможно, в этом месте есть что-то интересное. Чтобы создать такую симуляцию события, требуется около минуты. С учетом того, что количество событий измеряется миллионами в секунду, это очень сложная и ресурсозатратная процедура, которая не позволяет симулировать столько же данных, сколько собирает коллайдер.
Сейчас половина вычислительных мощностей грида (Worldwide LHC Computing Grid), который обрабатывает большие объемы данных, поступающие с БАК (170 вычислительных центров в 42 странах), тратятся на воспроизведение и обработку симуляций. К 2025 году БАК преобразуют: увеличится светимость, очень сильно возрастет объем данных, события станут более сложными. Для этого требуются новые мощности и новые методы. И сейчас внимание направлено на ИИ.
В частности, изучается применение генеративно-состязательной сети (GAN), алгоритма машинного обучения без участия человека. Он состоит из двух нейронных сетей, которые работают друг против друга. Одна сеть генерирует образцы данных, вторая, дискриминативная, пытается отличить оригинальные данные от подделанных генератором. Первая сеть пытается повысить процент ошибок второй, а вторая старается улучшить точность распознавания. Таким образом алгоритм самосовершенствуется.
Генеративно-состязательную сеть применили в прототипе электромагнитного калориметра, предназначенного для измерения энергии частиц, которые, попав в калориметр, рождают ливень вторичных частиц. Симуляция возникновения ливня электронов классическим методом Монте-Карло занимает 17 секунд, генеративно-состязательная сеть справляется с этим за 7 миллисекунд, выводя данные в 3D-изображения.
Это только небольшой пример, но разница во времени выглядит значительно. ЦЕРН проводит масштабные исследования в этом направлении, поскольку внедрение ИИ выглядит очень многообещающим.
***
Развитие ИИ затрагивает разные сферы нашей жизни, так же как и фундаментальные исследования окружающего мира. С какой скоростью все будет развиваться дальше, когда мы упремся в новые ограничения, и как их преодолеем, время покажет!
Анастасия Горшунова