Официальное название проекта — FEDOR (Final Experimental Demonstration Object Research). Рабочим названием в самом начале был «Аватар». Имя проекту дал Дмитрий Рогозин.
Этот проект реализует Фонд перспективных исследований совместно с НПО «Андроидная техника» по заказу МЧС России. Цель — разработать систему комбинированного управления антропоморфным робототехническим комплексом при выполнении спасательных операций.
НПО — не новичок в робототехнике. Существует эта организация уже 13 лет, за время своей работы НПО выпустило 50 роботов для частных компаний и государственных организаций. Среди заказчиков и партнеров — Минпромторг, ФСБ, МЧС, Министерство здравоохранения, Центр подготовки космонавтов им. Гагарина, Российское атомное сообщество, ракетно-космическая корпорация (РКК) «Энергия» и другие. НПО получает деньги как от частных, так и государственных заказчиков. Годовой бюджет составляет около 500 млн руб.
Работы по созданию системы начались в 2014 году и продолжаются до сих пор. Впервые публиковать информацию о Федоре стали в 2016 году.
Физически центр разработки располагается в Магнитогорске, в деловом центре «Альфа Центр» и нескольких лабораториях в том же городе.
Федор создается с нуля?
Не совсем. Основа — предыдущие модели робототехнических устройств, созданных НПО «Андроидная техника» по заказу Роскосмоса. Речь идет о моделях SAR-400 и SAR-401. Роскосмосу был нужен электронно-механический помощник для космонавтов, работающих на МКС.
Разработка проводится в два этапа. Первый — опытно конструкторские работы. На этом этапе разработчики создали пять технологических макетов для отработки программного обеспечения.
Два макета выглядели как полноценные роботы, а у трех остальных не хватало нескольких элементов — например, верхней или нижней части. В самом начале специалисты хотели использовать гидравлический привод, но оказалось, что цена слишком высокая, а надежность такой системы низкая. Поэтому от гидравлики отказались в пользу электропривода.
Сколько стоит проект?
Разработчики потратили около 300 млн рублей, но до завершения проекта еще далеко, так что это не полная сумма. Какие характеристики у робота?
Его рост — 180 см,
Вес — около 160 кг.
Мощность — 13,5 кВт (20 лошадиных сил). Робот состоит из 15 тысяч деталей. Программное обеспечение — операционная система реального времени, разработанная в Санкт-Петербурге на базе Linux. Работа в автономном режиме — 1 час, заряжается он через обычную розетку.
Робот — полностью отечественная разработка?
Точной информации о процентном соотношении отечественных и иностранных компонентов для всех прототипов робота нет. Тем не менее, известно, что для одного из них 50% деталей изготавливались в России, остальные — по спецзаказу собираются в Японии, Германии, США, Швейцарии и других странах. Программное обеспечение для робота разработано на базе Linux, так что его тоже сложно назвать исключительно российским.
90% электронных компонентов для робота производят в России разные организации, включая предприятия «Абрис-Технолоджи» и Silicium из Санкт-Петербурга.
Федором управляет оператор?
Первые прототипы работали исключительно под управлением оператора. Сейчас стало известно, что Федор уже научился действовать автономно, причем это самообучающаяся система. Информацию об окружающей среде и ее параметрах робот получает от самых разных датчиков:
двух камер;
тепловизора;
микрофона;
GPS и ГЛОНАСС;
15 дальномерных лазеров;
специальной системы для определения положения своего тела.
Федор умеет идентифицировать типовые объекты и инструменты и различает препятствия. Все это он сводит в трехмерную схему окружающей обстановки. На данный момент он умеет открывать дверь, использовать дрель, стрелять из пистолета, водить автомобиль и квадроцикл в автономном режиме. В будущем разработчики планируют обучить робота самостоятельно определять задачу. Например, если Федор увидит пострадавшего во время землетрясения, чья нога придавлена бетонным блоком, он «поймет», что для освобождения человека нужно убрать блок и отнести пострадавшего в безопасное место.
Кроме того, робот может действовать и в копирующем режиме. В этом случае оператор надевает экзоскелет, повторяющий структурные особенности Федора. Ну а робот копирует движения оператора. Можно посмотреть как Федор стреляет. Насколько можно понять, стрельба с двух рук выполнялась под контролем оператора.
Оператор может находиться от робота в тысячах километров, передача телеметрии осуществляется по спутниковой связи. Управлять роботом оператор может и в супервизорном режиме — не задавая движения при помощи экзоскелета, а показывать, что нужно сделать, на экране.
Разработчики говорят, что оператором может быть врач, военный, спасатель или любой другой специалист. Так что робот при необходимости может выполнять самые разные функции, от изучения зараженного радиацией полигона до проведения строительных работ.
По словам разработчиков, электронно-механическая база Федора ничем не уступает ATLAS, которого разрабатывает агентство DARPA. Но программный комплекс не такой совершенный. В частности, потому, что с ATLAS работают тысячи программистов, а с Федором — только те, кто имеет непосредственное отношение к проекту.
Зачем робота научили стрелять?
Разработчики утверждают, что это сделано лишь для демонстрации возможностей системы. Для решения таких задач, как прицеливание, выбор цели, умение снизить отдачу и т.п. нужно разработать специализированные алгоритмы, а это многомесячная, если не многолетняя работа. Да и Федор — не военная разработка.
Где Фёдора планируют использовать?
Главная сфера его применения — спасение жизней. Он будет работать на территориях и в зданиях с химическим и радиационным заражением. Сейчас Фонд перспективных исследований вместе с Росатомом создает прототипы, которые смогут заниматься сортировкой радиоактивных отходов. У Федора — хорошая мониторика «рук», так что он в состоянии помогать людям на производстве. Возможно, его научат помогать собирать других роботов.
Хорош он может быть и в саперном деле, в медицине (уже сейчас робот умеет делать уколы и накладывать шины). К сожалению, более-менее тонкие работы выполняются лишь при управлении оператора.
В 2019 году Федора отправляли в полет на космическом корабле «Федерация». Правда, для этого разработчики создали новую версию системы, которая соответствовала всем требованиям ракетно-космической отрасли. Более надежная электроника, емкий аккумулятор, меньшие размеры — все это было реализовано к моменту отправки в 2019 году.
Насколько близко мы подошли к созданию терминатора?
Хладнокровная машина, не знающая печали и жалости. Неумолимо и прямолинейно выполняющая поставленную ей задачу до конца. Таким запомнился зрителю терминатор из одноимённого фильма. Согласно его сценарию, бездушная машина прибыла к нам из будущего. И вот, именно сейчас мы подходим к тому времени, когда в мире из фильма машины берут верх над людьми.
Если обратить свое внимание на техническую сторону этого робота, то то, что удивляло в 1984 году, сейчас кажется чем-то знакомым, и уже маячит на горизонте. На каких же технологиях эти роботы построены там, глубоко внутри своего стального черепа?
Давайте всего на один день предположим, что Джеймс Кэмерон уже в 1984 году что-то знал и снял не фантастический фильм, а попытался послать нам предупреждение. Что если режиссёр фильма попробовал нас оградить от того, к чему может привести злоупотребление новыми технологиями и насколько мы смогли с их помощью приблизиться к созданию таких машин?
Я думаю, что превращение ИИ в оружие — самая большая опасность. Думаю, что мы столкнёмся с ИИ, эквивалентным гонке ядерных вооружений, и если его не создадим мы, то его обязательно создадут другие, и тогда ситуация обострится. Вы можете представить себе ИИ на театре военных действий, где компьютеры сражаются на скорости, за которой больше не успевают люди, и у вас нет возможности деэскалации.
Джеймс Кэмерон
«Превращение ИИ в оружие — самая большая опасность»
Кинорежиссёр Джеймс Кэмерон согласен с экспертами в том, что достижения в области искусственного интеллекта представляют серьёзную опасность для человечества.
Кэмерон, известный по фильмам «Титаник» и «Аватар», был режиссёром и соавтором сценария научно-фантастического боевика 1984 года «Терминатор» о киборге-убийце. На вопрос о том, что он думает по поводу опасений специалистов на тему темпов развития искусственного интеллекта, Кэмерон ответил так: «Я полностью разделяю их озабоченность. Я предупреждал вас, ребята, ещё в 1984 году, а вы не слушали».
Кэмерон сказал, что сегодня важно оценить, кто разрабатывает технологию, и делается ли это для получения выгоды или же для защиты.
Использование ИИ и необходимость в его регулировании также были предметом разногласий в продолжающихся забастовках писателей и актёров в Соединённых Штатах. Актёры требуют защиту от того, чтобы их образы не использовались технологией ИИ без их согласия, а сценаристы выступают против использования ИИ для написания сценариев.
Предлагаю сегодня, провести глубокий и вдумчивый анализ механизмов работы терминатора и вместе найти ответ на этот животрепещущий вопрос.
Нейросети приближают нас к будущему
Люди пытались научить компьютеры разговаривать сразу после их появления. Сейчас даже Алиса, которая звучит почти из каждого телефона, имеет голос, неотличимый от голоса человека.
Все же, для работы умной системы робота одного голоса мало. Надо, чтобы был источник текста, который посылал бы ему то, что нужно произнести. С этой задачей уже справляются нейросети. Такие нейросети, как, например, ChatGPT, YandexGPT, RuGPT и LLAMA поставляют голосовому движку ответы на ваши вопросы, тексты и сказки, ну а голосовой движок, в свою очередь, их озвучивает.
Нейронные сети очень быстро развиваются и, в целом, уже сейчас можно сказать, что те из них, что работают сегодня, своим поведением очень похожи на робота, который сильно похож на человека. C одной стороны, они пишут простые и незамысловатые тексты, не понимают шуток и не могут шутить сами, скудны на эмоции и не всегда правильно отвечают на ваши вопросы, а текст, который они генерируют, такой же сухой и прямолинейный, как и речь этого робота. Ну а с другой... С другой, они пугают своей способностью узнавать ваш голос, распознавать лица, собирать информацию о людях, решать задачи по математике и физике, и даже создавать музыкальные произведения.
Например, последняя версия ChatGPT уже может распознавать образы на изображениях и описывать их. Так распознаёт образы Copilot, бывший Бинг, который использует последнюю версию ChatGPT.
Мир глазами киборга
Давайте теперь посмотрим на мир глазами терминатора. Мы уже прекрасно знаем, как он выглядит. Красный цвет символизирует смещение воспринимаемого роботом диапазона света в инфракрасную зону. В остальном же, интерфейс представлен командной строкой, без графической оболочки – GUI, как, например, в Unix или командная строка в Windows.
На этом интерфейсе выведены командные строки, расположенные в разных частях экрана, каждая из которых представляет собственную часть результата обработки входящей информации. Он похож на текстовый интерфейс современных нейросетей, которые сегодня работают на стационарном компьютере, производя вычисления на процессоре или видеокарте, и без доступа к сети.
Такие текстовые ответы мы все прекрасно видели, это строки текста из результатов, которые выдаёт нейросеть, наподобие Алисы, после обработки ваших промтов. Популярная нейросеть Stable Diffusion тоже работает на дискретной видеокарте внутри компьютера. Перед вами пример интерфейса ещё одной большой языковой модели (Large Language Model, LLM), LLaMA, уже работающей автономно, с использованием ресурсов компьютера.
Посмотрите, система киборга работает точно так же, как и современные языковые модели, через текст. Изображения с камер, расположенных на месте глаз, распознаются и преобразуются в текстовое описание. Например, такая LLM как ChatGPT 4 для того, чтобы объяснить объекты, которые содержатся на фотографиях, делает то же самое.
Отсюда можно предположить, что в ОС Терминатора параллельно работают сразу несколько нейросетей: первая обрабатывает и выводит сообщения о состоянии системы, вторая обрабатывает визуальную информацию, третья LLM отвечает за общение с людьми и т. д. Как шестерёнки в сложном механизме, каждая их них обрабатывает свою порцию входящей информации. Ответы от каждой из отдельных нейросетей выводятся каждый в своем окне, и главная нейросеть считывает их все одновременно, анализирует и принимает решение о дальнейших действиях.
Большинству сегодняшних LLM для работы нужен доступ в Интернет. В то же время, в 1984 году Интернета, каким мы его знаем сейчас, еще не существовало, и в его голове должен иметься хороший набор из таких нейросетей, которые работают автономно.
Нейросети для разных целей
Чтобы понять, какие нейросети могли использоваться у него во встроенном компьютере, давайте посмотрим на полный список хитростей, к которым прибегает наш герой в кино.
Надо сразу сказать, что робот антропоморфный, то есть, он повторяет строение человека. Это надо разобрать подробнее. В фильме робот из будущего также умеет: стрелять – иногда прямо с двух рук – и почти никогда не промахивается, подделывать голос, заводить машину без ключа, управлять транспортными средствами, оценивать окружающую обстановку и просчитывать дальнейшее развитие событий, ставить диагноз и выполнять простые хирургические операции.
Может быть, именно ChatGPT лежит в основе сознания робота, которое обретается в микросхемах его стального черепа? Или, возможно, именно совмещение разных нейросетей таким образом и приведёт к созданию главной из них, способной обрабатывать информацию со скоростью мозга человека. Сам Арнольд Шварцнеггер сообщает нам примерно об этом же. Он предупреждает об опасности появления терминаторов в действительности.
Подделка голоса
Для подделки голоса сейчас существует множество нейросетей. Одна из них – Heygen, она позволяет не только создавать видео, но и озвучивать его голосом, скопированным с персонажа. Эта нейросеть очень быстро позволит скопировать голос, услышанный в разговоре, и воспроизвести им заданный текст. Инструменты терминатора вполне могут включать в себя ее аналог, работающий автономно, например, на графическом чипе.
Умение обращаться с техническими устройствами
В фильме нам показывают, как ловко терминатор заводит различные машины. И он уже умеет ими управлять. Сейчас разработкой автопилотов занимаются сразу несколько компаний, и все из них применяют новые нейросети. Среди них и Тесла, и даже наш Яндекс. Одну из самых последних нейросетей для управления машиной применяет дочерняя компания Сбербанка Cognitive Pilot.
Когда Шварцнеггер собрался угнать грузовик в первой части, посмотрите как нейросеть сразу сориентировала его в управлении, приведя схему внутреннего устройства автомобиля, исходя из модели машины.
Модель машины сейчас без проблем может распознать ChatGPT, он же может распознать и такую схему, если видит ее от другого источника, выделить из нее важные при управлении автомобилем детали и передать главной нейросети.
Знание медицины
Все помнят, как в фильме терминатор стреляет по людям, но, следуя просьбе Джона Коннора, никого не убивает?
Для этого он должен уметь ставить диагнозы людям по их телесным повреждениям. Сегодня мы видим, как именно такие нейросети уже сейчас активно внедряются в российской медицине.
Наверное, 12 минут на приём в российских поликлиниках выделили не просто так, а с учётом перспектив для нейросетей (Наверное не беря в расчет БАБУШКУ которая будет сидеть час и рассказывать о мировых проблемах и прочих мучающих её вопросах и проблемах). Рассчитывая, что в скором будущем на приёме вас будет встречать не человек, а нейронная сеть, ведь она будет работать в несколько раз быстрее.
Прогнозирование событий
Что касается предсказания развития событий в текущей ситуации, то ChatGPT это уже вполне себе научился делать. Он разбирает фотографию на составные части, переводит её в текст, и далее его LLM по тексту определяет, что будет происходить дальше. По сети расходятся подобные примеры, где он рассматривает изображения с точки зрения физики и говорит, что случится вследствие действий, происходящих на фотографии.
Невероятно, насколько близко Джеймс Кэмерон был от истины! Послушайте самого терминатора из второй части, время 1:05.
– Can you learn stuff shich you haven't been programmed with so you can be more human? – My CPU is neural net processor, a learning computer. The more contact I have with humans the more I learn
Джон Коннор: "Можешь ли ты учиться тому, чему тебя не запрограммировали? Стать более человечным?"
Терминатор: "Мой CPU – это нейросетевой процессор, обучаемый компьютер. Чем больше я общаюсь с людьми, тем больше я могу выучить."
Если Джеймс Кэмерон мог предположить ещё в таком далёком от нас 1991 году, то как не прислушаться к его предупреждению?
Стрельба с двух рук
Что еще никто не в мире не пробовал – так это дать в руки двуногому роботу оружие. Никто, кроме одной фирмы, и вы прекрасно знаете, где она находится. А зовут их робота очень просто – Фёдор.
Согласно заверениям его конструктора, "Фёдор умеет говорить и распознавать речь, ходить, подниматься по лестницам, ориентироваться в пространстве с помощью поворотов головы, преодолевать полосу препятствий, управлять автомобилем и квадроциклом и даже ползать на четвереньках. Благодаря хорошей моторике рук, он может работать с различными инструментами, которыми пользуются сотрудники МЧС для спасения людей. Также робот умеет накладывать шины, делать уколы, а ещё помогать на производстве: собирать других роботов."
Кстати, именно наш Фёдор сейчас является одним из немногих роботов, которые управляют машиной своими руками-манипуляторами, а не только через электронные интерфейсы.
Как мы видим, все действия железного злодея сейчас могут выполнить нейросети. Для этого им сейчас требуется много времени и ресурсов, но сейчас идет работа над их энергоэффективностью и повышением быстродействия. Не хватает только той нейронной сети, которая быстро обрабатывает выводы от всех этих нейросетей, выдающих результат обработки своей порции информации.
Физическое тело
Для передвижения и участия в повседневной людской жизни терминатор использует тело, которое умеет ходить, работать руками и, по своим параметрам, мало чем отличается от человека. Он антропоморфный, их ещё называют гуманоидными, человекоподобными или андроидами. С точки зрения производства, это одни их самых сложных роботов.
В сценах, где робот двигается после повреждений защитного кожного покрова, отчётливо слышен звук сервомоторов, как в современных механизмах. То есть, он построен на вполне себе современной элементной базе.
Конечно же, мы все знаем, что сейчас самый совершенный из человекоподобных роботов – по имени Атлас производства Boston Dynamics.
Его конкуренты за звание самого подвижного робота сегодня – это роботы Agility Robotics
и китайский андроид Unitree H1.
Китайцы, как им это свойственно, подошли к производству Unitree H1 с размахом и клепают их пачками. Как ни странно, Unitree H1 можно купить на Алиэкспресс.
От Boston Dynamics и Agility не отстают и сами разработчики OpenAI с их Figure 1, и Tesla, однако ходят они несравненно хуже Атласа.
Надо сказать и о японцах. Их робот ASIMO фирмы Honda, когда-то первым пошедший на двух ногах, проиграл Атласу в конкурентной схватке и сошёл с дистанции. Проект по его разработке закрыли.
По степени взаимодействия с техникой из мира людей, сейчас, пожалуй, Фёдор стоит на первом месте. Атлас и китайский робот не могут ни стрелять, ни водить машину, а лишь перемещать коробки по полкам.
Однако Федор не может делать то самое главное, зачем его создавали в форме человека - ходить. С этим гораздо лучше справляются его иностранные аналоги. Возможно, из этих андроидов новая нейросеть и построит своё тело. Они уже сильно напоминают скелет человека.
С кожей и мимикой дальше всего продвинулась другая компания – Ameca. Они разработали покрытие, своими свойствами похожее на настоящую кожу, и научили робота выражать эмоции.
У одних из этих машин имеется отличный механизм хождения на двух ногах, у других – неплохие искусственные руки, другие могут управлять автомобилями или изменять выражение лица. Догадается ли какая-то из нейросетей в будущем собрать лучшие качества от каждого из них?
Процессор и код
Если вы посмотрите на все приведённые выше ходячие роботы, то можете заметить, что всех их объединяет одно – отсутствие полноценной головы. Мы с вами уже поняли, что нормальную голову им ещё не изобрели.
От использования всех возможностей современных нейросетей в одной голове нас отделяет размер серверов, необходимых для их работы. Например, для работы ChatGPT его создателем OpenAI построены целые дата-центры, к мощностям которых пользователи получают доступ по подписке. Такие вычислительные мощности требуют не только огромного количества электроники, но и потребляют невероятное количество электроэнергии, а также требуют отвода большого количества тепла – эффективной жидкостной системы охлаждения.
Для работы настолько сложной системы для работы с окружающей средой в реальном времени потребуется слаженная работа сразу нескольких нейросетей, соответственно, мощность будет сравнима с современным ЦОД.
Получается, что скомпоновать всю вычислительную мощность в один небольшой по размеру корпус смогут когда-то в будущем. Для работы настолько быстродействующей вычислительной системы, в голове терминатора, которая по размеру такая же, как и обычная, человеческая, должен находиться процессор, по быстродействию сравнимый с настоящим центром обработки данных какого-нибудь условного МТС. Этот процессор питается от источника энергии, рассчитанного, как утверждается, на 120 лет и столь энергоэффективный, что может охлаждаться жидкостной системой охлаждения, по размеру сравнимой с кровеносной системой человека. Поскольку терминатор – киборг, то почему бы кровеносной системе не гонять не холодную, а тёплую кровь, охлаждая её, как и у нас, от окружающей среды?
Возможно, что для этой цели удалось или перейти на сверхмалые техпроцессы, или произвести процессоры, собранные на новом материале, который способен ещё сильнее уменьшить техпроцесс. Уменьшить размеры микросхем поможет переход с обычного материала, который используется в их изготовлении – кремния, на другой, германий. Или же, пойти дальше и вовсе использовать новые материалы, например, графен. Можно пойти еще дальше и подумать, что это могли бы быть перспективные микросхемы с , а также фотонные процессоры.
Как выяснил один из программистов, код, выводимый на экран – это ассемблер MOS 6502. Соединение нового процессора и быстрого кода на одном из низкоуровневых языков программирования отлично скажется на быстродействии такой системы. Почему именно ассемблер, ведь на нём было бы так сложно написать столько кода? Как раз это и не сложно, потому что такую задачу можно будет поставить самой нейросети, которая и преобразует код.
Похоже, что сейчас самое время внять предупреждениям режиссера Терминатора. Для создания робота дело осталось за малым: наверное, нужно доработать существующие устройства. На роль главной нейросети, прототипом которой является Скайнет, вполне может подойти AGI, создаваемая ведущими разработчиками искусственного интеллекта. Возможно, что это именно то, что является недостающим компонентом для создания подобного разумного робота.
Как может развиваться сценарий появления терминаторов, подобных Т-101?
Фильм предупреждает нас о появлении суперфирмы Кибердайн Системс, которая и разработала терминаторов, и которую пытались уничтожить Сара Коннор со своим железным телохранителем. Кого нам стоит опасаться и от кого ждать неприятностей, кто больше всего подходит на роль Кибердайн сейчас? Станет ли ей Boston Dynamics, фабрика по производству ИИ-чипов, видеокарт, например, NVidia, квантовых компьютеров – наши или иностранные, Copilot, или же, Скайнет – это та фирма, которая сегодня производит робота Фёдора?
Совсем недавно мир облетела новость, что Agility Robotics создала фабрику по производству человекоподобных роботов. Её изюминка была в том, что, как утверждалось в новостных сюжетах, роботов на ней будут собирать сами же роботы.
Первые роботы Скайнета походили на людей, но их всё ещё можно было отличить. Тем не менее, они уже были вполне похожими на нас. Давайте подсчитаем, что в нашем времени отсутствует для создания терминаторов.
Сегодня для их появления все ещё не хватает: главной сверхбыстродействующей нейросети, маленького и сверхмощного, по сегодняшним меркам, процессора, источника питания с долгим временем работы и искусственной кожи. Однако их создание уже идёт семимильными шагами.
Возможно, что это кожа для роботов, разрабатываемая саудовскими учёными, источник питания на холодномразвивать у нас после развала науки в девяностых, и AGI, сверхпроницательный искусственный интеллект, к которому стремятся как OpenAI, так и Microsoft, и Google.
Предположим, что новая версия ChatGPT отрядом из нескольких роботов Atlas и Фёдор захватила фабрику Agility Robotics. На ней она во много раз преумножила себя, построив бесконечное число их копий. Целой армии будущих терминаторов уже не составит труда захватить производство реалистичной мимики Ameca.
Взяв за основу лучшее из своих тел – Атласа, после нескольких итераций по совершенствованию и усилению внутренних механизмов, он добавит к нему лучшие качества от каждой из других моделей двуногих роботов. В голову поместит автономные нейросети. На усиленный скелет Атласа он накинет искусственную кожу и улыбку Амеки, и уже получится машина, сильно похожая на человека.
Этот робот наденет чёрные очки, и только и ищи таких среди нас. Ну а если робот Фёдор поделится технологией управления автомобилями и некоторыми другими своими навыками, то их уже ничто не остановит на пути к захвату мира!
Человеческий мозг — восхитительное устройство. Он вдохновляет современных исследователей, которые создают искусственные нейроны, словно ученики скульптора, копирующие бюст Сократа. И результат тому — искусственная нейронная сеть (ИНС), одно из самых обсуждаемых явлений современности.
Почему нейронная, почему сеть
Глубокое понимание нейросетей предполагает, что вы в курсе понятий математическая функция, перцептрон и матрица весов. Мы же предлагаем поговорить про это явление на общечеловеческом языке, чтобы всем было понятно.
Искусственная нейронная сеть неспроста получила такое название, ссылаясь к работе нейронов головного мозга. Под нейросетью понимается система вычислительных единиц — искусственных нейронов, функционирующих подобно нейронам мозга живых существ. Как и биологические, искусственные нейроны получают и обрабатывают информацию, после чего передают ее дальше. Взаимодействуя друг с другом, нейроны решают сложные задачи.Среди них:
определение класса объекта,
выявление зависимостей и обобщение данных,
разделение полученных данных на группы на основе заданных признаков,
прогнозирование и т. д.
Нейронная сеть воспроизводит психические процессы, например, речь, распознавание образов, творческий выбор, мышление. Те области, которые еще вчера мыслились нами как возможности исключительно человеческого разума, становятся доступными искусственному интеллекту. Другое преимущество нейросетей перед традиционным ПО — возможность обучаться. Нейронные сети апгрейдятся на основе поступающих данных о мире людей, опыта и ошибок. И, надо сказать, они уже здорово эволюционировали.
Кому это выгодно
Термин «нейронная сеть» появился еще в 1943 году, но популярность эта технология обрела только в последние годы: посредством магазинов приложений стало распространяться ПО, созданное при помощи нейросетей, в колонках новостей запестрели заголовки о фантастических возможностях искусственного интеллекта. Сегодня нейронные сети используются во множестве сфер.
Нейросети для развлечений
Искусственными нейронными сетями сейчас пользуются люди, далекие от сложных математических моделей. Когда создатели ПО поняли, что нейросети — это как минимум весело, рынок приложений для смартфонов наводнился программами для работы с изображениями на основе искусственных нейронных сетей. ПО для обработки изображений (DeepDream, Prisma, Mlvch), «старения»,замены лиц на фотографиях и видео моментально стало вирусным. На самом деле, это весомое оружие в век соцсетей. Приложения типа знаменитого FaceApp могут не только позабавить — с ними можно здорово изменить внешность: нанести профессиональный мейкап, изменить волосы, скорректировать черты лица и даже добавить эмоции и мимику. Причем сейчас все это выглядит настолько натуралистично, что едва ли с первого взгляда заподозришь подвох.
Нейросети знают многое о человеческих лицах: по фотографии они могут определить возраст, пол, настроение, спрогнозировать, как лицо будет выглядеть в старости, анимировать статическое изображение, заставив Барака Обаму говорить то, что он не говорил, и оживить знаменитую Мону Лизу. По фотографии теперь можно найти человека, а китайские нейросети Megvii даже ищут собак по изображению носа. Причем ИНС работает не только с изображениями, но и со звуком. Массачусетский технологический институт недавно представил нейросеть (Speech2Face), определяющую национальность, пол и возраст человека по голосу.
Звучит впечатляюще и пугающе. Конечно, мы можем развлекаться, играя со своей фотографией, но только представьте, какой отнюдь не развлекательный потенциал у этой технологии. Уже сейчас можно найти любого человека по фото, создать реалистичные несуществующие лица для рекламы, модельного бизнеса или кино, заставить статичные изображения говорить и двигаться. Нетрудно представить, что нейросети скоро станут целой индустрией.
Нейросети на службе правительства
Нейросети способны помогать правоохранительным органам искать преступников, бороться с наркобизнесом и терроризмом, быстро находить в интернете противозаконный контент. Как и при использовании камер наблюдения, здесь есть свои сложности, ведь нейросети можно применять как для поиска пропавших детей в отряде «Лиза Алерт», так и для ужесточения контроля над населением.
Уже есть несколько примеров проектов внедрения искусственных нейронных сетей в России. В ГИБДД хотят научить нейросеть обнаруживать факт кражи автомобильных номеров. По изображению автомобиля ИНС сможет установить, соответствует ли машина своему номеру. Это поможет своевременно выявлять подделку или кражу номеров. Руководитель Департамента транспорта Москвы Максим Ликсутов подтвердил, что данная программа сейчас проходит тестирование.
Еще один пример возможностей нейросетей в распознавании изображений – эксперимент Департамента информационных технологий Москвы по созданию сервиса для передачи показаний приборов учета воды. Возможно, вскоре нам не придется вводить показания вручную, достаточно будет лишь сфотографировать свой счетчик, а нейросеть сама распознает цифры с изображения.
Нейросети и бизнес
Нейросети — настоящий подарок для бизнеса и горе для работников. Мы живем в эпоху, когда данные имеют огромную ценность. Поверьте, мировые корпорации уже проанализировали ваш профиль в соцсетях и предоставляют вам персонализированную рекламу. Только представьте, что способности сетей искусственных нейронов к анализу и обобщению можно использовать для получения еще большего массива знаний о потребителях. Например, в 2019 году компания McDonald’s наняла специалистов по разработке нейросетей для создания индивидуальной рекламы. Потом не удивляйтесь, откуда бизнес знает о том, какую еду, одежду и косметику вы предпочитаете.
В банковской сфере нейросети уже применяются для анализа кредитной истории клиентов и принятия решений о выдаче кредита. Так, в 2018 году «Сбербанк» уволил 14 тысяч сотрудников, которых заменила «Интеллектуальная система управления» на основе нейросети. Вместо людей рутинные операции теперь выполняет обучаемый искусственный интеллект. По словам Германа Грефа, подготовку исковых заявлений нейросети проводят лучше штатных юристов. Также финансисты обращаются к прогностическим способностям искусственного интеллекта для работы с плохо предсказуемыми биржевыми индексами.
Нейросети в сфере искусства
Что будет, если нейросеть познакомить с шедеврами мировой живописи и предложить написать картину? Будет новое произведение искусства. Предложите нейросети сочинения Баха, и она придумает похожую мелодию, книги Джоан Роулинг – она напишет книгу «Гарри Поттер и портрет того, что похоже на большую кучу золы». Книга «День, когда Компьютер написал роман», созданная японской нейросетью, даже получила премию HoshiShinichiLiteraryAward.
Специалисты компании OpenAI заявляют, что их программа по созданию текстов пишет любые тексты без человеческого вмешательства. Тексты за авторством нейросети не отличаются от тех, что написаны человеком. Однако в общественный доступ программа не попала, авторы опасаются, что ее будут использовать для создания фейк-ньюс.
В 2018 году на аукционе «Сотбис» за полмиллиона долларов был продан необыкновенный лот: «Эдмонд де Белами, из семьи де Белами. Состязательная нейронная сеть, печать на холсте, 2018. Подписана функцией потерь модели GAN чернилами издателем, из серии одиннадцати уникальных изображений, опубликованных Obvious Art, Париж, в оригинальной позолоченной деревянной раме». Робби Баррат, художник и программист, научил нейросети живописи настолько, что теперь она уходит с молотка как шедевры искусства.
Появились нейросети-композиторы и даже сценаристы. Уже снят короткометражный фильм по сценарию, написанному искусственным интеллектом («Sunspring») — вышло бессмысленно и беспощадно, как заправский артхаус. Тем временем нейросеть от Яндекса произвела на свет пьесу для симфонического оркестра с альтом и альбом «Нейронная оборона» в стиле группы «Гражданская оборона», а позже начала писать музыку в стиле известных исполнителей, например группы Nirvana. А нейросеть под названием Dadabots имеет свой канал на YouTube, где генерируется deathmetal музыка.
Удивительно, как органично нейросети вписались в мир современного искусства. Получим ли мы робота-Толстого через пару лет? Сможет ли нейросеть постигнуть все глубины человеческих проблем и чувств, чтобы творить не компиляцию, а настоящее искусство? Пока эти вопросы остаются открытыми.
Нейросети в медицине
Нейросети уже помогают улучшить качество диагностики различных заболеваний. Анализируя данные пациентов, искусственный интеллект способен выявлять риск развития сердечно-сосудистых заболеваний, об этом заявляют ученые Ноттингемского университета. По данным исследования, обученная нейросеть прогнозирует вероятность инсульта точнее, чем обычный врач по общепринятой шкале.
В открытом доступе появились даже приложения для диагностики на основе нейросетей, например SkinVision, которое работает с фотографиями родинок и определяет доброкачественность или злокачественность вашего невуса. Точность приложения — 83 %.
Скайнет готовится к атаке?
Все ли так оптимистично в применении нейросетей? Есть ли сценарии, при которых эта технология может нанести вред человечеству? Вот несколько самых актуальных проблем на сегодняшний день.
Фейки. Благодаря возможностям нейросетей появились программы для замены лиц и даже времени года на фото и видео. Как, например, нейросеть Nvidia на основе генеративной состязательной сети (GAN). Страшно представить, какие фото и видео можно получить, если применять подобные программы с целью создания убедительных фейков. Также нейросеть может на основе короткого фрагмента голоса создать синтетический голос, полностью идентичный оригиналу. Подделать чью-то речь? Легко. Подделать чью-то фотографию? Проще простого.
Трудности понимания. Когда процесс обучения нейросети завершается, человеку становится трудно понять, на каких основаниях она принимает решения. До сих пор непонятно, как у ИНС получилось обыграть лучшего игрока мира в Го. В этом смысле нейросеть — ящик Пандоры.
Оружие хакеров и мошенников. Считается, что хакеры могут использовать возможности нейросетей для преодоления систем антивирусной защиты и создания нового поколения вредоносных программ. Также нейросети соблазнительны для мошенников, например, искусственный интеллект, способный имитировать общение с живым человеком и заполучать доверие.
Безработица. Уже сейчас в сети можно встретить немало тестов а-ля «заменят ли роботы и нейросети вашу профессию». С одной стороны, забавно, с другой — пугающе. Нейросети способны оставить без работы дизайнеров, художников, моделей, копирайтеров, административных служащих среднего звена — и это только малый перечень того, где искусственный интеллект показывает сейчас вполне впечатляющие результаты.
Злой суперкомпьютер. Создание искусственного интеллекта, превышающего возможности человеческого разума чревато последствиями. Об этом уже создано множество научно-фантастических книг и фильмов. Может, конечно, все не будет так страшно и фантастично, как в фильме «Превосходство», но оценить риски заранее практически невозможно, а соблазн развивать нейросети все больше и больше слишком велик.
Выводы и прогнозы
Нейросети стремятся сделать мир более персонализированным: каждому из нас будут предлагаться блюда, музыка, фильмы и литература по вкусу. В сериалах мы сможем выбирать развитие сюжета, кстати, Netflix уже экспериментирует с такими решениями.
Так как искусственный интеллект уже начал выполнять человеческие задачи, миллионы квалифицированных специалистов могут постепенно лишаться рабочих мест. Работодателю будет проще запустить нейросеть, чем нанимать человека. По тонкому замечанию Антона Балакирева, руководителя интернет-портала Robo-sapiens.ru, нейросети не уходят на пенсию, не страдают алкоголизмом и депрессией. Идеальный работник.
Однако искусственный интеллект по-прежнему не может заменить человеческий мозг. В вопросах ответственности, норм морали и нравственности, а также критических систем безопасности нам не следует доверять нейросети безраздельно, пусть она и умнее нас. Доверяй, но проверяй.