Главная страница
Навигация по странице:

  • Послушные сети

  • Нейронная сеть. Нейронные сети не только очень точно распознают представленные и. Нейронные сети не только очень точно распознают представленные изображения они также создают новые с помощью своего богатого опыта. Это, конечно, выглядит как плод больного воображения


    Скачать 23.27 Kb.
    НазваниеНейронные сети не только очень точно распознают представленные изображения они также создают новые с помощью своего богатого опыта. Это, конечно, выглядит как плод больного воображения
    АнкорНейронная сеть
    Дата12.03.2023
    Размер23.27 Kb.
    Формат файлаdocx
    Имя файлаНейронные сети не только очень точно распознают представленные и.docx
    ТипДокументы
    #982252

    Нейронные сети не только очень точно распознают представленные изображения – они также создают новые с помощью своего богатого опыта. Это, конечно, выглядит как плод больного воображения.

    Распознавание предметов, которые вы видите, является одной из сильных сторон человеческого мозга. Мы можем пролистать стопку фотографий и, не задумываясь, сказать, что на них изображено: собака, торт, велосипед, чайник …

    Однако как мы достигаем этого наивысшего достижения, мы не знаем, как объяснить. Когда я вижу розу, в зрительной коре моего мозга активизируются определенные нейроны; в случае с тюльпаном - другие. Какие различия между обоими цветами вызывают различные реакции?

    Никто не любит, когда ему вживляют электроды в череп, чтобы ответить на этот вопрос с помощью экспериментов.

    Как насчет того, чтобы провести альтернативное исследование искусственного мозга? В последнее время компьютеры достигают уровня специалистов-людей в области распознавания изображений. С другой стороны, они сконструированы людьми во всех деталях, поэтому мы должны иметь возможность указать, как они работают. Но это неправда. Машинные системы распознавания изображений оказываются почти такими же непостижимыми, как и естественные.

    Речь идет о «глубоких нейронных сетях» (Спектр науки 9/2014, стр. 62). Они созданы по образцу структур реального мозга, и их способности не были запрограммированы, а были изучены на примерах. Теперь их знания об изображениях заключены в больших числовых таблицах, и ни один человек не может сразу что-то с ними сделать.

    Однако за последние два года нейронные сети раскрыли тот или иной взгляд на то, что у них внутри.

    Доступ осуществляется с помощью изображений, специально созданных для того, чтобы ввести сеть в заблуждение, сравнимых с вызывающими раздражение изображениями, которые заставляют наш мозг переключаться между двумя интерпретациями. Или можно управлять сетью, так сказать, в обратном направлении: вместо того, чтобы представлять ей изображение и запрашивать соответствующее понятие, вы вводите термин и позволяете сети создавать соответствующее изображение.

    Связанная с этим процедура вызвала огромный резонанс в последние месяцы. »Глубокий сон" обогащает изображение мотивами, которые сеть научилась распознавать. Вершина горы становится птичьим клювом, пуговица превращается в глаз, собаки-черепахи, ящерицы-рыбы и другие смешанные существа населяют ландшафт. Помимо непосредственной привлекательности, которая сделала эти фантастические изображения чрезвычайно популярными в Интернете, они служат (дергающим) зеркалом для »разума нейронной сети«. Они дают представление о том, как это работает, чего нельзя добиться прямым путем.

    Как и их естественные модели, нейроны искусственной нейронной сети представляют собой простые компоненты для обработки сигналов. Каждый из них находится в определенном состоянии активности. В естественном нейроне это частота, с которой он испускает импульсы, в имитационном компоненте это простое число. Тысячи и миллионы из них расположены в слоях, и информация постоянно перетекает из одного слоя в другой, более высокий. Каждый нейрон вычисляет свое собственное состояние активности на основе состояний определенных нейронов в слое под ним и передает его другим в непосредственно вышележащем слое.

    Послушные сети

    В нейронной сети распознавания изображений каждый нейрон самого нижнего («входного") слоя связан с пикселем (точкой изображения). Его активность равна яркости этого пикселя, и для цветных изображений для каждого пикселя есть три входных нейрона для значений красного, синего и зеленого цветов. Верхний слой состоит из «выходных нейронов», каждый из которых относится к одной из возможных категорий изображений («кошка», «велосипед», «роза», «тюльпан"). Промежуточные «скрытые" слои каким–то образом определяют характеристики, которые отличают категории друг от друга - если сеть изучила.

    В изначальном состоянии сеть подобна "Табула раса". Прежде чем он сможет что-либо обнаружить, его нужно обучить. Учитель – обычно компьютерная программа - представляет изображение на входной слой. В результате активность перемещается по сетке снизу-вверх, и какой-либо элемент выходного слоя в конечном итоге проявляет максимальную активность. Например, если это нейрон для »кошки«, но изображение показывает банан, то коррекция ошибок будет проходить через сетку сверху вниз, в результате чего активность неправильного выходного нейрона будет ослаблена, а активность правильного - усилена. При этом, например, не создаются новые связи между нейронами или не разрываются другие; функционирование каждого отдельного нейрона также остается неизменным. Скорее, меняются только »синаптические веса«. Эти цифры показывают, насколько активность нейрона, передающего сигнал, влияет на активность нейрона, принимающего сигнал. Как их изменить, определяет алгоритм, называемый »обратным распространением". Только этот процесс сделал искусственные нейронные сети практически применимой системой.

    Ранние реализации ограничивались скрытым слоем, потому что более многослойные (»более глубокие«) сети было трудно обучить. К настоящему времени эта проблема решена за счет более быстрого оборудования, улучшенных алгоритмов и более широкого ассортимента обучающих программ. Сети, состоящие из более чем десятка слоев, сегодня не представляют собой ничего особенного.

    Некоторые сети полностью подключены: каждый нейрон в одном слое получает информацию от всех нейронов этажом ниже. С другой стороны, в более новых сетях распознавания изображений нейрон реагирует только на то, что происходит в небольшой области под ним. Например, почти все слои имеют такую же правильную сетчатую структуру, как и самый нижний, и каждый нейрон обращает внимание только на квадрат размером 3 · 3 или 5 · 5 непосредственно под ним. Кроме того, диапазон синаптических весов одинаков для всех нейронов одного слоя. Это позволяет сетке одинаково реагировать на специальные объекты изображения, такие как края или круги, независимо от того, где они находятся на изображении.

    По сути, такой уровень работает как устройство, которое специалисты по обработке сообщений назвали бы фильтром, не зависящим от местоположения. Связанная с этим математическая операция называется сверткой (английский: свертка), а сети, построенные по этому принципу, называются «сверточными нейронными сетями« или сокращенно «конвнетами»

    Такая сеть как бы создана для того, чтобы найти иерархию структур, построенных друг на друге, в изображении. Нейроны самых нижних слоев чрезвычайно близоруки, но чем дальше информация перемещается вверх, тем более крупномасштабные особенности попадают в поле зрения. Таким образом, небольшие элементы, такие как глаза, рот и нос, объединяются, образуя целые лица.

    Из семи гор (песчаниковых образований на севере американского штата Нью–Мексико) нейронная сеть создает семь карликов - с собачьими головами. При этом он по-новому интерпретирует существующие черты оригинала, например, темные пятна в виде собачьих морд, и дополняет их, образуя законченные головы. Крутой склон в правой задней части изображения превращается в пологий ландшафт.

    Невинное облачное небо заполняется самыми невероятными существами в нейронной сети, которая была обучена в первую очередь изображениям животных. В конце концов, все животные вытягивают ноги вниз, и здания также имеют правильную ориентацию, с куполом, направленным вверх.

    Каждый год специалисты по распознаванию изображений соревнуются в соревнованиях ImageNet Large Scale Visual Recognition Challenge. Конкурсанты получат обучающий набор из 1,2 миллиона изображений, отсортированных по 1000 категориям. После этапа обучения программы должны поместить еще 100000 изображений в соответствующие категории, присвоенные людьми. Некоторые категории являются широкими ("ресторан«, »сарай«), другие - очень узкими (»Валлийский спрингер-спаниель«, "Стальной арочный мост").

    В период с 2012 по 2014 год конвнеты неизменно занимали первые места в конкурсе. Победителем 2014 года стала 22-слойная сеть с примерно 60 миллионами параметров под названием GoogLeNet, разработанная Кристианом Сегеди из Google совместно с восемью коллегами. Если Конвнет может распознать валлийского спрингер-спаниеля, что именно он узнал? В случае с человеком мы бы сказали, что он придумал термин или интеллектуальную модель того, как выглядит эта порода собак. Возможно, что-то подобное заложено в синаптических весах Google, но как мы собираемся найти это в 60 миллионах цифр?

    Например, позволяя информации течь против обычного направления - идея, которой, наряду с другими

    Группы Андреа Ведальди и Эндрю Зиссерман из Оксфордского университета и их коллеги занимаются этим. Они извлекают определенный нейрон верхнего слоя и ищут изображение, которое побуждает этот целевой нейрон к максимальной активности. Вычислительно метод аналогичен алгоритму обратного распространения, за исключением того, что он работает не с жестко заданным изображением и переменными синаптическими весами, а с точностью до наоборот. Результат этого поиска в некотором смысле воплощает в себе представление о сети как о банане или гантели (изображения стр. 86). Сравнительная репетиция с вашим собственным мозгом: какой образ возникает у вас в голове, когда вы думаете о банане?

    Математически говоря, это изменение потока информации может привести к однозначному результату. Классифицировать - значит объединить множество изображений; очевидно, что это отображение необратимо. Каждая категория представляет собой потенциально бесконечное количество подходящих для нее изображений. И сеть также не может показать нам типичный пример, потому что на самом деле она не запомнила ни одного изображения. Скорее, он представляет нам облачный и неполный набор функций, которые он счел полезными для этой конкретной классификации. Это черно-белые пятна для далматинца и округлые желтые участки для лимона; многие другие детали отсутствуют или недоступны человеческому глазу.

    Учимся на дефектах

    Мы многое узнали о когнитивных способностях человека из-за сбоев в работе: от серьезных сбоев, вызванных травмами или заболеваниями, до обычных обещаний или искажений восприятия. Две группы исследователей недавно применили эту идею к конвенциям – с удивительными результатами. Команда под руководством разработчика Google Кристиана Сегеди использовала метод оптимизации, чтобы найти изображения, которые вводят в заблуждение нейронную сеть: на изображении, которое сеть правильно распознает как школьный автобус, алгоритм изменяет несколько пикселей, настолько мало, что человеческий глаз не замечает разницы; но теперь сеть помещает изображение в другую категорию.

    Дополнительный эксперимент провели Ань Нгуен, Джейсон Йосински и Джефф Клюн из Университета Вайоминга. Они создали изображения, на которых человек видит только случайный шум, но сеть с большой уверенностью распознает гепарда или многоножку. Поэтому тем, кто сомневается в жизнеспособности нейронных сетей, не нужно слишком беспокоиться. Не каждое случайное небольшое изменение в нескольких пикселях вводит сетку в заблуждение – напротив, она может выдержать даже большое количество точек, расположенных близко друг к другу. Посредством обучения сеть разбивает пространство на части, относящиеся к различным категориям. Теперь мы знаем, что там все еще более запутанно, чем можно было бы предположить, учитывая размерность пространства, равную примерно миллиону. Потому что, очевидно, существует такая вещь, как »червоточины«, которые соединяют две области, которые на самом деле находятся далеко друг от друга.

    Инцепционизм – новое направление в искусстве

    В июне 2015 года сообщение в »Исследовательском блоге Google« внезапно привлекло внимание далеко за пределами круга профессионалов, в основном из-за прикрепленной галереи сюрреалистичных и странно привлекательных изображений (на фото выше).

    Новое направление искусства получило название "Начало" в честь научно-фантастического фильма »Начало« и, в частности, цитаты »Нам нужно идти глубже«. В более позднем сообщении в блоге был введен термин »глубокая мечта", который с тех пор стал популярным.

    Алгоритм, лежащий в основе изображений глубокого сна, был разработан Александром Мордвинцевым, инженером-программистом Google в Цюрихе. Он написал сообщение в блоге в соавторстве с Майком Тика, биохимиком, художником и специалистом по программному обеспечению из Google в Сиэтле, и стажером Кристофером Олахом из Торонто. Один из рецептов глубоких снов заключается в следующем: возьмите изображение в качестве шаблона и выберите специальный слой в нейронной сети, называемый »рабочим слоем«. Пусть процесс распознавания изображений идет снизу-вверх, вплоть до этого слоя. Затем примените алгоритм обратного распространения от рабочего слоя вниз, но изменяйте не синаптические веса, как обычно, а пиксели выбранного изображения, чтобы активность нейронов в рабочем слое возрастала, но не так, как это обычно делается, а так, чтобы пиксели выбранного изображения увеличивались так, чтобы активность нейронов в рабочем слое увеличивалась. Повторите это взаимодействие распознавания изображения (вверх) и изменения изображения (вниз) несколько раз. Кроме того, каждые несколько раундов добавляйте в процесс некоторую случайность, например, пересчитывая пиксели изображения по пикселям ближайшего окружения.

    По мере развития процесса на изображении появляются призрачные структуры, сначала слабые, а затем все более отчетливые. Черное пятно превращается в собачью морду, складка платья - в паутину, ветряные мельницы и маяки вырастают из голубого неба. Процесс является самоусиливающимся. Независимо от того, что сеть видела в элементах изображения в ходе обучения, она встраивает их там, где они могут немного уместиться. На следующей итерации они уже подойдут немного лучше, и так далее.

    Примечательно, что Мордвинцев, Тика и Ола не имели в виду никаких художественных намерений, когда изобретали свою технику, а скорее имели в виду обычную проблему редактирования изображений: компенсировать потерю резкости при увеличении. «Мы ожидали, что некоторые недостающие детали будут добавлены, когда мы максимизируем активность сети в случайно выбранных местах на слегка размытом изображении. И вот, это сработало", - написали они мне в ответ на мой запрос. Через несколько недель после публикации в блоге все трое выложили в сеть свою программу «Deep Dream» в свободном доступе. Вскоре многие другие начали экспериментировать с алгоритмом, и теперь коммерческие веб-сайты предлагают простые версии для любителей, которые не хотят углубляться в глубины программирования. За короткое время Интернет заполонило множество изображений; выполните поиск по ключевому слову «глубокие сновидения«.

    Сама программа содержит всего около 100 строк на языке программирования Python, но требует дополнительного программного обеспечения, некоторые из которых еще предстоит скомпилировать. Если все пойдет хорошо, на установку программного обеспечения уйдет несколько часов. Мне удалось это сделать только с третьей попытки, с использованием чистого жесткого диска.

    Свободные галлюцинации

    На самом деле, »сновидение« - неправильное слово для обозначения этого процесса. Настоящий сон возникает, когда зрительная система отключена. Но здесь он гиперактивен, и лучше называть его продукты галлюцинациями. В изображениях мы в некотором смысле являемся свидетелями попытки нейронной сети придать смысл тому, что мы видим. Обучение сформировало в нем ожидания относительно того, как компоненты реальности сочетаются друг с другом, и, соответственно, заполняет пробелы

    По многим изображениям видно, что сеть уделяет больше внимания мелкомасштабным взаимосвязям, чем общей картине. Лица - как у людей, так и у животных – имеют глаза, рот и нос в нужном месте вместе с окружающей средой, но часто голова находится не на том теле. Кроме того, сеть не умеет считать. У собак часто бывает более четырех ног или более одной головы. С другой стороны, все ноги каким-то образом стоят на земле. Все виды предметов стоят вертикально и опираются на основание, которое система может даже исправить, если потребуется, путем переинтерпретации отвесной стены (изображения см. Ниже). 87). Иногда изображение может даже иметь намек на перспективу: большая собака впереди, крошечное здание на горизонте.

    Самые дикие галлюцинации происходят из средних слоев общества. Но продукты более глубоких слоев не только привлекательны, но и рассказывают нам кое-что о механизмах восприятия. Зрительная кора млекопитающих обнаруживает края различной ориентации, яркости и градиентов, а также другие простые формы с большой контрастностью, такие как яркие точки в темноте, на начальных этапах обработки. Очень похожие мотивы можно найти в самых нижних слоях нейронной сети – и никто не запрограммировал их там. Скорее всего, сеть сама наложила их на себя во время тренировки. Возможно, техника глубокого сна - не более чем эфемерная мода. До сих пор она публиковалась только в виде программ и в сообщениях в блогах; научные работы еще впереди.

    При этом метод поднимает ряд интересных вопросов. Например, почему в образах сновидений преобладает определенное содержание? Повсеместное распространение голов собак может быть объяснено особенностями базы данных изображений ImageNet, из которой поступают данные об обучении; 120 из 1000 категорий относятся к породам собак. Птицы, пауки, великолепные здания, фонари и садовые беседки также являются обычным явлением, и глаза повсюду. Но где остальные домашние животные? Все учебные изображения взяты из Интернета, и, как сообщается, они полны кошек – настолько, что программа »Google Brain« объявила их второй по значимости категорией (после человеческих лиц) при обучении без учителя (Спектр науки 9/2014, стр. 62).

    Я также хотел бы знать, какие геометрические объекты в шаблоне изображения, скорее всего, будут использованы сеткой для украшения. Я хотел ответить на этот вопрос, представив ему простые конструкции, например, гальку на пляже. Но из этого мало что выходит. Последний крик - "управляемое сновидение« ("guided dreaming"): сеть обогащает одно изображение в соответствии со спецификациями другого изображения. Давайте не будем забывать: на самом деле соответствующее программное обеспечение предназначено не для создания сумасшедших изображений, а для обнаружения и классификации обычных. И она делает это довольно хорошо. Двуглавые собаки и пауки в голубом небе, очевидно, являются побочными продуктами этой работы. Просто интересно, почему.


    написать администратору сайта