Путеводитель по ключевым документам GAN для занятых ботаников.

вступление

Не волнуйтесь, когда вас засыпают таким количеством статей о генерирующих состязательных сетях (GAN). По правде говоря, чтение небольшого фрагмента уже может дать вам хорошее представление о предметной области (если вы не хотите углубляться). Здесь я выбрал ключевые статьи GAN на основе количества цитирований в Google Scholar.

Я также составил список хорошо написанных статей о GAN, которые вы увидите в конце этого поста.

Как заставить эту статью работать на вас

Все статьи ссылаются на nurture.ai. Нажмите на сердечко в правом верхнем углу, чтобы сохранить бумагу для последующего чтения.

Краткий обзор GAN

Сети GAN были впервые представлены Яном Гудфеллоу в 2014 году и вызвали ажиотаж в исследовательском сообществе. Крис Олах прекрасно описал GAN в своем сообщении в Twitter:

Дорожная карта чтения GAN

Начните свое путешествие по чтению статей с первой статьи о GAN:

Генеративные состязательные сети (2014 г.) [3021 цитата]

Еще один хороший способ начать работу - это обзорные статьи, в которых резюмируются границы исследований и разработки GAN. Вот два:

Учебное пособие NIPS 2016: Генеративные состязательные сети (2016) [194 цитаты]

Что может быть лучше, чем прочитать объяснение о GAN от самого создателя GAN? Мне особенно нравится подход Саймона Синека «Начни с почему», где статья начинается с обсуждения того, почему генеративное моделирование является темой, заслуживающей изучения.

Генеративные состязательные сети: обзор (2017) [13 цитат]

Объяснение архитектур GAN, методик обучения и нерешенных задач. Этот документ изначально предназначен для сообщества обработки сигналов, но легко понятен широкой аудитории. Рекомендуем к прочтению для тех, кто хочет иметь полное представление о GAN.

GAN создают

GAN - это генеративные модели; они будут пытаться создать то, чем вы их кормите. Это означает, что GAN должны хорошо понимать свои входные данные (или, более конкретно, распределение входных значений). Цитата, которая хорошо перекликается с этим, принадлежит Ричарду Фейнману:

То, что не могу создать, не понимаю.

Такое понимание является формой обучения без учителя, которое высоко ценится ведущими исследователями, поскольку оно больше похоже на то, как мы учимся. Использование GAN в обучении без учителя впервые было обсуждено в экстракторе функций DCGAN, который можно найти в этой статье:

Неконтролируемое репрезентативное обучение с глубокими сверточными порождающими состязательными сетями (2015) [1459 цитат]

Другие статьи, которые используют GAN в задачах неконтролируемого обучения:

InfoGAN: обучение интерпретируемым представлениям с помощью информации, максимизирующей генеративные состязательные сети (2016 г.) »[374 цитаты]

InfoGAN изучает разрозненные представления совершенно неконтролируемым образом. Например, он отделяет стили письма от числовых фигур в наборе данных MNIST; он также определяет прически, наличие очков и эмоции знаменитостей.

Stacked Generative Adversarial Networks (2017) [207 цитат]

(Извлечено из введения) В этой статье мы предлагаем генеративную модель под названием Stacked Generative Adversarial Networks (SGAN). Наша модель состоит из нисходящего стека GAN, каждая из которых обучена генерировать «правдоподобные» представления нижнего уровня, обусловленные представлениями более высокого уровня. Подобно дискриминатору изображений в исходной модели GAN, которая обучена отличать «поддельные» изображения от «реальных», мы вводим набор дискриминаторов представлений, которые обучены отличать «поддельные» представления от «реальных».

StackGAN: синтез текста в фотореалистичное изображение с помощью составных генеративных враждебных сетей [79 цитат]

В этой статье также используется многослойный подход к созданию изображений. Улучшение здесь состоит в том, что используемая архитектура проще и позволяет получать изображения 256 × 256 с фотореалистичными деталями (по сравнению с 32 × 32 в предыдущей статье).

Генеративный состязательный синтез текста в изображение (2016) [352 цитаты]

Создает изображения птиц и цветов из текстовых описаний. Это достигается путем обучения Deep Convolutional GAN, основанного на изученном текстовом представлении функций. Однако создаваемые изображения имеют низкое разрешение. Приведенная выше статья направлена ​​на решение этой проблемы с помощью многослойной структуры.

Фотореалистичное одиночное изображение со сверхвысоким разрешением с использованием генерирующей состязательной сети (2016) [515 цитат]

Повышает разрешение изображения, добавляя состязательную потерю к потере содержимого.

Непарный преобразование изображения в изображение с использованием согласованных с циклом состязательных сетей (2017 г.) [399 цитат]

Знакомит с техникой трансляции изображений G: X ›Y, связывая ее с обратным отображением F: Y› X.

Объединенные генерирующие состязательные сети (2016) [152 цитаты]

Модель CoGAN, которая изучает совместное распределение изображений из разных доменов. Дружеское прочтение статьи можно найти здесь.

Синтез предпочтительных входов для нейронов в нейронных сетях через глубокие сети генераторов (2016) [95 цитат]

Создавайте высококачественные изображения с высоким разрешением с помощью Deep Generator Network-based Activation Maximization (DGN-AM).

Plug & play генеративные сети: условная итеративная генерация изображений в скрытом пространстве (2016) [70 цитат]

Представляем технику, которая преодолевает слабость DGN-AM, которая генерирует сэмплы без разнообразия. Это делается путем добавления априора к скрытому коду.

Генеративные мульти-состязательные сети (2016) [15 цитат]

Что происходит, когда вы вводите GAN с несколькими дискриминаторами?

Методы обучения GAN

У каждой сети есть свои недостатки, и сети GAN не являются исключением. Две самые большие головные боли при обучении GAN - это создание качественных и разнообразных изображений. Другие проблемы включают исчезающие градиенты, невозможность сходиться и генератор, производящий очень похожие образцы.

Генеративные состязательные сети Вассерштейна (2017) [553 цитаты]

Представляем WGAN, вариант GAN, который улучшает обучение за счет введения гладкой метрики для количественной оценки разницы между двумя распределениями вероятностей. В этой статье также рассказывается, что значит изучить распределение вероятностей. Это сообщение в блоге - хороший вспомогательный материал, который объясняет математику, лежащую в основе GAN, а также WGAN.

Улучшенные методы обучения GAN (2016 г.) [708 цитат]

Направлен на решение проблемы несходимости во время обучения GAN (т. Е. Функция стоимости генератора и дискриминатора не может быть одновременно минимизирована). Результат приводит к повышению производительности при полууправляемом обучении и генерации выборки.

На пути к принципиальным методам обучения генерирующих враждебных сетей (2017 г.) [213 цитат]

Этот документ направлен на рассмотрение и анализ проблем во время обучения GAN. Проблемы включают обновления генератора, ухудшающиеся по мере улучшения дискриминатора, нестабильное обучение и использование альтернативной функции стоимости.

Сети противоборства, генерирующие метод наименьших квадратов (2017 г.) [89 цитат]

Предлагает функцию потерь по методу наименьших квадратов для дискриминатора, который может генерировать выборки, которые ближе к реальным данным.

Unrolled Generative Adversarial Networks (2017) [53 цитаты]

Направлен на стабилизацию генерирующих состязательных сетей (GAN) путем введения суррогатной цели во время обновления генератора.

Генеративные состязательные сети (GAN): что они могут создавать, а что нет? (2018) [слишком ново для цитирования]

Исчерпывающий обзор проблем в обучении GAN и методов их решения.

Условные GAN

Вариант оригинального GAN, который добавляет дополнительную информацию на входы генератора и дискриминатора.

Conditional Generative Adversarial Nets (2014) [536 цитат]

Введение в условные GAN, где и генератор, и дискриминатор зависят от некоторой дополнительной информации y, которая может быть метками классов, данными или другими формами.

Преобразование изображения в изображение с использованием условных состязательных сетей (2017 г.) [663 цитаты]

Использование условных GAN для задач преобразования изображения в изображение.

Последние статьи о GAN

2018 год ознаменовался новыми и интересными подходами GAN. Вот наш выбор:

Созданы ли GAN одинаково? Крупномасштабное исследование (2018 г.) [14 цитат, 1 твит]

Эту статью рекомендовал Ян Гудфеллоу в ветке твиттера. Предлагаются количественные методы для сравнения моделей GAN.

Введение в синтез изображений с помощью генеративных состязательных сетей (2018) [слишком ново для цитирования]

(Взято из аннотации) В этой статье мы даем систематизацию методов, используемых в синтезе изображений, рассматриваем различные модели синтеза текста в изображение и преобразования изображения в изображение, а также обсуждаем некоторые показатели оценки, а также возможные направления будущих исследований. в синтезе изображений с помощью GAN.

Evolutionary Generative Adversarial Networks (2018) [1 твит]

Направлен на повышение стабильности обучения GAN и качества сгенерированных изображений путем развития группы генераторов для адаптации к дискриминатору.

Синтез звука с помощью генерирующих состязательных сетей (2018) [1 ссылка]

Представляем WaveGAN, первую попытку применения GAN к синтезу сырого звука в неконтролируемой обстановке.

Социальная сеть GAN: социально приемлемые траектории с генеративными враждебными сетями (2018 г.) [слишком новинка для цитирования]

Сети GAN могут моделировать возможные варианты будущего, используя данные временных рядов. Используя это, авторы данной статьи использовали GAN для прогнозирования социально приемлемых траекторий движения человека. Их подход потенциально может быть использован в беспилотных автомобилях и социальных роботах.

Спектральная нормализация для генеративных состязательных сетей (2018) [16 цитат]

Направлен на улучшение стабильности тренировки GAN с помощью техники нормализации веса.

Статьи с хорошими пояснениями по GAN

  • GAN простыми словами из статьи Analytics Vidhya
  • Блог OpenAI: Обзор генеративных моделей статья
  • Фантастические сети GAN и их местонахождение: эволюция GAN статья

Я что-то еще упускаю? Не стесняйтесь комментировать.

Роуэн - научный сотрудник Nurture.ai. Она считает, что препятствием для понимания мощных знаний является замысловатый язык и чрезмерное использование жаргонов. Ее цель - разбить сложные концепции, чтобы их можно было легко усвоить.