Эволюционный подход к настройке и обучению нейронной сети | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 30 ноября, печатный экземпляр отправим 4 декабря.

Опубликовать статью в журнале

Авторы: ,

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №10 (114) май-2 2016 г.

Дата публикации: 17.05.2016

Статья просмотрена: 756 раз

Библиографическое описание:

Молотков, М. С. Эволюционный подход к настройке и обучению нейронной сети / М. С. Молотков, А. К. Новиков. — Текст : непосредственный // Молодой ученый. — 2016. — № 10 (114). — С. 69-71. — URL: https://moluch.ru/archive/114/29706/ (дата обращения: 19.11.2024).



В статье рассматривается применение эволюционных алгоритмов (ЭА) для настройки и обучения искусственной нейронной сети (ИНС) — нейроэволюция. Даются основные особенности нейроэволюционного подхода (НЭ). Приведены задачи, решаемые с помощью НЭ алгоритмов, слабые и сильные стороны НЭ алгоритмов, а также рекомендации для решения распространенных проблем применения нейроэволюции.

Построение искусственной нейронной сети (ИНС), с классической точки зрения, выполняется методом проб и ошибок. Исследователь задает параметры сети: количество слоев и нейронов, структуру связей между нейронами, а затем наблюдает результаты — сеть обучается и тестируется на тестовой выборке. В зависимости от результатов тестирования исследователь производит изменения параметров сети. Для обучения используется обучающая выборка, включающая наборы входных сигналов X и соответствующие эталонные значения выходных сигналов Y. Использование обучающего множества данных позволяет подстраивать веса связей ИНС с помощью градиентных алгоритмов. Изменение весов связей происходит на основании отклонения значений действительных выходных сигналов ИНС F от требуемых Y. Обычно это отклонение представляется в виде ошибки ε ИНС.

Часто формирование обучающей выборки сопряжено со сложностью определения значений компонент вектора Y из обучающего множества. Данная проблема возникает при решении ряда специфических задач, а также если необходимо оценить последовательность выходных сигналов ИНС. К таким задачам относятся задачи, связанные с адаптивным поведением и управлением, прогнозированием, анализом временных рядов, игровыми стратегиями, обработкой изображений и т.д. Для решения данной проблемы можно использовать приближенную интегральную оценку, которая будет отражать качественные характеристики ИНС. В таком случае оценивается не соответствие выходных сигналов ИНС F и эталонных значений Y, а качество работы сети в целом. Конкретные примеры таких оценок зависят от области применения решения: время поддержания стабильного состояния объекта управления для задачи нейроуправления, точность прогнозирования погоды или курса валюты, процент выигранных игр, качество изображения для задачи обработки изображений. Такие оценки не могут быть использованы градиентными алгоритмами обучения для настройки весов связей. В данном случае необходим обучающий алгоритм, который может изменять веса связей ИНС, не полагаясь на информацию о величине ошибки для каждого выхода этой сети.

  1. Нейроэволюция.

Одним и решений данной задачи служит нейроэволюционный подход к обучению и настройке нейронной сети. Этот подход использует абстракцию естественной эволюции — эволюционные алгоритмы (ЭА) для построения абстракций биологических нейронных сетей — ИНС. Использование комбинации ИНС и ЭА позволяет организовывать системы, способные к разумному поведению, совмещая гибкость настройки ИНС и адаптивность ЭА.

Главным преимуществом нейроэволюции является то, что она дает возможность обучать нейронную сеть, без информации о соответствии вектора входных сигналов X и вектора выходных эталонных сигналов Y. Благодаря такому подходу представляется возможным найти оптимизированную обученную нейронную сеть, не имея прямой информации о том, что сеть должна выдавать на выходе.

Большинство методов нейроэволюции следует «сгенерировать-и-протестировать» циклу (Рис.1.).

http://www.scholarpedia.org/w/images/9/92/Ne1.png

Рис. 1. Цикл нейроэволюции

Каждую итерацию цикла закодированная информация об ИНС в виде генов — генотип декодируется в соответствующую нейронную сеть — фенотип. Затем полученная сеть проходит тестирование, в ходе которого она используется для решения поставленной задачи. В ходе тестирования измеряется производительность исследуемой конфигурации ИНС — ее фитнесс функция. После того, как таким образом были оценены все члены текущей популяции, с помощью генетических операторов создается новая популяция. Особи с большей фитнесс-функцией заменяют особи с меньшей приспособленностью. Таким образом, процесс обучения ИНС представляет собой интеллектуальный параллельный поиск в направлении улучшения генотипов, и продолжается до тех пор, пока не будет найдена оптимальная сеть с достаточно высокой функцией приспособленности.

  1. Схемы кодирования.

Существует множество способов кодирования информации об ИНС, представленной в хромосоме. Выбор представления информации в генах во многом определяет класс сетей, которые могут быть построены с помощью данного метода. Кроме того, от схемы кодирования зависит эффективность нейроэволюционного метода по всем параметрам в целом.

В настоящее время выделяют два больших класса способов кодирования: прямое кодирование (directencoding) и косвенное кодирование (indirectencoding).

В случае прямого кодирования хромосома представляет из себя некоторое линейное представление ИНС. В такой хромосоме явно указаны параметры сети: входные, выходные и скрытые нейроны, связи между ними, веса связей и т.д. Благодаря такому представлению всегда можно построить взаимно-однозначное соответствие между структурными элементами ИНС (нейронами, связями, весами и пр.), т. е. фенотипом, и соответствующими участками хромосомы, т. е. генотипом.

Такой способ кодирования ИНС является наиболее наглядным, простым и интуитивным, а также позволяет применять к полученным хромосомам уже имеющийся аппарат генетического поиска, например, такие операторы как кроссинговер и мутация. Главный минус такой схемы — это неизбежное увеличение размеров генотипа, при увеличении количества нейронов и связей ИНС. Данный недостаток приводит к низкой эффективности за счет значительного увеличения пространства поиска.

Существует множество разработок, направленных на компенсацию недостатков прямого кодирования. Стоит отметить один из самых удачных — алгоритм NEAT (NeuroEvolutionofAugmentingTopologies) и модернизацию этого алгоритма — HyperNEAT (Hypercube-basedNeuroEvolutionofAugmentingTopologies).

Косвенный подход применяет более сложные методы и алгоритмы кодирования параметров ИНС. Как правило, генетическое представление получается более компактным, за счет чего снижается пространство поиска оптимальной структуры сети. Подобные методы позволяют кодировать модульные структуры, что дает в определенных условиях преимущества в адаптивности полученных результатов. Взамен мы получаем практическую невозможность проследить, какие изменения в генотипе привели к заданным изменениям в фенотипе, а также множество трудностей с подбором генетических операторов, сходимостью и производительностью.

Заключение

Выбор топологии и настройка весов связей искусственной нейронной сети (ИНС) являются важнейшими этапами при использовании нейросетевых технологий для решения практических задач. От этих этапов напрямую зависит качество и адекватность полученной нейросетевой модели.

Использование эволюционных алгоритмов совместно с ИНС позволяет решать задачи настройки и обучения ИНС как по отдельности, так и одновременно. Такой синтезированный подход предоставляет унифицированный подход к решению разнообразных задач классификации, аппроксимации, управления и моделирования. Использование качественной оценки функционирования ИНС позволяет применять нейроэволюционные алгоритмы для решения задач исследования адаптивного поведения интеллектуальных агентов, поиска игровых стратегий, обработки сигналов и изображений. Несмотря на то, что количество проблем и вопросов, касающихся разработки и применения НЭ алгоритмов велико, для успешного решения задачи с использованием нейроэволюционного подхода достаточно адекватного понимания проблемы и НЭ подхода, свидетельством чего является большое число интересных и успешных работ в данном направлении.

Литература:

  1. Evolving Neural Networks (2009, Risto Miikkulainen and Kenneth O. Stanley), p. 132-141
  2. Эволюционный подход к настройке и обучению искусственных нейронных сетей (2006, Цой Ю.Р., Спицын В.Г.), с. 18-32
  3. Evolving Neural Networks through Augmenting Topologies (2002, K. O. Stanley and R. Miikkulainen), p. 14-25
  4. Evolutionary function approximation for reinforcement learning. Whiteson, Shimon and Stone, Peter (2006), p. 877-917
  5. Stanley, Kenneth O.; D'Ambrosio, David B. and Gauci, Jason (2009). A hypercube-based encoding for evolving large-scale neural networks. Artificial Life 15(2): 185-212.
  6. Valsalam, Vinod K.; Hiller, Jonathan; MacCurdy, Robert; Lipson, Hod and Miikkulainen, Risto (2012). Constructing controllers for Physical Multilegged Robots using the ENSO Neuroevolution approach. Evolutionary Intelligence 5(1): 1-12.
Основные термины (генерируются автоматически): алгоритм, вес связей, искусственная нейронная сеть, прямое кодирование, NEAT, адаптивное поведение, задача, настройка весов связей, нейрон, нейронная сеть, обучающая выборка, параметр сети, подход, решение, схема кодирования.


Похожие статьи

Использование SMART-целей на примере дисциплины «Программирование»

Статья посвящена использованию современных методов обучения в учебном процессе при подготовке студентов специальности «Информатика». Рассматривается постановка SMART-цели на примере дисциплины «Программирование». Приведен пример оценки ожидаемых резу...

Основы разработки модулярных нейрокомпьютеров для обработки сигналов

В статье рассмотрен один из подходов решения задач повышения уровня параллелизма вычислительных систем обработки сигналов. Одним из возможных способов решения этой проблемы является внедрение в производство нейросетевых технологий, которые рассмотрен...

Подходы к визуализации вычислительных процессов

В данной статье приведены результаты разработки алгоритма оптимизации изменяемых характеристик двигателей, основанных на принципах обратного пьезоэлектрического эффекта. Приведены используемые в разработке алгоритмы машинного обучения и способы их оп...

Интеллектуальная система выявления фейков на фотографии

В данной статье вводится понятие фейковых фотографий и рассматривается роль интеллектуальных систем в выявлении фейков на фотографиях. Описываются основные методы и подходы с использованием машинного обучения и нейронных сетей. Приведены примеры испо...

Особенности и варианты использования логистического подхода к управлению знаниями в организации

Актуальность данной статьи обусловлена увеличением интереса теории и практики к логистике и управлению знаниями. Данные направления достаточно активно используются в различных сферах деятельности. Целью статьи является рассмотрение теоретической осно...

Сравнительный обзор сетевых интерфейсов для коммутации испытательной стендовой базы динамического полунатурного моделирования

Данная статья посвящена исследованию проблемы коммутации испытательной стендовой базы динамического моделирования. В статье проанализированы существующие на данный момент сетевые протоколы, применимые для решения данной задачи. Рассмотрены их основны...

Алгоритмы оптимальной структуры компьютерной сети

В статье рассмотрен метод решения задач выбора оптимальной структуры компьютерной сети при её оптимизации. Особое внимание уделено методу эволюционного моделирования, который показывает хорошие результаты при решении задач нелинейной целочисленной оп...

Применение ИКТ в натурном эксперименте лабораторного практикума по физике

В статье рассмотрены различные подходы к использованию ИКТ в натурном эксперименте в рамках лабораторного практикума по физике. Выделены три направления использования информационных технологий при проведении эксперимента: натурный эксперимент в его т...

Позиционирование и взаимодействие в беспроводных сенсорных сетях

В статье описаны основные проблемы проектирования сенсорных сетей, алгоритмы определения местонахождения устройств сенсорной сети и приведены рекомендации по их применению в зависимости от зоны покрытия. Рассмотрены алгоритмы, позволяющие увеличить с...

Применение машинного обучения для прогнозирования академической успеваемости студентов в образовательных учреждениях

Современные образовательные учреждения сталкиваются с необходимостью анализа больших объемов данных, связанных с академической деятельностью студентов. Прогнозирование академической успеваемости с использованием алгоритмов машинного обучения (МЛ) по...

Похожие статьи

Использование SMART-целей на примере дисциплины «Программирование»

Статья посвящена использованию современных методов обучения в учебном процессе при подготовке студентов специальности «Информатика». Рассматривается постановка SMART-цели на примере дисциплины «Программирование». Приведен пример оценки ожидаемых резу...

Основы разработки модулярных нейрокомпьютеров для обработки сигналов

В статье рассмотрен один из подходов решения задач повышения уровня параллелизма вычислительных систем обработки сигналов. Одним из возможных способов решения этой проблемы является внедрение в производство нейросетевых технологий, которые рассмотрен...

Подходы к визуализации вычислительных процессов

В данной статье приведены результаты разработки алгоритма оптимизации изменяемых характеристик двигателей, основанных на принципах обратного пьезоэлектрического эффекта. Приведены используемые в разработке алгоритмы машинного обучения и способы их оп...

Интеллектуальная система выявления фейков на фотографии

В данной статье вводится понятие фейковых фотографий и рассматривается роль интеллектуальных систем в выявлении фейков на фотографиях. Описываются основные методы и подходы с использованием машинного обучения и нейронных сетей. Приведены примеры испо...

Особенности и варианты использования логистического подхода к управлению знаниями в организации

Актуальность данной статьи обусловлена увеличением интереса теории и практики к логистике и управлению знаниями. Данные направления достаточно активно используются в различных сферах деятельности. Целью статьи является рассмотрение теоретической осно...

Сравнительный обзор сетевых интерфейсов для коммутации испытательной стендовой базы динамического полунатурного моделирования

Данная статья посвящена исследованию проблемы коммутации испытательной стендовой базы динамического моделирования. В статье проанализированы существующие на данный момент сетевые протоколы, применимые для решения данной задачи. Рассмотрены их основны...

Алгоритмы оптимальной структуры компьютерной сети

В статье рассмотрен метод решения задач выбора оптимальной структуры компьютерной сети при её оптимизации. Особое внимание уделено методу эволюционного моделирования, который показывает хорошие результаты при решении задач нелинейной целочисленной оп...

Применение ИКТ в натурном эксперименте лабораторного практикума по физике

В статье рассмотрены различные подходы к использованию ИКТ в натурном эксперименте в рамках лабораторного практикума по физике. Выделены три направления использования информационных технологий при проведении эксперимента: натурный эксперимент в его т...

Позиционирование и взаимодействие в беспроводных сенсорных сетях

В статье описаны основные проблемы проектирования сенсорных сетей, алгоритмы определения местонахождения устройств сенсорной сети и приведены рекомендации по их применению в зависимости от зоны покрытия. Рассмотрены алгоритмы, позволяющие увеличить с...

Применение машинного обучения для прогнозирования академической успеваемости студентов в образовательных учреждениях

Современные образовательные учреждения сталкиваются с необходимостью анализа больших объемов данных, связанных с академической деятельностью студентов. Прогнозирование академической успеваемости с использованием алгоритмов машинного обучения (МЛ) по...

Задать вопрос