Обучение нейронных сетей | Статья в сборнике международной научной конференции

Отправьте статью сегодня! Журнал выйдет 30 ноября, печатный экземпляр отправим 4 декабря.

Опубликовать статью в журнале

Библиографическое описание:

Акулин, Е. В. Обучение нейронных сетей / Е. В. Акулин, Л. Е. Свиридова. — Текст : непосредственный // Исследования молодых ученых : материалы XXVIII Междунар. науч. конф. (г. Казань, декабрь 2021 г.). — Казань : Молодой ученый, 2021. — С. 6-10. — URL: https://moluch.ru/conf/stud/archive/410/16843/ (дата обращения: 19.11.2024).



Нейросеть является последовательностью нейронов, которые в свою очередь соединены между собой синапсами. По сути, структура нейронной сети пришла из биологии в мир программирования. Благодаря данной структуре, ЭВМ (электронно-вычислительная машина) обрела способность, как анализировать, так и запоминать различную по своему значению информацию. Нейронные сети также способны не только анализировать информацию, но даже воспроизводить ее из своей памяти.

Ключевые слова: нейронная сеть, математическая модель, структура, задачи, процесс, обучение, функционирование, свойства.

Нейронная сеть — это математическая модель, одна из разновидностей искусственного интеллекта, главной целью которой является моделирование аналитических механизмов, которые осуществляются человеческим мозгом. Наиболее важные задачи, которые способна решать обычная нейросеть — это классификация, распознавание и предсказание. По своей сути нейросети могут самостоятельно развиваться, обучаться и строить свой опыт, исходя из своих же ошибок. Способность к обучению является наиважнейшим свойством человеческого мозга. В отношении же нейросетей процесс обучения рассматривается как настройка архитектуры сети для наиболее эффективного выполнения определенной задачи. В большинстве случаев нейронная сеть настраивает свои веса связей по уже имеющейся обучающей выборке, функционирование сети будет улучшаться по мере итеративной настройки весовых коэффициентов.

Для процесса обучения нейросети необходимо понимать модель внешней среды, где должна функционировать сеть, по сути, она должна знать доступную и необходимую для сети информацию. Модель определяет саму парадигму обучения. Необходимо знать, как точно модифицировать весовые параметры сети, а также какие правила обучения могут управлять процессом настройки. Алгоритм обучения является процедурой, где используются правила обучения для настройки весов.

На данный момент, существуют 3 парадигмы обучения: с учителем, без учителя и смешанная. В первом случае нейронная сеть имеет правильные ответы для любого входного примера, веса же настраиваются для того, чтобы сеть давала наиболее точные ответы. Вариант обучения с учителем допускает то, что известна может быть только критическая оценка правильности выхода сети, но не правильные значения выхода. Обучение без учителя не нуждается в знании правильных ответов для любого примера обучающей выборки. В данном случае раскрывается только внутренняя структура данных или же корреляции между образцами в системе данных, что затем позволит разделить образцы по категориям.

Во время смешанного обучения некоторая часть весов будет определяться с помощью обучения с учителем, остальные же веса станут формироваться с помощью самообучения. Теория обучения нейросетей исследует 3 фундаментальных свойства, которые связанны с обучением на примерах емкости, вычислительной сложности и сложности образцов. В данном случае под емкостью подразумевается определенное количество, которое может запомнить нейросеть, а также какие границы и функции принятия решений возможно на ней сформировать. Сложность образцов определяет количество обучающих примеров, необходимых для достижения способности сети к обобщению.

На данный момент известны 4 типа правил обучения нейросети: правило Хебба, машина Больцмана, коррекция по ошибке и обучение методом соревнования. Правило коррекции по ошибке предполагает, что при обучении с учителем для любого входного примера будет задан выход «d», но при этом реальный выход сети «y» может и не совпадать с желаемым. Принцип коррекции по ошибке во время обучения заключается в использовании разностного сигнала (d — y) для модификации весов, которая обеспечит уменьшение ошибки. Данное обучение возможно произвести только в том случае, если сеть ошибается.

Обучение Больцмана представляет собой стохастическое правило обучения, которое вытекает из термодинамических принципов и теории информации. Главная цель обучения Больцмана заключается в настройке весовых коэффициентов, при которой состояние нейронов внешнего слоя будут удовлетворять необходимому распределению вероятностей. Обучение Больцмана необходимо понимать, как особый случай коррекции по ошибке, где под ошибкой рассматривается расхождение корреляций состояний из 2 режимов.

Правило Хебба считается одним из первых обучающих правил. Дональд Олдинг Хебб (1904–1985 гг.) в первую очередь опирался на нейрофизиологические наблюдения: в случае если нейроны с обеих сторон синапса активизируются регулярно и одновременно — сила синаптической связи возрастает. Особенно важной особенностью данного правила является изменение синаптического веса, который зависит лишь только от активности нейронов связанных данным синапсом.

В отличие от обучения Д. Хебба, процесс обучения методом соревнования отличается тем, что в нем множество выходных нейронов может возбуждаться одновременно, при этом в соревновательном обучении выходные нейроны будут соревноваться между собой за активизацию. В первую очередь, данное обучение применяется в биологических нейросетях. Процесс обучения с помощью соревнования допускает возможность кластеризовать входные данные. При этом аналогичные входные примеры группируются нейросетью в согласии с корреляциями и представляются одним элементом.

В наше время нейронные сети являются важным инструментом для работы с значительными объемами данных, также сети позволяют разрешить огромное количество нетрадиционных задач за небольшое количество времени. Легкость применения заключается в их довольно простой обучаемости, в процессе которой нет необходимости исследовать разные алгоритмы и нанимать специалистов, так как обучение происходит на примерах. На данный момент потенциал сетей полностью не раскрыт из-за ряда проблем, которые все еще не разрешены в настоящее время. Одна из таких проблем заключается в недостаточной скорости передачи сигнала внутри самой нейросети, поскольку аппаратная составляющая довольно слаба. В первую очередь, все зависит от того, когда и смогут ли данные передаваться ЭВМ со скоростью, которая будет близкой к скорости человеческой мысли. Остается верить, что в будущем данные вопросы будут разрешены, и развитие нейросетей перейдет на новый этап.

Литература:

  1. Боровская Е. В. Основы искусственного интеллекта: учебное пособие / Е. В. Боровская, Н. А. Давыдова. — 4-е изд., электрон. — М.: Лаборатория знаний, 2020. — 130 с.
  2. Вакуленко С. А., Жихарева А. А. Практический курс по нейронным сетям — СПб: Университет ИТМО, 2018–71 с.
  3. Гальберштам Н. М., Баскин И. И., Палюлин В. А., Зефиров Н. С. Нейронные сети как метод поиска зависимостей структура — свойство органических соединений // Успехи химии. — Российская академия наук, 2003. — Т. 72, № 7. — С. 706–727.
  4. Калацкая Л. В., Новиков В. А., Садов В. С. Организация и обучение искусственных нейронных сетей: Экспериментальное учеб. пособие. — Минск: Изд-во БГУ, 2003. — 72 с.
  5. Малыгина Юлия Павловна Нейронные сети: особенности, тенденции, перспективы развития // Молодой исследователь Дона. 2018. № 5 (14). С. 79–82.

Похожие статьи

Мозг как биологический компьютер

В статье рассматривается концепция биологического программирования мозга, аналогичная процессу программирования компьютера, но учитывающая биологическую природу мозга. Этот подход предполагает, что воздействие различных стимулов и опыта может привест...

Использование сверточных нейронных сетей для определения кровного родства по фотографии

Определение родства по фотографии — довольно молодая область компьютерного зрения, и своим развитием она во многом обязана другим областям, таким как распознавание лица и верификация личности. В статье приводится архитектура сверточной нейронной сети...

Основа теории сна, которую должен знать каждый

Исторически, научное исследование сна началось только в последнем столетии. Спящий человек наблюдался и изучался, однако систематизированное исследование его механизмов возникло с появлением полисомнографии — комплексного метода исследования сна. Исп...

Обзор современных нейронных сетей и их интеграция в жизнь человечества

Прогресс человечества не стоит на месте. Это касается и области информационных технологий. С каждым днем специалисты данной области создают и придумывают все более сложные и совершенные методы, машины и способы обработки информации. Данная статья опи...

Информационно-кибернетические исследования и проектирования сложных систем

Научно-технические революции способствовали усложнению функционирования различных процессов в жизни общества. Если раньше любой процесс описывался в рамках динамической системы, поведение объектов которой следовало простой логике и объяснялось обыкно...

О некоторых особенностях интернет-коммуникации как новой форме общения

С развитием Интернета возникают новые модели социального взаимодействия, образование виртуальных сообществ, базирующихся, главным образом, на онлайновой коммуникации. Язык Интернета совмещает в себе признаки письменной и устной форм речи, а также обл...

Общая модель мониторинга распределенных систем

Для принятия управленческих решений, контроля поведения и получения необходимой информации о работе распределенных систем необходима система мониторинга. В статье рассматривается общая модель системы мониторинга, основанная на жизненном цикле информа...

Особенности перевода эмоционально окрашенной лексики и основные аспекты её межъязыковой передачи

Представленная статья рассматривает одну из наиболее важных и актуальных на сегодняшний день особенности перевода — передачу эмоционально-окрашенной лексики. Перевод как таковой можно рассматривать как комплексную форму общения. Эмоционально-окрашенн...

Математическое моделирование систем распознавания изображений, содержащих текстовую информацию, на основе нейронных сетей

В данной статье приводится математическая модель системы распознавания изображений, содержащих текстовую информацию или использующих такую информацию при своей генерации. Предполагается, что рассматриваемые системы будет основаны на возможностях нейр...

Технология майндмэппинга и ее практическое использование

В статье авторы рассматривают такую технологию, как майндмэппинг. Разбирают особенности создания карт связей, описывают инструменты для их построения и изучают правила построения ментальных карт. Благодаря соблюдению данных правил можно оптимизироват...

Похожие статьи

Мозг как биологический компьютер

В статье рассматривается концепция биологического программирования мозга, аналогичная процессу программирования компьютера, но учитывающая биологическую природу мозга. Этот подход предполагает, что воздействие различных стимулов и опыта может привест...

Использование сверточных нейронных сетей для определения кровного родства по фотографии

Определение родства по фотографии — довольно молодая область компьютерного зрения, и своим развитием она во многом обязана другим областям, таким как распознавание лица и верификация личности. В статье приводится архитектура сверточной нейронной сети...

Основа теории сна, которую должен знать каждый

Исторически, научное исследование сна началось только в последнем столетии. Спящий человек наблюдался и изучался, однако систематизированное исследование его механизмов возникло с появлением полисомнографии — комплексного метода исследования сна. Исп...

Обзор современных нейронных сетей и их интеграция в жизнь человечества

Прогресс человечества не стоит на месте. Это касается и области информационных технологий. С каждым днем специалисты данной области создают и придумывают все более сложные и совершенные методы, машины и способы обработки информации. Данная статья опи...

Информационно-кибернетические исследования и проектирования сложных систем

Научно-технические революции способствовали усложнению функционирования различных процессов в жизни общества. Если раньше любой процесс описывался в рамках динамической системы, поведение объектов которой следовало простой логике и объяснялось обыкно...

О некоторых особенностях интернет-коммуникации как новой форме общения

С развитием Интернета возникают новые модели социального взаимодействия, образование виртуальных сообществ, базирующихся, главным образом, на онлайновой коммуникации. Язык Интернета совмещает в себе признаки письменной и устной форм речи, а также обл...

Общая модель мониторинга распределенных систем

Для принятия управленческих решений, контроля поведения и получения необходимой информации о работе распределенных систем необходима система мониторинга. В статье рассматривается общая модель системы мониторинга, основанная на жизненном цикле информа...

Особенности перевода эмоционально окрашенной лексики и основные аспекты её межъязыковой передачи

Представленная статья рассматривает одну из наиболее важных и актуальных на сегодняшний день особенности перевода — передачу эмоционально-окрашенной лексики. Перевод как таковой можно рассматривать как комплексную форму общения. Эмоционально-окрашенн...

Математическое моделирование систем распознавания изображений, содержащих текстовую информацию, на основе нейронных сетей

В данной статье приводится математическая модель системы распознавания изображений, содержащих текстовую информацию или использующих такую информацию при своей генерации. Предполагается, что рассматриваемые системы будет основаны на возможностях нейр...

Технология майндмэппинга и ее практическое использование

В статье авторы рассматривают такую технологию, как майндмэппинг. Разбирают особенности создания карт связей, описывают инструменты для их построения и изучают правила построения ментальных карт. Благодаря соблюдению данных правил можно оптимизироват...