Аналитическое сравнение рекуррентных моделей в задаче прогнозирования динамики ценных бумаг | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 15 июня, печатный экземпляр отправим 19 июня.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №20 (519) май 2024 г.

Дата публикации: 15.05.2024

Статья просмотрена: 1 раз

Библиографическое описание:

Меркулов, П. Д. Аналитическое сравнение рекуррентных моделей в задаче прогнозирования динамики ценных бумаг / П. Д. Меркулов. — Текст : непосредственный // Молодой ученый. — 2024. — № 20 (519). — С. 5-7. — URL: https://moluch.ru/archive/519/114160/ (дата обращения: 01.06.2024).



В данной статье рассматриваются подходы машинного обучения в задаче анализа и прогнозирования рынка ценных бумаг. В работе сравниваются такие аспекты, как количество занимаемой памяти, число параметров, а также величина затраченного на обучение модели времени. На основе результатов исследования сделано предложение по выбору наиболее подходящего метода с точки зрения предиктивной эффективности.

Ключевые слова :машинное обучение, глубокое обучение,рекуррентные сети, прогнозирование динамики ценных бумаг.

Привлекательность фондового рынка как объекта инвестиций остается неизменной, рынок ценных бумаг служит барометром состояния экономики, отражая результаты деятельности и перспективы компаний различных отраслей и секторов. Прогнозирование динамики фондовых рынков важно для трейдеров и инвесторов, поскольку помогает им принимать обоснованные решения о том, когда покупать, продавать или держать ценные бумаги. Прогнозируя движение цен, они могут потенциально максимизировать свою прибыль и минимизировать убытки. Интеграция методов машинного обучения в совокупности с методами технического анализа временных рядов может значительно повысить точность прогнозирования. В представленной статье проведен сравнительный анализ моделей машинного обучения для прогнозирования динамики фондового рынка.

По итогам анализа литературы по теме для решения поставленной задачи были выделены три типа рекуррентных сетей, а именно LSTM, GRU, CNN-LSTM.

В качестве изначального набора данных в работе используются показатели по акциям технологических компаний. Для составления обучающего набора данных используются закрывающие цены на акции. В процессе предобработки исходный набор дополняется за счет индикаторов технического анализа. Таким образом, целевым значением для модели прогнозирования является закрывающая цена акции, в то время как на вход подаются цена акции и значения технических индикаторов, взятых с временным лагом.

Гиперпараметры, замеры и результаты проведенных c моделями экспериментов были внесены в таблицу 1.

Таблица 1

Таблица сравнения моделей анализа и прогнозирования

Используемые модели

GRU

LSTM

CNN-LSTM

Гиперпараметры

Входной слой

1x5

1x5

1x5

Размер выборки

16

16

16

Размер скрытого слоя

64

64

64

Замеры

Время

36 сек

45 сек

40 сек

Количество параметров

50433

133761

17229

Память

197.1 Кбайт

522.5 Кбайт

67.3 Кбайт

Результаты

MAE

5.827

6.545

2.919

RMSE

24.786

32.352

12.765

R2

0.947

0.912

0.987

Оценка результатов работы моделей проводилась с использованием метрик оценки, наиболее часто используемых для количественной оценки того, насколько хорошо модель соответствует набору данных, а именно RMSE, MAE и R-squared.

Рисунок 1 отображает результаты прогноза обученных моделей на тестовой выборке.

Прогнозы моделей на тестовой выборке

Рис. 1. Прогнозы моделей на тестовой выборке

Опираясь на полученные результаты, можно сделать вывод о том, что гибридная модель CNN-LSTM показала лучший результат на тестовой выборке данных. Это подтверждается большой сходимостью между предсказаниями модели и фактическими значениями, наблюдаемыми в тестовом наборе. Одним из факторов, который мог способствовать такому относительно хорошему исходу, является то, что слой свертки неплохо справляется с вычленением определенных паттернов временного ряда, а также, что архитектура LSTM сети и гиперпараметры достаточно комплексны, чтобы отразить все нелинейности и закономерности, присутствующие в данных.

Таким образом, в результате сравнительного анализа были выявлены различные сильные и слабые стороны представленных моделей для анализа и прогнозирования динамики ценных бумаг. Так, например, модель управляемого рекуррентного блока обучается быстрее остальных методов и теоретически может приблизиться к результатам при условии должной тонкой настройки. Но все же в качестве самого перспективного алгоритма прогнозирования ценных бумаг можно отметить гибридный подход обучения CNN-LSTM сети на данных, дополненных при помощи инструментов технического анализа, так как данный подход позволяет лучше передавать локальные тонкости временного ряда, обладает высоким потенциалом обобщения и занимает относительно мало памяти.

Так, в работе были рассмотрены способы того, как можно подойти к проблеме прогнозирования акций с помощью машинного обучения, рассматривая данные фондового рынка как временной ряд, а также использовании инструментов технического анализа для аугментации вектора входных значений моделей. Далее были проведены эксперименты на трех существующих алгоритмах, часто используемых для прогнозирования временных рядов: GRU, двунаправленной LSTM и гибридной CNN-LSTM. В работе использовались реальные биржевые данные для прогнозирования цен на акции. На основании представленных моделей был проведен сравнительный анализ эффективности и результативности прогнозов с использованием метрик ошибок RMSE, MAE и R2.

Однако эксперты из финансовой сферы и области искусственного интеллекта утверждают, что методы машинного обучения плохо работают в реальном мире для прогнозирования рынка. Даже если сотни переменных и движущих сил реального рынка будут квантованы, включены в данные и оптимизированы с помощью лучших доступных методов машинного обучения, модель все равно не сможет давать ценные прогнозы, когда они имеют значение. Тем не менее, эти недостатки — лишь кривые обучения в процессе разработки более надежных моделей прогнозирования цен на акции и более детального анализа возможностей существующих моделей.

Литература:

  1. RNN approach to the financial forecast. — Текст: электронный //: [сайт]. — URL: https://iris.univr.it/retrieve/handle/11562/959057/66085/Recurrent (дата обращения: 08.03.2024).
  2. Understanding LSTM Networks. — Текст: электронный //: [сайт]. — URL: https://colah.github.io/posts/2015–08-Understanding-LSTMs/ (дата обращения: 10.03.2024).
  3. Implementation of LSTM and GRU on grouped time-series data to predict stock prices. — Текст: электронный //: [сайт]. — URL: https://journalofbigdata.springeropen.com/articles/10.1186/s40537–022–00597–0 (дата обращения: 11.03.2024).
  4. Stock prediction using GRU. — Текст: электронный //: [сайт]. — URL: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0262501 (дата обращения: 14.03.2024).
Основные термины (генерируются автоматически): CNN-LSTM, LSTM, машинное обучение, GRU, MAE, RMSE, прогнозирование динамики, технический анализ, модель, фондовый рынок.


Ключевые слова

машинное обучение, глубокое обучение, рекуррентные сети, прогнозирование динамики ценных бумаг

Похожие статьи

Задать вопрос