Прогнозирование энергопотребления здания с использованием методов машинного обучения | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 27 апреля, печатный экземпляр отправим 1 мая.

Опубликовать статью в журнале

Авторы: , ,

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №24 (366) июнь 2021 г.

Дата публикации: 12.06.2021

Статья просмотрена: 139 раз

Библиографическое описание:

Гребень, Н. В. Прогнозирование энергопотребления здания с использованием методов машинного обучения / Н. В. Гребень, А. А. Елькина, И. А. Пашкин. — Текст : непосредственный // Молодой ученый. — 2021. — № 24 (366). — С. 14-16. — URL: https://moluch.ru/archive/366/82382/ (дата обращения: 19.04.2024).



В статье авторы приводят исследование различных алгоритмов машинного обучения для дальнейшего применения в задаче прогнозирования потребления энергии здания.

Ключевые слова: машинное обучение, прогнозирование.

Ежегодно множество компаний закупает ресурсы для собственных нужд в процессе эксплуатации из единой энергосистемы. Закупка электроэнергии осуществляется на основании прогнозирования. Поэтому необходимо как можно точнее определить величину объема закупаемых ресурсов для внесения соответствующей оплаты.

Целью данной работы является исследование различных алгоритмов машинного обучения для дальнейшего применения в задаче прогнозирования потребления энергии здания.

Задача, рассматриваемая в данной работе: ASHRAE — Great Energy Predictor III, взята с платформы для проведения конкурсов по машинному обучению Kaggle [1]. Требуется предсказать потребление энергии для здания с учетом известных метеорологических данных. Даны значения потребления энергии для здания в течение года, а также данные по погоде. Задача предполагает использование регрессионных алгоритмов машинного обучения.

Поскольку в наборе данных имеются столбцы с пропущенными значениями, возникает необходимость перейти к данным, не имеющим пропусков, с целью дальнейшего применения алгоритмов машинного обучения. Для решения этой проблемы воспользуемся методами заполнения пропусков. Т. к. пропуски в данных имеются лишь в столбцах с количественными переменными, заменим их на среднее арифметическое значение по столбцу (воспользуемся функцией “mean” [2]).

В качестве инструмента решения задачи будет использован высокоуровневый язык программирования общего назначения Python [3]. Данную задачу будем решать, применяя вид машинного обучения «с учителем» (при таком обучении делаются выводы о тестовых данных на основе данных обучения). Для начала выбранные модели необходимо обучить, а затем протестировать на выборках, являющимися частями исходного набора данных. Обучающая выборка содержит в себе 80 %, а тестовая — оставшиеся 20 % исходного набора данных.

Воспользуемся методами, основанными на регрессии. В некоторых случаях алгоритм линейной регрессии может стать нестабильным, из-за чего может возникнуть проблема переобучения. Переобучение — ситуация, когда модель корректно решает задачу на тренировочной выборке, но дает плохие результаты на тестовых. Решить данную проблему можно наложением ограничений на регрессионную модель, то есть применением регуляризации.

Для построения воспользуемся следующими алгоритмами машинного обучения:

  1. Linear Regression [4]
  2. LASSO Regression [5]
  3. Bayesian Ridge Regression [6]

Затем при помощи функций из библиотеки Scikit-learn [7] строим модели, основанные на вышеизложенных алгоритмах. Результаты построенных моделей по условию задачи оценивались при помощи Root Mean Squared Logarithmic Error (RMSLE) [8]:

Чем эта ошибка меньше, тем лучше выбранная модель решает задачу.

После построения и оценки моделей с использованием метрики, описанной выше, получаем результаты, представленные на Рисунке 1 и занесенные в Таблицу 1:

Результаты примененных алгоритмов

Рис. 1. Результаты примененных алгоритмов

Таблица 1

Результаты примененных алгоритмов

Алгоритм

RMSLE

Linear Regression

0.2141227114423071

Lasso Regression

0.21411934078081465

Bayesian Regression

0.21407602876767776

Коэффициенты алгоритмов Linear Regression, LASSO и Bayesian Ridge практически идентичны, качество выбранных методов также почти не отличается, следовательно, использование каких-то других методов помимо обычной линейной регрессии нецелесообразно, т. к. это не даст нам никакого особого выигрыша в данной задаче.

Литература:

1. ASHRAE — Great Energy Predictor III // Kaggle URL: https://www.kaggle.com/c/ashrae-energy-prediction (дата обращения: 15.02.2021).

2. Mathematical statistics functions URL: https://docs.python.org/3/library/statistics.html (дата обращения: 16.02.2021).

3. Python 3.8.0 documentation / Python 3.8.0 documentation URL: https://docs.python.org/3/ (дата обращения: 15.02.2021).

4. Linear Regression URL: http://www.stat.yale.edu/Courses/1997–98/101/linreg.htm (дата обращения: 22.02.2021).

5. A Complete understanding of LASSO Regression URL: https://www.mygreatlearning.com/blog/understanding-of-lasso-regression/ (дата обращения: 15.02.2021).

6. Bayesian linear regression URL: https://en.wikipedia.org/wiki/Bayesian_linear_regression (дата обращения: 16.02.2021).

7. Открытая библиотека машинного обучения scikit-learn. URL: https://scikit-learn.org/ (дата обращения: 16.03.2021).

8. Understanding Root Mean Squared Logarithmic Error (RMSLE) URL: https://www.kaggle.com/carlolepelaars/understanding-the-metric-rmsle (дата обращения: 16.02.2021).

Основные термины (генерируются автоматически): машинное обучение, LASSO, RMSLE, алгоритм, ASHRAE, III, данные, задача, задача прогнозирования потребления энергии здания, исходный набор данных.


Похожие статьи

Алгоритм создания модели краткосрочного прогнозирования...

В качестве исходных данных было взято почасовое энергопотребление за два рабочих дня

Для обучения достаточны данные по почасовому потреблению за двое предыдущих суток.

Для обучения нейронной сети используется алгоритм обратного распространения ошибки.

К задаче прогнозирования энергопотребления с помощью...

В случае прогнозирования энергопотребления необходимо иметь данные о таких

Исходные данные по энергопотреблению имеют значения за период с 01.01.2010 по 31.03.2011.

Обучение сети происходило с помощью алгоритма Левенберга — Маркуардта.

Особенности изучения способа тестирования базового пути...

Рис. 3. Потоковый граф. Исследование стратегий тестирования программного... программное обеспечение, структурное тестирование, тестирование, программный продукт, данные.

Разработка алгоритма анализа данных с помощью машинного...

Библиографическое описание: Гришин, А. П. Разработка алгоритма анализа данных с помощью машинного обучения для контроля тренировочного процесса / А

Для прогнозирования было необходимо рассмотреть подробнее точность прогнозирования с частотой ошибки, в таблице...

Исследование показателей качества и быстродействия поиска...

Примером служат задачи поиска изображений по базе данных, распознавания объектов на сцене

Исходя из того, какой объект представляет собой опорную точку, все алгоритмы поиска

Для тестирования был составлен набор изображений, которые имеют деформации...

Кодирование категориальных данных для использования...

В большинстве алгоритмов машинного обучения набор данных может содержать текстовые или категориальные значения (в основном

Следовательно, основная задача, стоящая перед аналитиком, заключается в том, чтобы преобразовать текстовые/категориальные данные в...

Алгоритмы кластеризации в машинном обучении

Системы машинного обучения позволяют быстро применять знания, полученные при обучении на больших наборах данных, что

Машинное обучение — одна из самых популярных технологий в 2020 г., поскольку объем данных увеличивается изо дня в день, потребность в...

Методы детектирования состязательных атак | Статья в журнале...

Ключевые слова: машинное обучение, глубокое обучение, состязательные атаки, защита от состязательных атак.

Выберем случайным образом небольшое количество изображений из тестового набора набора данных, обозначим их как , обозначим также через i-ое изображение.

Похожие статьи

Алгоритм создания модели краткосрочного прогнозирования...

В качестве исходных данных было взято почасовое энергопотребление за два рабочих дня

Для обучения достаточны данные по почасовому потреблению за двое предыдущих суток.

Для обучения нейронной сети используется алгоритм обратного распространения ошибки.

К задаче прогнозирования энергопотребления с помощью...

В случае прогнозирования энергопотребления необходимо иметь данные о таких

Исходные данные по энергопотреблению имеют значения за период с 01.01.2010 по 31.03.2011.

Обучение сети происходило с помощью алгоритма Левенберга — Маркуардта.

Особенности изучения способа тестирования базового пути...

Рис. 3. Потоковый граф. Исследование стратегий тестирования программного... программное обеспечение, структурное тестирование, тестирование, программный продукт, данные.

Разработка алгоритма анализа данных с помощью машинного...

Библиографическое описание: Гришин, А. П. Разработка алгоритма анализа данных с помощью машинного обучения для контроля тренировочного процесса / А

Для прогнозирования было необходимо рассмотреть подробнее точность прогнозирования с частотой ошибки, в таблице...

Исследование показателей качества и быстродействия поиска...

Примером служат задачи поиска изображений по базе данных, распознавания объектов на сцене

Исходя из того, какой объект представляет собой опорную точку, все алгоритмы поиска

Для тестирования был составлен набор изображений, которые имеют деформации...

Кодирование категориальных данных для использования...

В большинстве алгоритмов машинного обучения набор данных может содержать текстовые или категориальные значения (в основном

Следовательно, основная задача, стоящая перед аналитиком, заключается в том, чтобы преобразовать текстовые/категориальные данные в...

Алгоритмы кластеризации в машинном обучении

Системы машинного обучения позволяют быстро применять знания, полученные при обучении на больших наборах данных, что

Машинное обучение — одна из самых популярных технологий в 2020 г., поскольку объем данных увеличивается изо дня в день, потребность в...

Методы детектирования состязательных атак | Статья в журнале...

Ключевые слова: машинное обучение, глубокое обучение, состязательные атаки, защита от состязательных атак.

Выберем случайным образом небольшое количество изображений из тестового набора набора данных, обозначим их как , обозначим также через i-ое изображение.

Задать вопрос