Машинное обучение для прогнозирования динамики качества воздуха в городских условиях | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 16 ноября, печатный экземпляр отправим 20 ноября.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №45 (544) ноябрь 2024 г.

Дата публикации: 04.11.2024

Статья просмотрена: 2 раза

Библиографическое описание:

Горшкова, А. П. Машинное обучение для прогнозирования динамики качества воздуха в городских условиях / А. П. Горшкова. — Текст : непосредственный // Молодой ученый. — 2024. — № 45 (544). — URL: https://moluch.ru/archive/544/118953/ (дата обращения: 05.11.2024).

Препринт статьи



В данной работе представлен метод прогнозирования качества воздуха в городских условиях с применением машинного обучения на глобальных данных о качестве воздуха. Модель на основе алгоритма случайного леса предсказывает концентрации PM2.5.

Ключевые слова: качество воздуха, случайный лес, MSE, здоровье населения, оценка модели, уровень загрязнения, город.

Исследование проводилось на основе глобального набора данных о качестве воздуха, который содержит ежедневные замеры концентраций различных загрязняющих веществ для многочисленных городов и стран по всему миру [1]. В качестве целевой переменной для модели была выбрана концентрация частиц PM2.5, так как именно она является ключевым показателем загрязненности воздуха и имеет непосредственное влияние на здоровье населения. В качестве признаков модели использовались временные и климатические факторы, такие как год, месяц, день, температура и влажность, поскольку они оказывают значительное влияние на уровень загрязнения воздуха.

Данные были разделены на обучающую и тестовую выборки для построения и оценки модели. Для предсказания концентрации PM2.5 была использована модель случайного леса, которая показала высокий уровень точности. Оценка модели, включающая метрики средней квадратичной ошибки (MSE) и коэффициента детерминации (R²), продемонстрировала приемлемые значения, подтверждающие способность модели адекватно прогнозировать концентрации PM2.5. В таблице 1 представлен пример данных, использованных для обучения модели и выполнения прогнозов.

Таблица 1

Глобальный набор данных о качестве воздуха [1]

City

Country

Date

PM2.5

PM10

Bangkok

Thailand

2023–03–19

86.57

25.19

Istanbul

Turkey

2023–02–16

50.63

97.39

Rio de Janeiro

Brazil

2023–11–13

130.21

57.22

Berlin

Germany

2023–02–03

67.43

96.79

Bangkok

Thailand

2023–06–13

16.34

28.8

Рейтинг стран по прогнозируемому качеству воздуха

Рис. 1. Рейтинг стран по прогнозируемому качеству воздуха

Рейтинг городов по прогнозируемому качеству воздуха

Рис. 2. Рейтинг городов по прогнозируемому качеству воздуха

Прогнозируемое качество воздуха на разные промежутки времени

Рис. 3. Прогнозируемое качество воздуха на разные промежутки времени

Результаты

  1. Рейтинг стран и городов : Модель была использована для предсказания уровня PM2.5 в различных странах и городах. На основе этих прогнозов был построен рейтинг, показывающий топ-5 стран и городов с наилучшим качеством воздуха (т. е. наименьшее значение PM2.5). Рейтинг представлен на графиках (Рисунки 1 и 2), где видны страны (например, Франция, Южная Корея, Великобритания) и города (например, Париж, Сеул, Лондон), характеризующиеся относительно низким уровнем загрязнения PM2.5.
  2. Прогноз на будущее : Также был выполнен прогноз динамики PM2.5 на 30 дней вперед (Рисунок 3). На графике видно колебание уровней PM2.5, причем наиболее низкие значения ожидаются через две недели после начала прогноза, после чего уровень загрязнения постепенно возрастает. Такой подход позволяет городам и государствам заранее оценить возможные изменения в качестве воздуха и принимать проактивные меры по снижению загрязнения в периоды, когда ожидается его рост, обеспечивая тем самым защиту здоровья населения.

Заключение

Результаты исследования показывают, что использование методов машинного обучения на основе глобальных данных о качестве воздуха представляет собой эффективный инструмент для прогнозирования уровня загрязнения воздуха в городских условиях. Модель, построенная с применением алгоритма случайного леса, позволяет не только предсказывать концентрацию загрязняющих веществ, таких как PM2.5, но и выявлять страны и города с лучшими показателями качества воздуха. Такой подход дает возможность прогнозировать изменения уровня загрязненности в будущем, что особенно полезно для долгосрочного планирования и принятия мер. Прогнозирование позволяет городским властям и правительствам своевременно разрабатывать и внедрять стратегии по улучшению качества воздуха, тем самым снижая потенциальное воздействие загрязнения на здоровье населения и улучшая экологическую ситуацию в мегаполисах.

Литература:

1. Global Air Quality Dataset. — Текст: электронный // kaggle: [сайт]. — URL: https://www.kaggle.com/datasets/waqi786/global-air-quality-dataset (дата обращения: 02.11.2024).



Задать вопрос