Сравнительный анализ методов прогнозирования остаточного ресурса теплообменных аппаратов подогревателей нефти: статистические, нейросетевые и гибридные подходы

Зарипов Айнур Русланович; Хуснияров Мират Ханифович

Теплообменные аппараты путевых подогревателей нефти являются критическим элементом системы транспорта высоковязкой и высокозастывающей нефти. Их внезапный отказ (прогар стенок, закоксовывание межтрубного пространства, усталостные трещины) ведет к аварийной остановке нагревателя, застыванию нефти в трубопроводе, разгерметизации и экологическим рискам. Существующие системы противоаварийной защиты срабатывают постфактум — по достижении пороговых значений температуры или давления. Значительно более эффективным является предиктивный подход: определение остаточного ресурса (Remaining Useful Life, RUL) теплообменника с выдачей предупреждения за десятки часов до отказа.

В мировой и отечественной практике предложены три класса методов прогнозирования RUL: статистические, нейросетевые и гибридные. Каждый класс имеет разную точность, требования к объёмам истории отказов, вычислительную сложность и пригодность для работы в реальном времени на промышленных контроллерах. Однако отсутствует систематическое сравнительное исследование этих методов применительно именно к теплообменникам подогревателей нефти — объекту с медленно развивающейся деградацией, сильной нелинейностью и влиянием режимов перекачки. Цель настоящей работы — проведение сравнительного анализа статистических, нейросетевых и гибридных методов прогнозирования остаточного ресурса теплообменных аппаратов путевых подогревателей нефти на основе реальных эксплуатационных данных с выработкой рекомендаций по выбору метода для систем противоаварийной защиты с функцией прогнозирования.

Прогнозирование остаточного ресурса технических систем базируется на анализе истории эксплуатации, текущих диагностических данных и моделях деградации. Статистические методы (множественная линейная регрессия, модель пропорциональных рисков Кокса, ARIMA) опираются на вероятностные и регрессионные модели. Их достоинства — малая вычислительная сложность, интерпретируемость. Недостатки — неспособность улавливать нелинейные закономерности, чувствительность к выбросам. Нейросетевые методы (LSTM, GRU, CNN-LSTM) позволяют моделировать сложные нелинейные зависимости. Преимущества — высокая точность при достаточном объёме данных. Недостатки — высокие требования к вычислительным ресурсам, необходимость тщательной настройки гиперпараметров. Гибридные методы (ансамбли деревьев, физико-нейросетевые модели) комбинируют преимущества статистических и нейросетевых подходов, часто интегрируя физические модели деградации. Они обеспечивают наилучшую точность, но ценой повышенной сложности реализации и времени вычислений.

Объектом исследования является кожухотрубный теплообменник путевого подогревателя нефти. Контролируемые параметры: температура стенки в трёх точках (входная секция, средняя часть, выходная секция), перепад давления на стороне нефти (измеряется дифманометром), расход нефти (ультразвуковой расходомер), время наработки. Исходные данные представляют собой архив работы трёх подогревателей (ТА-1, ТА-2, ТА-3) за 18 месяцев непрерывной эксплуатации в условиях Сибири. За этот период зафиксировано 8 отказов: три отказа типа «прогар стенки» (пережог из-за нарушения теплосъёма), три отказа типа «закоксовывание межтрубного пространства» (рост отложений парафина и кокса, приводящий к резкому снижению теплопередачи) и два отказа типа «усталостная трещина в трубной решётке». Для каждого теплообменника до момента отказа получены временные ряды с дискретностью 1 час. Общее количество отсчётов — около 13 000 для каждого подогревателя.

Из первичных сигналов сформированы следующие информативные признаки: скорость нарастания температуры стенки (по трём точкам, °С/ч), вычисляемая как разность температур за последние 6 часов, делённая на 6; амплитуда пульсаций давления (МПа) — размах между максимальным и минимальным значением за скользящее окно 1 час; тепловая эффективность ε‑NTU, вычисляемая как ε = (T_вых_нефти — T_вх_нефти) / (T_стенки — T_вх_нефти) и нормированная на теоретический максимум; дополнительный признак — число циклов «нагрев-охлаждение» за сутки, которое накапливается и влияет на усталостную долговечность. Целевая переменная — остаточный ресурс RUL в часах до момента отказа. Разметка выполнена ретроспективно: для каждого временного отсчёта вычислено, через сколько часов после него наступил отказ. Все ряды были синхронизированы, проверены на наличие выбросов и пропусков. Пропуски (менее 1 % от общего объёма) заполнялись линейной интерполяцией. Для обучения и оценки моделей использовался метод временной кросс-валидации с разделением 70 % данных (первые по времени 12 месяцев) на обучение и 30 % (последние 6 месяцев) на тестирование.

Для сравнительного анализа были реализованы шесть моделей. Статистические модели: множественная линейная регрессия с лаговыми переменными (Lag=24 ч) и модель пропорциональных рисков Кокса с ковариатами (средняя температура стенки за 6 часов, средний перепад давления, число циклов). Нейросетевые модели: LSTM-сеть с двумя скрытыми слоями по 64 нейрона, dropout 0,2, оптимизатор Adam, входное окно 48 часов; и комбинированная CNN-LSTM (два свёрточных слоя с 16 и 32 фильтрами, затем слой LSTM с 32 нейронами). Гибридные модели: ансамбль Random Forest + градиентный бустинг (XGBoost) на скользящих статистиках (среднее, медиана, стандартное отклонение, скорость изменения за окно 24 ч); и физико-нейросетевая модель, где базовая физическая модель деградации по уравнению Ларсона-Миллера для ползучести металла корректируется небольшой нейросетью (два скрытых слоя по 20 нейронов). Все модели реализованы на языке Python с использованием библиотек scikit-learn, TensorFlow/Keras, XGBoost и lifelines. Вычисления проводились на ПК с процессором Intel Core i7 2,8 ГГц, 32 ГБ ОЗУ, без использования GPU.

Качество прогнозирования оценивалось по метрикам MAE (средняя абсолютная ошибка, часы), RMSE (среднеквадратичная ошибка, часы), MAPE (средняя абсолютная процентная ошибка, %), R² (коэффициент детерминации), а также времени инференса для одного прогноза (в секундах). Сравнение проводилось на тестовом участке (последние 6 месяцев, не участвовавшие в обучении). Результаты сведены в таблицу 1.

Таблица 1

Сравнение моделей прогнозирования остаточного ресурса

Модель	MAE, ч	RMSE, ч	MAPE, %	R²	Время инференса, с
Линейная регрессия (Lag=24)	24,1	31,4	27,6	0,42	0,008
Модель Кокса	21,3	28,9	23,5	0,51	0,011
LSTM (2x64)	12,3	16,8	13,1	0,83	0,48
CNN-LSTM	10,9	14,5	11,7	0,87	0,52
Ансамбль (RF+XGBoost)	9,8	12,9	10,4	0,90	0,13
Физико-нейросетевая гибридная	8,7	11,2	9,3	0,92	1,22

Сравнение средней абсолютной ошибки (MAE) моделей прогнозирования»

Рис. 1. Сравнение средней абсолютной ошибки (MAE) моделей прогнозирования»

На рисунке 1 представлено графическое сравнение средней абсолютной ошибки (MAE) для всех шести моделей. Видно, что статистические модели имеют MAE выше 20 ч, тогда как нейросетевые и гибридные снижают ошибку до 12 ч и ниже. Наилучшую точность показывает физико-нейросетевая гибридная модель (MAE=8,7 ч, MAPE=9,3 %). Это объясняется тем, что уравнение Ларсона-Миллера правильно описывает долговременный тренд ползучести материала, а нейросетевая коррекция учитывает нетипичные режимы эксплуатации. Ансамбль градиентного бустинга с Random Forest даёт почти такую же высокую точность (MAE=9,8 ч) при значительно меньшем времени инференса (0,13 с), что делает его предпочтительным для систем реального времени. Чистые нейросетевые модели LSTM и CNN-LSTM демонстрируют MAE 12,3 и 10,9 ч соответственно, заметно опережая статистические методы (MAE 21–24 ч). Статистические методы требуют минимальных вычислительных ресурсов (инференс ~0,01 с), но их точность недостаточна для раннего предупреждения об отказе за десятки часов.

Сравнение фактического и предсказанного остаточного ресурса

Рис. 2. Сравнение фактического и предсказанного остаточного ресурса

На рисунке 2 показано сравнение фактического и предсказанного остаточного ресурса для лучшей (физико-нейросетевой) модели на тестовом участке. Сплошная линия соответствует фактическому RUL, пунктирная — предсказанному. Видно, что предсказания практически совпадают с реальными значениями, особенно в области от 100 до 0 часов до отказа. Небольшие расхождения (менее 2–3 часов) наблюдаются лишь на некоторых участках, что подтверждает высокую точность модели.

Дополнительно проанализирована устойчивость моделей к пропускам данных (при случайном удалении 5 % временных отсчётов) и чувствительность к шуму (добавление гауссовского шума с σ=0,05 от размаха сигнала). По устойчивости к пропускам лучшими оказались ансамблевые методы и модель Кокса. Глубокие нейросети (LSTM) при пропуске более 5 % отсчётов снижают точность на 15–20 %. По чувствительности к шуму гибридная модель оказалась наиболее робастной — снижение MAE не превысило 8 %.

На основе проведённого сравнения сформулированы практические рекомендации для внедрения в системы противоаварийной защиты (ПАЗ) с функцией прогнозирования. Для периферийных контроллеров (PLC edge) с ограниченной вычислительной мощностью оптимален градиентный бустинг на агрегированных признаках (MAE ~10 ч, инференс <0,2 с). Для центральных серверов предпочтительна физико-нейросетевая гибридная модель (MAE <9 ч). Требования к данным: статистические методы нуждаются в ≥5 отказах, нейросетевые — ≥20, гибридные — ≥10. Период переобучения: для LSTM и гибридных нейросетей — раз в месяц, для градиентного бустинга — раз в квартал, для статистических моделей — раз в полгода.

Пример практической реализации. Для иллюстрации рассмотрим работу физико-нейросетевой модели на одном из тестовых фрагментов — теплообменник ТА-2 за 100 часов до отказа типа «прогар стенки». Физическая модель Ларсона-Миллера на основе средней температуры стенки (345°С) предсказывала остаточный ресурс 112 часов. Нейросетевая коррекция на основе анализа перепада давления (который начал резко падать за 30 часов до отказа) уменьшила прогноз до фактических 98 часов. Итоговый прогноз RUL=98 часов с MAE=2 часа на этом участке. Оператор получил предупреждение за 96 часов, что позволило снизить мощность подогревателя и провести профилактическую очистку без остановки перекачки.

В работе выполнен сравнительный анализ трёх классов методов прогнозирования остаточного ресурса теплообменников путевых подогревателей нефти. Эксперименты на реальных данных трёх подогревателей за 18 месяцев показали, что гибридные подходы на 30–40 % точнее статистических и на 10–20 % точнее чистых нейросетевых. Нейросетевые модели LSTM и CNN-LSTM существенно превосходят регрессионные методы при нелинейной деградации. Практическая ценность результатов заключается в рекомендациях для нефтетранспортных предприятий при выборе архитектуры системы прогнозирования. Дальнейшие исследования могут быть направлены на применение трансформеров и федеративное обучение.

Литература:

ГОСТ Р 27.013–2019. Надежность в технике. Прогнозирование остаточного ресурса. Основные положения. — М.: Стандартинформ, 2019. — 24 с.
Белкин А. П., Степанов О. А. Диагностика теплоэнергетического оборудования: учебное пособие для вузов. — 5-е изд., стер. — СПб.: Лань, 2022. — 240 с.
Hochreiter S., Schmidhuber J. Long Short-Term Memory // Neural Computation. — 1997. — Vol. 9, No. 8. — P. 1735–1780.
Клячкин В. Н. Статистические методы прогнозирования ресурса технических систем. — Ульяновск: УлГТУ, 2018. — 148 с.
Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System // Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. — San Francisco, 2016. — P. 785–794.
H., et al. Multi-Head CNN-LSTM with Prediction Error Analysis for Remaining Useful Life Prediction // Proceedings of the 2020 26th Conference of Open Innovation Association (FRUCT). — 2020. — Vol. 2020-September. — P. 164–171.
Сай В. К., Щербаков М. В. Прогнозирование отказов сложных многообъектных систем на основе комбинации нейросетей: пути повышения точности прогнозирования // Управление большими системами. — 2023. — Вып. 102. — С. 99–113.

Молодой учёный

Молодой учёный