Системный подход к выбору моделей для предсказания разрушения деталей на основе статистических данных | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 16 ноября, печатный экземпляр отправим 20 ноября.

Опубликовать статью в журнале

Авторы: ,

Научный руководитель:

Рубрика: Технические науки

Опубликовано в Молодой учёный №44 (543) ноябрь 2024 г.

Дата публикации: 02.11.2024

Статья просмотрена: 50 раз

Библиографическое описание:

Харечко, А. И. Системный подход к выбору моделей для предсказания разрушения деталей на основе статистических данных / А. И. Харечко, Е. Ю. Сушин. — Текст : непосредственный // Молодой ученый. — 2024. — № 44 (543). — URL: https://moluch.ru/archive/543/118890/ (дата обращения: 07.11.2024).



В статье описана методика работы с результатами испытаний деталей. С помощью методов машинного обучения удалось научиться предсказывать максимальное значение силы на растяжение, которую выдерживает деталь перед полным разрушением. Лучшую модель из исследуемых удалось выбрать с помощью инструментов системного инжиниринга. Предлагаемая методика работы с экспериментальными данными в дальнейшем может являться основой для моделей надёжности авиационных систем.

Ключевые слова: метод анализа иерархий, метод Гермейера, обработка данных, моделирование, машинное обучение, метрики, прочностные испытания, надёжность авиационных систем.

Введение

Использование компьютерного моделирования в авиастроении помогает добиться повышения качества изделий, снизить стоимость и сроки проектирования. Системный подход к безбумажному проектированию предполагает, что проектные решения проверяются моделированием на каждом этапе разработки [1]. Для сокращения стоимости и сроков проектирования нужно выбирать самые оптимальные решения ещё на ранних этапах. Компьютерное моделирование может облегчить поиск таких решений.

Системный инжиниринг — это междисциплинарный подход к разработке сложных технических систем, который позволяет учитывать взаимосвязи и рассматривать систему как единое целое. Инструменты системного инжиниринга позволяют проводить сравнение показателей, сложно сравнимых между собой напрямую, выбирать самые оптимальные решения по совокупности факторов. Одними из удобных инструментов системного инжиниринга являются метод анализа иерархий (МАИ) и метод Гермейера. Они позволяют проводить многокритериальную оценку альтернатив с учётом значимости каждого сравниваемого критерия.

При проектировании авиационной техники критически важно обеспечить заданные показатели надёжности систем. Это можно сделать за счёт повышения коэффициентов запаса и введения избыточности. Моделирование показателей надёжности сложных технических систем является нетривиальной задачей по причине большого количества разнородных факторов, которые необходимо учитывать. Для разработки моделей надёжности систем на основе экспериментальных данных об испытаниях отдельных компонентов предлагается использовать машинное обучение.

Постановка задачи

В данной работе предлагаемый подход опробован на примере записей, полученных при экспериментальном разрушении деталей на испытательной машине. С помощью методов машинного обучения можно предсказать максимальное значение силы на растяжение, которую выдерживает деталь перед полным разрушением. С точки зрения машинного обучения рассматриваемая задача является задачей регрессии — необходимо рассчитать значение одной непрерывной количественной переменной (максимальной силы) по известным характеристикам геометрии детали. С помощью методов системного инжиниринга необходимо выбрать оптимальный вариант обучения.

Таблица 1

Требования, функции, элементы решения

Требования

Функции

Элементы решения

Получить экспериментальные данные

Проведение эксперимента по разрушению детали с записью параметров

Универсальная испытательная машина «TIME WDW-300E»

Определить прочностные характеристики детали по её геометрическим параметрам

Определение прочности на разрыв решением задачи регрессии

DecisionTreeRegressor

RandomForestRegressor

LinearRegression

CatBoostRegressor

SVR

KNeighborsRegressor

Определить наиболее оптимальную модель машинного обучения

Сравнение доступных альтернатив по метрикам, полученным в результате обучения моделей, выбор лучшей модели для дообучения и дальнейшего использования

Метод анализа иерархий — поиск весов важности каждой метрики

Метод Гермейера — сравнение моделей с учетом весов важности метрик

Работа с данными

Рассматриваемые детали представляют собой пластины из алюминиево-магниевого сплава толщиной 1.9 мм с различными конфигурациями отверстий. Всего для эксперимента выбрано 40 деталей. Экспериментальное разрушение деталей выполнено на универсальной испытательной машине «TIME WDW-300E». В ходе испытаний программно установлена скорость нагружения 5 мм/мин. Основные характеристики испытательной машины:

— наибольшая предельная нагрузка: 300 кН;

— пределы погрешности силоизмерителя: ±1 %;

— диапазон скоростей нагружения: от 0.005 до 500 мм/мин;

— масса: не более 2000 кг.

Этапы работы с экспериментальными данными представлены на рис. 1. Сбор данных, выбор признаков для модели машинного обучения и выбор самой модели относятся к исследовательским этапам. После этих этапов необходимо совершенствование модели машинного обучения таким образом, чтобы достичь заданного качества предсказания. Это может происходить в несколько итераций.

Этапы работы с экспериментальными данными

Рис. 1. Этапы работы с экспериментальными данными

Для работы с экспериментальными данными создана консольная программа «Structural Failure Predictor» на языке Python 3. Программа осуществляет подготовку экспериментальных данных для работы с моделями машинного обучения, поиск лучшей модели и тестирование обученной модели. Программа загружает свои настройки из конфигурационного файла. Далее программа выполняет чтение единого файла с описанием всех испытаний и отдельных файлов для каждого испытания. Имеющиеся данные программа преобразует с учётом смещений нулей при измерении силы нагружения и деформации детали, рассчитывает дополнительные признаки. Программа выводит в отдельных окнах графики, позволяющие оценить подготовленные для обучения данные. Далее программа осуществляет поиск лучшей модели с помощью инструмента автоматизированного подбора гиперпараметров, а затем — тестирование лучшей модели с выводом результатов в консоль.

Сбор данных выполнен с помощью программы «WinWDW», которая позволяет полностью управлять процессом испытания детали. С момента начала нагружения до полного разрушения детали записываются следующие параметры с частотой 17 Гц:

— сила нагружения, кН;

— деформация детали по экстензометру, мм;

— перемещение траверсы машины, мм;

— время с момента начала нагружения, сек.

Записи разрушения деталей в координатах «сила растяжения — деформация», преобразованные программой «Structural Failure Predictor» с учётом смещений нулей, представлены на рис. 2.

Записи разрушения деталей

Рис. 2. Записи разрушения деталей

Экспериментальная зависимость максимальной силы нагружения детали от геометрии представлена на рис. 3. Диаграмма рассеяния показывает: чем меньше количество отверстий и диаметр каждого отверстия, тем больше максимальная сила нагружения.

Зависимость максимальной силы от геометрии детали

Рис. 3. Зависимость максимальной силы от геометрии детали

Для выбора подходящих для модели машинного обучения признаков можно воспользоваться матрицей корреляции. Матрица корреляции показывает взаимосвязи входных признаков между собой и с целевым признаком. Одним из перспективных алгоритмов расчёта коэффициентов корреляции является алгоритм «Phi_K» [2]. Матрица корреляции «Phi_K», сгенерированная программой «Structural Failure Predictor», представлена на рис. 4. При рассмотрении матрицы корреляции видно, что геометрические характеристики детали значительно влияют на максимальную силу нагружения.

Матрица корреляции «Phi_K»

Рис. 4. Матрица корреляции «Phi_K»

Программа «Structural Failure Predictor» делит имеющиеся данные на обучающую и тестовую выборку в заданном соотношении (3:1) и выполняет поиск лучшей модели, используя только обучающую выборку. При поиске лучшей модели программа записывает метрики оценки каждой модели — табл. 2. В таблице средние значения и среднеквадратичные отклонения (СКО) метрик оценки посчитаны по результатам кросс-валидации каждой модели. Средние и медианные абсолютные ошибки показывают отклонения предсказанных значений целевого признака от истинных значений. Коэффициент детерминации — это доля дисперсии целевого признака, объясняемая рассматриваемой моделью. Чем ближе коэффициент детерминации к единице, тем выше обобщающая способность модели.

Таблица 2

Метрики оценки моделей

Метрика

DecisionTreeRegressor

RandomForestRegressor

LinearRegression

CatBoostRegressor

SVR

KNeighborsRegressor

Средняя Mean Absolute Error, кН

0.598200

0.637564

0.649408

0.660813

0.918622

0.995760

СКО Mean Absolute Error, кН

0.205083

0.190433

0.196580

0.258555

0.468568

0.404001

Средняя Median Absolute Error, кН

0.438000

0.496029

0.454041

0.485839

0.809661

0.878400

СКО Median Absolute Error, кН

0.270067

0.171381

0.115725

0.317259

0.502971

0.516789

Средний коэффициент детерминации

0.734071

0.739488

0.605382

0.609362

0.371265

0.477092

СКО коэффициента детерминации

0.270970

0.241681

0.512143

0.483150

0.914493

0.496137

Среднее время обучения, сек

0.007353

0.188927

0.020060

0.968233

0.007634

0.009658

СКО времени обучения, сек

0.001041

0.008437

0.001907

0.094215

0.000698

0.000691

Среднее время предсказания, сек

0.006109

0.012034

0.005888

0.005760

0.004795

0.006268

СКО времени предсказания, сек

0.000477

0.000867

0.000472

0.000954

0.000405

0.000918

Оценка и сравнение альтернатив

Программа «Structural Failure Predictor» при работе алгоритма поиска лучшей модели рассчитала и вывела 10 метрик оценки. Большое количество разных метрик трудно для прямого человеческого восприятия. Далее проведена численная оценка важности каждой метрики с помощью метода анализа иерархий. Метод предполагает попарное сравнение важности всех метрик с помощью оценок по шкале от «подавляюще превосходит» до «подавляюще уступает». Результаты попарного сравнения записываются в матрицу, затем рассчитывают итоговый вес каждой метрики оценки — табл. 3. Чем больше значение веса метрики, тем более значимый вклад она вносит в выбор лучшей модели.

Таблица 3

Расчёт важности метрик оценки по МАИ

Метрики оценки

Вес

Средняя Mean Absolute Error, кН

0.245

СКО Mean Absolute Error, кН

0.040

Средняя Median Absolute Error, кН

0.200

СКО Median Absolute Error, кН

0.044

Средний коэффициент детерминации

0.210

СКО коэффициента детерминации

0.035

Среднее время обучения, сек

0.090

СКО времени обучения, сек

0.017

Среднее время предсказания, сек

0.100

СКО времени предсказания, сек

0.018

Далее проведена оценка моделей по методу Гермейера. Для использования этого метода необходимо преобразовать значения метрик оценки таким образом, чтобы более высокое значение соответствовало лучшему качеству модели. В исходном виде это справедливо лишь для среднего коэффициента детерминации, поэтому остальные метрики преобразованы по следующему закону (1):

;(1)

где — преобразованное значение метрики;

— исходное значение метрики.

Формула для оценки оптимальности каждой альтернативы по методу Гермейера (в долях от лучшего значения метрики) имеет вид (2):

;(2)

где — оценка оптимальности альтернативы;

— весовой коэффициент;

— лучшее значение метрики;

— текущее значение метрики.

Результаты расчёта оптимальности альтернатив по методу Гермейера для каждой модели машинного обучения представлены в табл. 4.

Таблица 4

Оценки оптимальности альтернатив по методу Гермейера

Метрика

DecisionTreeRegressor

RandomForestRegressor

LinearRegression

CatBoostRegressor

SVR

KNeighborsRegressor

Средняя Mean Absolute Error, кН

0.000

0.015

0.019

0.023

0.086

0.098

СКО Mean Absolute Error, кН

0.003

0.000

0.001

0.011

0.024

0.021

Средняя Median Absolute Error, кН

0.000

0.023

0.007

0.020

0.092

0.100

СКО Median Absolute Error, кН

0.025

0.014

0.000

0.028

0.034

0.034

Средний коэффициент детерминации

0.002

0.000

0.038

0.037

0.104

0.074

СКО коэффициента детерминации

0.004

0.000

0.018

0.017

0.026

0.018

Среднее время обучения, сек

0.000

0.087

0.057

0.090

0.003

0.022

СКО времени обучения, сек

0.006

0.016

0.011

0.017

0.000

0.000

Среднее время предсказания, сек

0.022

0.060

0.019

0.017

0.000

0.024

СКО времени предсказания, сек

0.003

0.010

0.003

0.011

0.000

0.010

Интегральный критерий Гермейера

0.064

0.225

0.173

0.270

0.369

0.401

Интерпретировать оценки оптимальности альтернатив по методу Гермейера можно следующим образом: чем меньше значение оценки, тем лучше альтернатива. Если значение оценки какой-то метрики равно нулю, то альтернатива является лидером по этой метрике. Интегральный критерий Гермейера можно вычислить как сумму оценок оптимальности метрик альтернативы.

Наименьшее значение интегрального критерия Гермейера показывает лучшую модель — это DecisionTreeRegressor [4]. Оценки метрик позволяют определить, что у этой модели средние и медианные ошибки предсказаний являются минимальными среди всех моделей. Также минимально среднее время обучения. При этом среднеквадратичные отклонения небольшие. Высокое значение коэффициента детерминации при кросс-валидации говорит о хорошей обобщающей способности модели.

Другой хорошей моделью является LinearRegression [4]. Значения оценок этой модели немного хуже по метрикам средних ошибок и по коэффициенту детерминации, однако у этой модели низкие среднеквадратичные отклонения ошибок.

Тестирование лучшей модели выполнено на тех данных, которые не были задействованы при обучении. При тестировании средняя абсолютная ошибка (Mean Absolute Error) максимального значения силы составила 0.711 кН. Сравнение полученного значения средней абсолютной ошибки с исходными данными (рис. 2) показывает, что результат удовлетворительный. Другой важной метрикой, рассчитанной при тестировании модели, является коэффициент детерминации. Значение коэффициента детерминации — 0.7925, следовательно, в 79.25 % случаев предсказание модели ближе к истине, чем простое среднее значение целевого признака.

Заключение

Таким образом, предлагаемый в работе подход опробован экспериментально. С помощью методов машинного обучения удалось научиться предсказывать максимальное значение силы на растяжение, которую выдерживает деталь перед полным разрушением. Лучшую модель из исследуемых удалось выбрать с помощью инструментов системного инжиниринга. Опробована методика работы с экспериментальными данными, которая в дальнейшем может являться основой для более сложных моделей надёжности авиационных систем.

Литература:

  1. Суздалева, Е. А. САПР в авиастроении и проблемы, возникающие при переходе на безбумажное проектирование / Е. А. Суздалева, А. О. Марченков // Вестник науки и образования. — 2019. — № 21 (75).
  2. Документация к библиотеке «Phi_K» [Электронный ресурс]. — 2024. — Режим доступа: https://phik.readthedocs.io/en/latest/, свободный (дата обращения 13.10.2024).
  3. А. А. Бородкин Системный инжиниринг для поиска технических решений. Сборник лекций, 6-е изд. / А. А. Бородкин, Г. А. Ефименко. — М.: МФТИ, 2019. — 142 с.
  4. Документация к библиотеке «Scikit-learn» [Электронный ресурс]. — 2024. — Режим доступа: https://scikit-learn.org/stable/, свободный (дата обращения 13.10.2024).
  5. Бринк Х. Машинное обучение / Х. Бринк, Д. Ричардс, М. Феверолф. — СПб.: Питер, 2017. — 336 с.
Основные термины (генерируются автоматически): лучшая модель, коэффициент детерминации, машинное обучение, время обучения, SVR, время предсказания, системный инжиниринг, данные, метрика оценки, целевой признак.


Ключевые слова

моделирование, метод анализа иерархий, обработка данных, машинное обучение, метрики, метод Гермейера, прочностные испытания, надёжность авиационных систем

Похожие статьи

Задать вопрос