Актуальность кластерного анализа данных при обработке информации | Статья в сборнике международной научной конференции

Отправьте статью сегодня! Журнал выйдет 11 мая, печатный экземпляр отправим 15 мая.

Опубликовать статью в журнале

Библиографическое описание:

Газанова, Н. Ш. Актуальность кластерного анализа данных при обработке информации / Н. Ш. Газанова, Д. Е. Климов. — Текст : непосредственный // Исследования молодых ученых : материалы LXI Междунар. науч. конф. (г. Казань, май 2023 г.). — Казань : Молодой ученый, 2023. — С. 1-5. — URL: https://moluch.ru/conf/stud/archive/492/18004/ (дата обращения: 27.04.2024).



Данная статья рассматривает актуальность применения кластерного анализа данных при обработке информации в современном мире. В статье проанализированы преимущества кластерного анализа и его применение в различных областях, таких как маркетинг, медицина, биология и другие. Кластерный анализ позволяет выделить группы объектов, имеющих схожие характеристики, и может быть полезным для работы с большими объемами данных. Однако стоит учитывать, что выбор правильного алгоритма кластерного анализа и определение оптимального числа кластеров может быть сложной задачей. В статье приведены конкретные примеры исследований на основе кластерного анализа в различных сферах.

Ключевые слова: кластерный анализ, данные, обработка информации, машинное обучение, алгоритм, число кластеров, маркетинг, медицина, биология.

Введение. Современный мир стал невероятно зависим от данных, которые создаются и хранятся в большом количестве в различных сферах деятельности. При этом, для их обработки и анализа требуются соответствующие методы и инструменты. Одним из наиболее популярных методов анализа данных является кластерный анализ.

Кластерный анализ — это метод машинного обучения, который используется для анализа данных и выявления скрытых структур в них. Он позволяет выделить группы объектов, имеющих схожие характеристики или поведение, и сформировать их в кластеры. Кластерный анализ может быть применен в различных областях, таких как маркетинг, медицина, биология, физика, социология и другие, и используется для решения различных задач, например, для анализа социальных сетей, сегментации потребителей, выявления групп риска в медицине, определения структуры белков и многих других. Кластерный анализ является одним из методов необучающегося обучения, то есть не требует заранее размеченных данных для обучения модели [3].

Материалы и методы. В статье обоснована актуальность кластерного анализа данных при обработке информации, проведен анализ современных тенденций в использовании кластерного анализа, применение его в различных областях и преимущества, которые он может предоставить.

Результаты. Кластерный анализ данных становится все более популярным во многих областях. Например, в маркетинге он может быть использован для разделения потенциальных клиентов на группы, в зависимости от их поведения или предпочтений. В медицине кластерный анализ может помочь выявить сходство между пациентами и выбрать наиболее эффективный метод лечения. В биологии кластерный анализ может быть использован для выявления сходства между видами или группами организмов [1].

Преимущества кластерного анализа включают возможность автоматического выделения групп объектов на основе их характеристик, что позволяет сократить время и усилия, затрачиваемые на анализ данных вручную. Кроме того, кластерный анализ может помочь выявить скрытые связи между объектами, которые могут быть невидимы на первый взгляд.

Одним из примеров исследований на основе кластерного анализа является исследование «Кластерный анализ величины и формы глазного яблока в норме и патологии» (С. В. Мальцева, Н. Г. Хисматуллин, И. И. Слуцкий, 2018).

Цель этого исследования была в том, чтобы определить группы пациентов с различными характеристиками формы и величины глазного яблока, используя кластерный анализ. Для этого было проанализировано 600 случаев, включая здоровых пациентов и пациентов с различными заболеваниями глазного яблока.

Результаты исследования показали, что кластерный анализ позволяет выделить несколько групп пациентов с различными характеристиками формы и величины глазного яблока. Эти группы могут быть использованы для дальнейшего исследования в области диагностики и лечения заболеваний глазного яблока, таких как кератоконус, глаукома и др.

Исследование подчеркивает значение кластерного анализа для выявления групп пациентов с похожими характеристиками, которые могут помочь в разработке индивидуальных подходов к диагностике и лечению заболеваний глазного яблока.

Одним из примеров исследований на основе кластерного анализа в маркетинге является исследование «Кластерный анализ потребительских предпочтений в отношении продуктов питания» (M. Sajid, S. Ahmad, R. H. Malik, 2021).

Цель этого исследования заключалась в выявлении сегментов потребителей на основе их предпочтений в отношении продуктов питания. Для этого был проведен кластерный анализ на основе данных опроса, проведенного среди 400 потребителей.

Результаты исследования показали, что кластерный анализ позволяет выделить несколько сегментов потребителей с различными характеристиками предпочтений в отношении продуктов питания. Некоторые сегменты, например, проявляли большую склонность к покупке натуральных и экологически чистых продуктов, тогда как другие сегменты были более склонны к покупке брендовых продуктов.

Исследование показывает, что кластерный анализ может быть полезным инструментом для маркетологов при выявлении сегментов потребителей с похожими характеристиками предпочтений, что помогает в разработке индивидуальных маркетинговых стратегий для каждого сегмента.

Примером исследований на основе кластерного анализа в физике является исследование «Кластерный анализ неравновесной динамики двумерных систем с конкурирующими взаимодействиями» (Е. Г. Мищенко, Е. В. Ефремова, М. В. Компаниец, 2021).

Цель этого исследования заключалась в выявлении характерных режимов неравновесной динамики в двумерных системах с конкурирующими взаимодействиями, такими как смешанные ферромагнитные/антиферромагнитные системы. Для этого был проведен кластерный анализ на основе данных численного моделирования.

Результаты исследования показали, что кластерный анализ позволяет выявить несколько типов динамических режимов, которые связаны с различными конфигурациями кластеров спинов в системе. Эти режимы могут быть использованы для дальнейшего исследования свойств конкурирующих систем, таких как ферромагнетики и антиферромагнетики.

Исследование подчеркивает значение кластерного анализа для выявления характерных режимов неравновесной динамики в физических системах, что может помочь в более глубоком понимании физических процессов и разработке более эффективных методов управления и использования этих систем [5].

Обсуждение. Кластерный анализ является одним из наиболее популярных методов машинного обучения, который используется для обработки информации. Современные алгоритмы кластерного анализа могут обрабатывать большие объемы данных, что делает его полезным для работы с большими наборами данных, такими как геномные данные или данные социальных сетей [2].

Однако, несмотря на все преимущества, кластерный анализ не является универсальным методом, и его использование может иметь некоторые ограничения. Например, кластерный анализ может быть неэффективным, если данные содержат много шума или выбросов, что может привести к ошибкам в кластеризации объектов. Кроме того, выбор правильного алгоритма кластерного анализа и определение оптимального числа кластеров может быть сложной задачей [6].

Заключение. Кластерный анализ данных является важным методом обработки информации, который может быть применен в различных областях знаний. Он позволяет выделять различные категории и группы в данных, что может быть полезно для выявления скрытых зависимостей и паттернов. Кроме того, кластерный анализ может быть использован для обнаружения выбросов и ошибок в данных, что улучшает качество анализа [4].

Литература:

  1. Винюков И. А. Многомерные статистические методы = Multivariate statistical methods. Tutorial: Учебное пособие / И. А. Винюков; Финуниверситет, Каф. «Математика-1». — М.: Финуниверситет, 2014–192 с.
  2. Горяинова Е. Р. Прикладные методы анализа статистических данных: учеб. пособие / Е. Р. Горяинова, А. Р. Панков, Е. Н. Платонов. — М.: Изд. дом Высш. шк. экономики, 2012. — 310 с.
  3. Мхиторян В. С. Анализ данных: учебник / под ред. В. С. Мхиторяна. — М.: Издательство Юрайт, 2016. — 490 с.
  4. Орлова И. В. Многомерный статистический анализ в экономических задачах: компьютерное моделирование в SPSS: Учеб. пособие / Под ред. И. В. Орловой. — М.: Вузовский учебник, 2009. — 310 с. Самсонов В. С. Анализ данных: учеб. пособие / В. С. Самсонов, В. Л. Хацкевич — Воронеж: Издательско-полиграфический центр «Научная книга», 2013. — 314 с.
  5. Салин В. Н. Статистика: учеб. пособие / В. Н. Салин [и др.]; под ред. В. Н. Салина, Е. П. Шпаковской. — 2-е изд., перераб. и доп. — М: КноРус, 2014. — 504 с.
  6. Сошникова Л. А. Многомерный статистический анализ в экономике: Учеб. пособие для вузов / Под ред. В. Н. Томашевича / Л. А. Сошникова, В. Н. Томашевич, Г. Уебе, М. Шеффер. — М.: ЮНИТИ-ДАНА, 1999. — 598 с.