Большие данные (Big Data) и наука о данных (Data Science): прогрессивные тренды современности | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 25 января, печатный экземпляр отправим 29 января.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №27 (317) июль 2020 г.

Дата публикации: 04.07.2020

Статья просмотрена: 630 раз

Библиографическое описание:

Порошин, И. Е. Большие данные (Big Data) и наука о данных (Data Science): прогрессивные тренды современности / И. Е. Порошин. — Текст : непосредственный // Молодой ученый. — 2020. — № 27 (317). — С. 59-61. — URL: https://moluch.ru/archive/317/72321/ (дата обращения: 16.01.2025).



В статье рассматриваются основные аспекты, получившего широкое распространение в последнее время, феномена больших данных. Отдельное внимание уделено науке о данных, появление которой явилось следствием геометрического роста информации в современном и мире и технологий ее обработки. Также рассмотрены особенности и специфика новой профессии — инженер, работающий с данными. Особый акцент сделан на перспективах и возможностях использования в современном мире машинного обучения.

Ключевые слова: большие данные, наука о данных, машинное обучение, искусственные нейронные сети.

Современный мир в эпоху информатизации и глобализации развивается стремительными темпами, поток данных и их количество увеличивается в геометрической прогрессии. Все это приводит к возникновению нового феномена, получившего в науке и практике название «большие данные».

Большие данные (Big Data) — таким термином принято обозначать совокупность различных методов, технологий для сбора, обработки неструктурированных и структурированных массивов данных значительного размера. Буквально несколько лет назад Big Data представляло собой инновационное направление, которое использовалось только в сфере высоких технологий. На сегодняшний день большие данные получили широкое развитие во всех сферах и областях человеческой жизни, встречаются и находят свое применение как в коммерческих, так и некоммерческих средах [1, с. 34].

Для сбора и обработки больших данных разработаны специальные программные комплексы и технологии. Более того, создаются и успешно работают компании, которые собирают и продают данные — все это уже стало частью современного бизнеса. Широкое использование Big Data привело к возникновению нового течения — науки о данных (Data Science). В настоящее время многие крупные корпорации применяют Data Science, чтобы произвести хорошее впечатление на своих клиентов, предоставляя персональные предложения. В качестве яркого примера можно привести сервис Google AdSense, который собирает информацию о пользователях для показа контекстной рекламы [2, с. 19].

Очевидно, что наука о данных породила спрос на новые профессии в данной сфере, одной из которых является Data Scientist. Data Scientist — инженер, работающий с данными, обладающий навыками математика, программиста и аналитика. Data Science в последние годы можно назвать профессией, которая находится в мейнстриме науки и техники. Специалисты, которые хорошо владеют математическим аппаратом, ориентируются в сфере программирования — очень востребованы на рынке труда.

Рассматривая более подробно особенности данной профессии, можно отметить следующее. Data Scientist — это специалист, неразрывно работающий с математикой, будь то математическая статистика, теория вероятностей или линейная алгебра. Плюс ко всему, эти знания нужно уметь применять, используя те или иные программные средства — во многом это и отличает математика от специалиста по работе с данными. Data Scientist также может работать в сфере машинного обучения.

Обобщая вышеизложенное, следует отметить, что инженер, работающий с данными, это специалист, который охватывает множество направлений в сфере информационных технологий, в том числе, аналитику, бизнес-аналитику, машинное обучение и многое другое. При этом каждое из этих направлений может представлять собой и отдельную профессиональную сферу Data Sceince.

В процессе исследования особенностей Big Data и перспектив развития Data Science, особый акцент по мнению автора, необходимо сделать на такой сфере как машинное обучение. Суть машинного обучения сводится к извлечению знаний из данных. Это научная область, которая находится на пересечении математической статистики, искусственного интеллекта и компьютерных наук, и также известная как прогнозная аналитика или статистическое обучение [3, с. 13].

Машинное обучение с точки зрения программирования — это обучение определенной компьютерной модели каким-либо действиям. В общем смысле это алгоритмы обучения с учителем — системе на вход подается некоторый набор данных и информация о том, что необходимо получить на выходе. Если же в структуре этой модели лежит многослойная искусственная нейронная сеть — речь идет о глубоком машинном обучении. Под искусственной нейронной сетью обычно понимают математическую модель, способную обучаться и решать поставленные перед ней задачи [4, с. 82].

Приведем несколько примеров задач, которые могут быть решены с помощью алгоритмов машинного обучения с учителем:

– определение почтового индекса по рукописным цифрам на конверте;

– нахождение доброкачественности опухоли на основе медицинских изображений;

– обнаружение мошеннической деятельности в сделках по кредитным картам [3, с. 15];

– прогнозирование отказов высокотехнологичного и сложного промышленного оборудования;

– идентификация и распознавание изображений, полученных беспилотными летательными аппаратами.

Подводя итоги проведенного исследования, можно сделать следующие выводы. Появление большого количества данных в цифровом формате, технологий их хранения и вычисления, математических инструментов анализа приводит к трансформации бизнес-процессов. Очевидно, что одновременно со стремительным накоплением информации быстрыми темпами развиваются и технологии их анализа, также возникают новые направления в исследовательской плоскости, такие, например, как наука о данных (Data Science). Data Science представляет собой достаточно обширную сферу, включающую в себя десятки видов деятельности, способную решать огромное количество задач. Именно этот факт делает науку о данных важной для современного мира.

Перспективы дальнейших исследований связаны не только с рисками и сложностями применения Big Data, но и с поиском инсайтов, которые могут создать добавленную ценность для компаний или полезные сервисы для граждан.

Литература:

1. Lee R. Big Data, Cloud Computing, and Data Science Engineering. — Cham: Springer. — 2020. — 214 p.

2. Силен Д., Мейсман А., Али М. Основы Data Science и Big Data. Python и наука о данных. — СПб.: Питер. — 2017. — 336 с.

3. Мюллер А., Гвидо С. Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными. — М.: Вильямс. — 2017. — 393 с.

4. Cheng Q., Li H., Wu Q., Ngan K. Hybrid-Loss Supervision for Deep Neural Network. — Neurocomputing. — 2020. — Vol. 388. — P. 78–89.

Основные термины (генерируются автоматически): машинное обучение, данные, наука, современный мир, математическая статистика, особый акцент, сфера.


Похожие статьи

Анализ влияния цифровой экономики на качество человеческих ресурсов

В статье рассмотрены вопросы, касающиеся влияния цифровой экономики на человеческие ресурсы. В качестве методов исследования были выбраны методы анализа и синтеза, приемы табличного представления данных. Человеческий капитал, а именно способность спе...

Экономика знаний как фактор повышения конкурентоспособности предприятия малого бизнеса в условиях глобальной конкуренции в строительной отрасли

Статья раскрывает одну из основных тенденций в мировой экономике, а именно возрастание роли экономики знаний в условиях глобальной конкуренции. Сегодня именно производство знаний служит основным источником роста экономики в развитых странах. О темпах...

Бизнес-аналитика и большие данные

Данная научная статья рассматривает роль и влияние больших данных в сфере бизнес-аналитики. С развитием технологий и увеличением объемов данных, предприятия сталкиваются с потребностью в эффективных инструментах для анализа и интерпретации информации...

Инновационные подходы к рекламе в цифровой среде

В статье автор исследует современные инновационные подходы к рекламе в цифровой среде, акцентируя внимание на значении платформ DSP и DMP, а также на использовании искусственного интеллекта и машинного обучения для повышения эффективности рекламных к...

Использование современных технологий в борьбе с незаконным наркооборотом

В статье автор рассматривает роль передовых технологий в процессе расследования наркопреступлений. Основное внимание уделяется трем ключевым направлениям: цифровой форензике, анализу больших данных и применению искусственного интеллекта. Автор подроб...

Big Data. Особенности и роль в современном бизнесе

В статье рассматриваются основные понятия, связанные с big data, основы и принципы работы с методами и подходами больших данных. Анализируются текущие тенденции на современном рынке предоставляемых услуг и продуктов, а также в каких случаях могут при...

Опыт использования образовательных технологий в современных практиках профессионального образования

Современное профессиональное образование меняется под влиянием образовательных технологий. Цель данной статьи — раскрыть возможности современных образовательных технологий как инструментов профессионального обучения. Выделены характерные черты соврем...

Управление информационными рисками в организации

В статье рассматриваются понятие и классификация информационных рисков, уточняется целесообразность управления рисками в различных организациях, предлагаются основные мероприятия по управлению рисками в коммерческих организациях. Статья посвящена акт...

Технические инновации и их значение для экономики

В статье приводится понятие, общая характеристика инновационных разработок в сфере экономики. Обосновывается преимущества использования технологии Блокчейн, раскрывается содержание этого понятия. Аргументировано, что применение децентрализованной баз...

Перспективы использования медиатехнологий в воспитании учащихся общеобразовательной школы

Развитие медиа технологий определяет новый вектор педагогики, а расширение использования информационно-коммуникационных технологий в обучении уже показало свою эффективность. Однако, перспективы применения многих новых технологий, в частности социаль...

Похожие статьи

Анализ влияния цифровой экономики на качество человеческих ресурсов

В статье рассмотрены вопросы, касающиеся влияния цифровой экономики на человеческие ресурсы. В качестве методов исследования были выбраны методы анализа и синтеза, приемы табличного представления данных. Человеческий капитал, а именно способность спе...

Экономика знаний как фактор повышения конкурентоспособности предприятия малого бизнеса в условиях глобальной конкуренции в строительной отрасли

Статья раскрывает одну из основных тенденций в мировой экономике, а именно возрастание роли экономики знаний в условиях глобальной конкуренции. Сегодня именно производство знаний служит основным источником роста экономики в развитых странах. О темпах...

Бизнес-аналитика и большие данные

Данная научная статья рассматривает роль и влияние больших данных в сфере бизнес-аналитики. С развитием технологий и увеличением объемов данных, предприятия сталкиваются с потребностью в эффективных инструментах для анализа и интерпретации информации...

Инновационные подходы к рекламе в цифровой среде

В статье автор исследует современные инновационные подходы к рекламе в цифровой среде, акцентируя внимание на значении платформ DSP и DMP, а также на использовании искусственного интеллекта и машинного обучения для повышения эффективности рекламных к...

Использование современных технологий в борьбе с незаконным наркооборотом

В статье автор рассматривает роль передовых технологий в процессе расследования наркопреступлений. Основное внимание уделяется трем ключевым направлениям: цифровой форензике, анализу больших данных и применению искусственного интеллекта. Автор подроб...

Big Data. Особенности и роль в современном бизнесе

В статье рассматриваются основные понятия, связанные с big data, основы и принципы работы с методами и подходами больших данных. Анализируются текущие тенденции на современном рынке предоставляемых услуг и продуктов, а также в каких случаях могут при...

Опыт использования образовательных технологий в современных практиках профессионального образования

Современное профессиональное образование меняется под влиянием образовательных технологий. Цель данной статьи — раскрыть возможности современных образовательных технологий как инструментов профессионального обучения. Выделены характерные черты соврем...

Управление информационными рисками в организации

В статье рассматриваются понятие и классификация информационных рисков, уточняется целесообразность управления рисками в различных организациях, предлагаются основные мероприятия по управлению рисками в коммерческих организациях. Статья посвящена акт...

Технические инновации и их значение для экономики

В статье приводится понятие, общая характеристика инновационных разработок в сфере экономики. Обосновывается преимущества использования технологии Блокчейн, раскрывается содержание этого понятия. Аргументировано, что применение децентрализованной баз...

Перспективы использования медиатехнологий в воспитании учащихся общеобразовательной школы

Развитие медиа технологий определяет новый вектор педагогики, а расширение использования информационно-коммуникационных технологий в обучении уже показало свою эффективность. Однако, перспективы применения многих новых технологий, в частности социаль...

Задать вопрос