В статье исследуется применение нейронных сетей для обработки данных и генерации контента в журналистике.
Ключевые слова: журналистика, генерация данных, нейронные сети
В цифровую эпоху нейронные сети широко используются в самых разных технических и социальных областях, включая журналистику данных. Революционные возможности в анализе и генерации информации значительно ускоряют процесс обработки медиаконтента. Понимание механизмов работы и эффективное применение специфических типов нейросетей в журналистике требует изучения их классификации и возможности адаптации под конкретные задачи. Задача усложняется быстрым развитием нейросетей, что повышает актуальность исследования и классификации существующих подходов [1, 5]. Одним из ключевых аспектов применения нейросетей в журналистике является также понимание их архитектуры, или топологии нейронной сети. Архитектура влияет на способ соединения искусственных нейронов, таким образом, на функциональность нейросетей. Наиболее распространенные классы нейросетей — сети с прямыми и рекуррентными связями. Различия между этими классами — ключевой фактор для оптимизации их использования. Особое внимание важно уделить анализу и критической оценке уже существующих подходов к классификации нейросетей, а также возможностям и задачам, которые они представляют в контексте современных медиатехнологий для адекватного выбора технологических решений.
Нейронные сети с прямыми связями (Feedforward Neural Network, FNN) представляют собой сети, в которых информация обрабатывается без обратных циклов в одном направлении — от входа к выходу. Количество слоев или соединений между нейронами в таких сетях не ограничено. Однослойные перцептроны (OLP) используются для простых задач (например, сжатия файлов), и могут применяться для анализа аудитории и прогнозирования трендов. Многослойные перцептроны (MLP) способны решать более сложные задачи, например, использоваться для автоматизации написания новостей. Питер Поташ и др. исследовали нейронные сети с прямой связью в анализе политической предвзятости информационных текстов. Точность нейронной сети с обратной связью составила 93,5 % [7]. Нейросеть проанализировала реакции пользователей на новостные материалы, собранные из социальной сети «ВКонтакте», и определила принадлежность новостей к двум странам по политическим предпочтениям пользователей.
Нейронные сети с рекуррентными связями (recurrent neural network, RNN) отличаются возможностью передачи информации в двух направлениях, что позволяет им запоминать ранее обработанные данные и адаптироваться к входным данным разной длины. Пример применения рекуррентной нейронной сети в журналистике подробно описан в исследовании «Обнаружение слухов из микроблогов с помощью рекуррентных нейронных сетей» [6]. RNN использовались для анализа и обнаружения недостоверной информации в Twitter и Sina Weibo. Модели продемонстрировали высокую точность обнаружения слухов.
Сверточные нейронные сети (convolutional neural networks, CNN) — тип искусственных НС, разработанных для обработки и анализа данных с сетчатой структурой (изображений и видео). Основное преимущество этого вида сетей заключается в способности автоматически выявлять иерархические признаки данных, распознавать объекты, анализировать изображения и видео. В журналистике такие нейросети используются для обнаружения фейковых новостей, анализа изображений и видео, распознавания лиц и объектов на фотографиях, автоматической классификации новостного контента и модерации пользовательского контента в социальных сетях, выявления манипуляций в новостных материалах.
Фейковые новости, призванные манипулировать общественным мнением, всегда остаются важной проблемой в жизни общества. Эти новости не только вводят людей в заблуждение, но и могут оказать серьезное влияние на общественное мнение и политические процессы, а сейчас их распространение значительно усилилось из-за развития интернета и социальных сетей. В исследовании «Ти-Эн-Эн: сверточные нейронные сети для обнаружения фейковых новостей» для решения обозначенной проблемы предложена модель TI-CNN, которая использует текстовую и графическую информацию в обучении для обнаружения фейковых новостей. Модель показала высокую точность (92,20 %) в распознавании фейковых новостей на основе анализа данных — 80 % для обучения, 10 % для проверки и 10 % для тестирования [9].
Генеративно-состязательные сети (Generative Adversarial Networks, GAN) — тип искусственных нейронных сетей, разработанных для генерации реалистичных новых данных. В исследовании «Генеративные состязательные сети для повышения достоверности больших данных» авторы предлагают использовать GAN для генерации данных, которые будут применены для обучения платформы больших данных перед развертыванием. Использование GAN также помогает обнаруживать выбросы, повышая качество данных и защищая систему от неверных записей. Результаты для ACGAN оказались достаточно неплохими: 43,8 % в общем случае (против 87,7 % при обработке изображений, созданных человеком), при этом для класса WineBottle уже 100 % и для Hammer — 92,8 %. [2].
В работе «Интеллектуальный в вычислительном отношении агент для обнаружения фейковых новостей с использованием генеративных состязательных сетей» [3] был проанализирован феномен фейковых новостей и их влияния на общество. Для определения фейков был использован SeqGAN — вариант генеративной нейросети для обработки естественного языка. Модель продемонстрировала высокую точность в определении фейковых новостей.
Генеративные нейросети находят широкое применение в журналистике и трансформируют процессы создания и распространения новостей. Reuters News Tracer использует машинное обучение для поиска актуальных новостей в твитах [8]. NewsGPT — сайт, полностью управляемый ИИ, который анализирует и интерпретирует данные из различных источников, создает репортажи без участия людей. Чат-бот Аделаида от Forbes готовит персонализированные новости по интересам пользователей, а Charlie от OneSub помогает снижать уровень стресса и тревожности пользователей, обрабатывая новости так, чтобы они не содержали негативной информации.
Трансформеры (Transformers) представляют собой специальный класс моделей глубокого обучения, который эффективно обрабатывает текстовые данные. В отличие от рекуррентных нейронных сетей, трансформеры одновременно анализируют весь вводимый текст, лучше улавливая длинные зависимости. Наиболее известные модели на основе трансформеров включают BERT (Bidirectional Encoder Representations from Transformers), GPT (Generative Pre-trained Transformer) и T5 (Text-To-Text Transfer Transformer). Кроме перевода текста и поиска нужной информации, трансформеры могут выполнять следующие задачи в журналистике: анализ настроений для понимания реакции аудитории, а также социальных медиа для выявления ключевых тем и трендов, автоматизация написания материалов — например, новостные сводки и отчеты, проверка фактов. В работе «Основанные на трансформаторах модели глубокого обучения для анализа настроений в данных социальных сетей» исследовался способ улучшения анализа настроений, или эмоциональной окраски текста, с помощью современных моделей глубокого обучения. Исследование решает проблему обработки зашумленных данных от слов, отсутствующих в словарях, а также учета контекста и эмоций в текстах. Для достижения цели была использована модель на основе BERT от Google и специальных нейронных сетей (CBRNN). В процессе работы использованы данные из различных источников — отзывы на авиакомпании, самоуправляемые автомобили, президентские выборы в США и обзоры фильмов на IMDB. Модель значительно превзошла другие аналогичные по точности и способности распознавать эмоции в тексте [4].
Применение нейросетей для генерации данных в журналистике открывает широкие возможности для автоматизации анализа данных и создания контента. Нейронные сети позволяют эффективно выявлять политическую предвзятость и бороться с дезинформацией, улучшая качество материалов и повышая доверие аудитории. Генеративные нейросети создают и помогают улучшать контент, оптимизируют процесс производства новостей, повышая участие аудитории в производстве контента. Трансформеры, благодаря своей способности эффективно обрабатывать текстовые данные и учитывать контекст, становятся незаменимыми инструментами в журналистике: они позволяют улучшить качество материалов, глубже понять настроение и реакцию аудитории для повышения релевантности контента. Использование нейросетей в журналистике не только улучшает и упрощает традиционные методы работы, но и способствует созданию новых способов взаимодействия с аудиторией. Внедрение нейросетевых технологий позволяет журналистам быстрее и точнее выполнять свою работу, автоматизировать рутинные задачи и сосредотачиваться на более креативных и аналитических аспектах своей деятельности. Это делает журналистику более эффективной, прозрачной и оперативной в реагировании на вызовы современного медиапространства.
Литература:
- Сущеня Р. В., Кокаев А. Э. Нейронные сети и их классификация. основные виды нейронных сетей // Вестник науки. 2023. Т. 1. №. 8 (65). С. 186–189. URL: https://cyberleninka.ru/article/n/neyronnye-seti-i-ih-klassifikatsiya-osnovnye-vidy-neyronnyh-setey (дата обращения 23.02.2025).
- Dering M. L., Tucker C. S. Generative adversarial networks for increasing the veracity of big data // IEEE International Conference on Big Data (Big Data). IEEE, 2017. С. 2595–2602. URL: https://www.researchgate.net/publication/322511767_Generative_adversarial_networks_for_increasing_the_veracity_of_big_data (дата обращения 23.02.2025).
- Hiriyannaiah S. et al. A computationally intelligent agent for detecting fake news using generative adversarial networks // Hybrid computational intelligence. Academic Press, 2020. С. 69–96.
- Kokab S. T., Asghar S., Naz S. Transformer-based deep learning models for the sentiment analysis of social media data // Array. 2022. Т. 14. 12 с. URL: https://www.sciencedirect.com/science/article/pii/S2590005622000224 (дата обращения 23.02.2025).
- Krenker A., Bešter J., Kos A. Introduction to the artificial neural networks // Artificial Neural Networks: Methodological Advances and Biomedical Applications. InTech. 2011. С. 1–18. URL: https://www.researchgate.net/publication/5847739_Introduction_to_artificial_neural_networks (дата обращения 23.02.2025).
- Ma J. et al. Detecting rumors from microblogs with recurrent neural networks. 2016. URL: https://ink.library.smu.edu.sg/sis_research/4630/ (дата обращения 23.02.2025).
- Potash P. et al. Tracking bias in news sources using social media: The Russia-Ukraine maidan crisis of 2013–2014 // Proceedings of the 2017 EMNLP Workshop: Natural Language Processing meets Journalism. 2017. С. 13–18. URL: https://www.researchgate.net/publication/322590541_Tracking_Bias_in_News_Sources_Using_Social_Media_the_Russia-Ukraine_Maidan_Crisis_of_2013–2014 (дата обращения 23.02.2025).
- Shi Y., Sun L. How generative AI is transforming journalism: development, application and ethics // Journalism and Media. 2024. Т. 5. №. 2. С. 582–594. URL: https://www.researchgate.net/publication/380506285_How_Generative_AI_Is_Transforming_Journalism_Development_Application_and_Ethics (дата обращения 23.02.2025).
- Yang Y. et al. TI-CNN: Convolutional neural networks for fake news detection // arXiv. 2018. URL: https://arxiv.org/abs/1806.00749 (дата обращения 23.02.2025).