Желідегі кибербуллингті анықтау әдістері мен алгоритмдерін зерттеу | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 18 декабря, печатный экземпляр отправим 22 декабря.

Опубликовать статью в журнале

Авторы: ,

Рубрика: Молодой ученый Қазақстан

Опубликовано в Молодой учёный №48 (338) ноябрь 2020 г.

Дата публикации: 26.11.2020

Статья просмотрена: 46 раз

Библиографическое описание:

Сатибалдиева, Д. К. Желідегі кибербуллингті анықтау әдістері мен алгоритмдерін зерттеу / Д. К. Сатибалдиева, А. С. Муканова. — Текст : непосредственный // Молодой ученый. — 2020. — № 48 (338). — С. 631-636. — URL: https://moluch.ru/archive/338/75670/ (дата обращения: 08.12.2021).



Әлеуметтік желілерді дамыту қосымшалар әзірлеушілердің алдына адамдар арасындағы онлайн-өзара іс-қимылдарды талдау бойынша жаңа міндеттер қояды. Әлеуметтік желілер қарым-қатынас жасауға үлкен мүмкіндік береді, бірақ киберқауіп сияқты қауіпті жағдайлардың санын арттырады. Зерттеулер көрсеткендей, барлық жасөспірімдердің орташа 40 % киберқауіпсіздік құрбандары болады. Зерттеу жұмысының мақсаты — әлеуметтік желілер арқылы төнетін кибербуллингті анықтау әдістерін зерттеу. Негізгі назар әлеуметтік желілер арқылы берілетін хабарламаларда киберқауіпсіздікті автоматты түрде анықтауға бөлінеді. Бұл жүйе кіріс деректерінен тиісті жіктемелік деректерді алу үшін анық емес ережелер жинағын пайдаланған кезде тиімдірек. Киберқауіпсіз оқиғаларды автоматты түрде сәйкестендіру үшін конструкцияны сипаттаудан басқа, әлеуметтік желілерде киберқауіпсіздікті тарататын жарияланымдарды анықтайтын қосымша жүзеге асырылады.

Түйінді сөздер: киберқауіпсіздік, әлеуметтік желілер, жарияланымдар, парсер.

Развитие социальных сетей ставит перед разработчиками приложений новые задачи по анализу онлайн-взаимодействия между людьми. Социальные сети предоставляют большие возможности для общения, но увеличивают количество опасных ситуаций, таких как киберугрозы. Исследования показывают, что в среднем 40 % всех подростков становятся жертвами кибербезопасности. Цель исследовательской работы — изучение методов выявления кибербуллинга через социальные сети. Основное внимание уделяется автоматическому выявлению кибербезопасности в сообщениях, передаваемых через социальные сети. Эта система более эффективна при использовании нечеткого набора правил для извлечения соответствующих классификационных данных из входных данных. Помимо описания конструкции для автоматической идентификации кибербезопасных событий, в социальных сетях реализуется приложение, которое определяет публикации, распространяющие кибербезопасность.

Ключевые слова: кибербезопасность, социальные сети, публикации, парсер.

Кіріспе.

Соңғы жылдары әлеуметтік желілер (SNS) бүкіл әлемде кеңінен танымал, бұл барлық адамдарды байланыстыру платформасын қамтамасыз етеді және қоғамда маңызды қарым-қатынас құралы болып табылады. 1990 жылдары әлеуметтік желілердің онлайн сервистерінің (SixDegrees, LiveJournal, Facebook, Twitter, YouTube, Вконтакте және басқалар) пайда болуы арқасында дербес деректерді әлеуметтендіру феномені: өмірбаян, хат алмасу, күнделіктер, фото-, бейне-, аудиоматериалдар, саяхат туралы жазбалар және т. б. деректер көпшілікке қолжетімді болды. Осылайша, әлеуметтік желілер адамдардың жеке өмірі мен мүддесі туралы деректердің бірегей көзі болып табылады. Сонымен қатар әлеуметтік желілер пайдаланушыларға қосалқы сервистер мен бизнес-міндеттерді құру үшін теңдесі жоқ мүмкіндіктер ашады.

Қазіргі кезде, әсіресе жасөспірімдер әртүрлі әлеуметтік желі сайттарында басқа адамдармен байланысу, ақпарат алмасу және ортақ мүдделерге жету үшін айтарлықтай уақыт жұмсайды. 2018 жылғы статистика бойынша жасөспірімдердің 97 % -ы күнделікті әлеуметтік медиа сайттарын пайдаланады, ал төрт жасөспірімнің екеуі өзінің сүйікті әлеуметтік медиа сайттарына күніне 10 немесе одан да көп рет шығады. Жасөспірімдер әлеуметтік желілерді пайдаланудан басқа адамдармен өзара әрекеттесу арқылы пайда көріп отырғанымен, олар сондай-ақ көптеген зиянды онлайн контенттерге ұшырау қаупіне ие. Онлайн-әлеуметтік желілердегі мазмұн- мағыналар адамдарға айтарлықтай әсер етуі мүмкін. Мұндай платформалар дұрыс пайдаланылмаса, бұл теріс салдарға әкеледі. Әзірге Интернет-әлеуметтік желілердің (ОСН) ең қатал аспектілерінің бірі адамның жеке өміріне қауіп төндіру және ол туралы дұрыс емес хабарламаларды тарату болып табылады.

Әлеуметтік медианың біздің күнделікті өмірімізге жылдам енуімен туындаған проблемалардың бірі — киберқылмыс. Ол адамдардың жеке өміріне қол сұғып, ауыр дене жарақаттарын жасаумен немесе адамды өлтірумен қорқыту болып табылады. Киберқылмыскерлер күн сайын кез келген уақытта ұялы телефондар мен ноутбуктер сияқты технологиялық құрылғылар арқылы зардап шегушіге қол жеткізе алады. Әлеуметтік медиа киберқылмыскерлерге олардың құрбандарын мақсатты түрде жасырын қадағалау, соның ішінде хабарламалар немесе аудио-, видеодеректер арқылы әсер етуді қоса алғанда, бірқатар мүмкіндіктерді береді. Сонымен қатар, онлайн-контент үлкен аудиторияға таратылады және оларды жою қиын. Хабарлама бір рет ғана желіге орналастырылған болса да, ол қайта жариялануы, басқалармен пайдаланылуы мүмкін, бұл шабуылдың немесе зиянды іс-әрекеттердің әсерін айтарлықтай арттырады. Сондықтан, жастар киберқылмыс, суицидтік мінез-құлық немесе педофилдер тәрбиесі сияқты қауіпті жағдайлармен бетпе-бет келуі мүмкін.

Әлеуметтік желілерде осындай қауіп-қатерлерді болдырмау үшін, әлеуметтік деректерді зерттеумен Карнеги-Меллон, Стэнфорд, Оксфорд, INRIA университеттері, сондай-ақ Facebook, Google, Yahoo! LinkedIn, Вконтакте және басқа да көптеген компаниялар белсенді түрде айналысады. Атап айтқанда, онлайн желілер (Facebook, Twitter) сервистерінің иелері-компаниялар пайдаланушылық деректердің үлкен массивтерін өңдеу үшін жетілдірілген инфрақұрылымдық (Cassandra, Presto, FlockDB, Thrift) және алгоритмдік (пайдаланушылардың, тауарлар мен қызметтердің жаңа іздеу алгоритмдері мен ұсыныстары) шешімдерді әзірлеуге белсенді түрде инвестиция салады. Коммерциялық компаниялар әлеуметтік деректерді сақтау қоймаларына (GNIP) қолжетімділік, жиынтық сценарийлер (80legs), әлеуметтік талдау (DataSift) бойынша әлеуметтік деректерді жинап, дамып келеді.

Осылайша, зерттеу орталықтарының және бүкіл әлемдегі компаниялардың сарапшылары осы процестерді тоқтату тетіктерін жасау үшін, сондай-ақ, инновациялық, аналитикалық және іскери қосымшаларды құру үшін жеке, мемлекеттік деңгейден әлеуметтік, экономикалық, саяси және басқа да процестерді моделдеу үшін әлеуметтік желілік деректерді пайдаланады.

Сонымен қатар, киберқылмыс депрессияға, төмен өзін-өзі бағалауға және проблемаларға байланысты зерттеулермен адамның ақыл-ойы мен денсаулығына айтарлықтай қатер төндіреді. Төтенше жағдайларда, оның әсері тіпті өз-өзіне зиян келтірумен байланысты және өзіне-өзі қол жұмсау болып табылады. Сондықтан киберқылмысты табысты анықтау, онлайн режимінде болуы мүмкін қауіпті жағдайларды анықтауға және олардың өрлеуіне жол бермеу маңызды. Интернеттегі массивтік ақпараттық жүктемені ескере отырып, адамдар онлайн арқылы жасалатын барлық әңгімелерді бақылап отыру мүмкін болмады.

Киберқылмысқа қарсы күрестегі қиындықтардың ең көп таралған түрлері:

1) жәбірленушілердің көп бөлігі өздерін оқшаулап, осындай жағдайларды хабарламауы.

2) сандық құрылғылар тәулік бойы үздіксіз және алыс қашықтықтан қарым-қатынас жасау мүмкіндігін ұсынады, сондықтан киберқауіпсіздікке душар болған адамның тікелей әрекет ете алмау проблемасы бар, яғни құқық бұзушы әлдеқайда алыс немесе жасырын болуы мүмкін.

3) хабарламаларды жіберуші жәбірленушіні қорқыту арқылы, хабарламаны жою мүмкіндігі.

Зерттеу жұмысының мақсаты — әлеуметтік желілер арқылы төнетін кибербуллингті анықтау әдістерін зерттеу.

Адам өмірі мен денсаулығына (оның ішінде әлеуметтік желілерде) қауіп төндіруге жауапкершілікті реттейтін негізгі нормативтік құқықтық акті — Қазақстан Республикасының Қылмыстық кодексінің 147-бабы- жеке өмiрге қолсұғылмаушылықты және Қазақстан Республикасының дербес деректер және оларды қорғау туралы заңнамасын бұзу. Интернеттегі қауіптерді таратуды жазалайтын жеке құқықтық акт жоқ.

Киберқылмысқа ұшыраған жағдайда жасалыну керек іс-әрекеттер:

1) Біреуге айту

DoSomething.org сайтының мәліметі бойынша, 10 адамның біреуі ғана онлайн-қорқыту туралы ересек адамға айтады, алайда жасөспірімдердің 68 % -ы киберқылмыстың маңызды мәселе екендігіне келіседі. Балалар ересек адам кейінгі жағдайды нашарлататындығын немесе мұғалімдер мен ата-аналардың зорлық-зомбылықты тоқтату үшін ештеңе жасай алмайтындығына алаңдаушылық білдіреді. Әлеуметтік медиа сайттарына тікелей хабарласу сияқты мәселені шешудің практикалық жолдарын іздеу қажет.

2) Барлық хабарламаларды сақтау

Кейбір жағдайларда қорқыту сызықшылдықтан қылмыстық қудалауға немесе қатерлерге дейін кесіп өтеді. 2013 жылдың қыркүйек айында үнемі Интернеттегі зорлық-зомбылықтан кейін өз-өзіне қол жұмсаған Ирина Голубевамен болған оқиға. Полиция оқиға туралы тергеу жүргізгенімен, құқық қорғау органдарының қызметкерлері Иринадан қайтыс болған онлайндық «тролльдерді» айыптауға ешқандай негіздеме таппады. Оның анасы Светлана енді әлеуметтік медиа қорқыту үлгісін көрсететін жазбаларды алды және іс қайта ашылды. Егер жәбірленуші киберқауіпсіздіктің құрбаны болса, уақытты және күнді жазып алудан басқа скриншоттарды немесе смартфондағы фотосуреттерді түсіру арқылы барлық хабарламаларды және хабарларды сақтау қажет.

3) Әлеуметтік желілерді өшіру

Nobullying.com хабарлауынша, әлеуметтік медианы пайдаланатын барлық жасөспірімдердің 55 % -ы қорқытудың кейбір түріне куә болды, ал 95 % -ы мінез-құлықты мүлдем елемеді. Бұған қарсы тұру үшін, тану және болдырмау туралы ұсыныс ұсынылады. Шабуылға ұшырағандар көбінесе жауап беруден гөрі шабуылдарды елемейді. Кез-келген қаскөйдің мақсаты — жәбірленушіні ашу-ызаға келтіру, іс жүзінде «мақсатына жету» және оны күлкілі шағымдар немесе зиянды мәлімдемелер деп қабылдау. Үздік опция- әлеуметтік медиа мен электрондық пошта тіркелінімдерін оқшаулап тастау.

4) Балалардың интернеттегі іс-әрекеттерін білу

InternetSafety101.org сайтының хабарлауынша, ата-аналардың тек 7 %-ы киберқылмысқа қатысты алаңдаушылық білдіреді. Ата-аналар ретінде балаларың әлеуметтік желіде және смартфондарда не істеп жатқандығы туралы барлық нәрсені білу өте маңызды. Шындығында, бір қате түсінік бар, ұлдар — әрдайым агрессор және қыздар — мүмкін құрбандар.

Материалдар мен әдіс-тәсілдер.

Әлеуметтік желілерден бізге қажетті ақпараттарды анықтау үшін ақпараттарды іздестіру және скринингтік (мәтіндік) деректерді алу құралдарын білуіміз қажет.

Ақпараттарды алу құралдарын келесідей тиімді бөлуге болады:

− Деректер көздері, қызметтер деректерді қорғайтын немесе қарапайым талдауларды ұсынатын құралдар арқылы қол жетімді. Мысалы, Google Trends, SocialMention, SocialPointer-ді жатқызуға болады.

− Деректерді API арқылы алу — деректер жиынтығы мен арналар бағдарламаланатын HTTP-негізделген API арқылы қол жетімді және XML немесе JSON, т.б. көмегімен тегтелген деректерді қайтарады. Мысал ретінде Wikipedia, Twitter және Вконтакте кіреді.

− Трансформация құралдары — мәтіндік енгізу деректерін Google Fusion Tables, Zoho Reports сияқты кестелерге, карталарға, сызбаларға (сызыққа, шашырауға, жолаққа т. б.), уақыт шкаласына немесе тіпті қозғалысқа (уақыт шкаласы бойынша анимация) айналдыратын Tableau Public немесе IBM көздері.

− Талдау құралдары — әлеуметтік деректерді талдау, Gephi (ашық бастапқы код) немесе NodeXL Excel қондырмасы сияқты қосылымдарды және құрылыстық желілерді пайдалану арқылы қосымша талдау құралдары.

Қауіпті ақпараттарды анықтау кезінде ережелер мен сөздіктерге негізделген әдіс қолданылады. Бұл әдісті қолданған кезде, тоналдық сөздіктер мен ережелер лингвистикалық талдау арқылы жасалады, оған сәйкес эмоциялық тілге іздеу жүргізіледі. Бұдан басқа, табылған эмоциялық лексиканың жиынтығы теріс және оң лексиканың санын қамтитын ауқымда бағаланады.

Келесі алгоритм кеңінен қолданылады:

− әр сөзді мәтіннен тоналдылық мәнін сөздікке (егер ол бар болса) тағайындаңыз;

− жеке сөздердің негізгі сөздерін қорытындылау арқылы бүкіл мәтіннің жалпы көлемін есептеңіз.

Бұл әдіс бойынша кемшіліктер еңбек көлемінің айтарлықтай мөлшерін құрайды және көптеген ережелерді жасауды талап етеді.

Берілген әдісті пайдалану кезінде алдымен әлеуметтік желілерде қолданылатын қауіпті сөздер тізімі жасалады. Оны phpMyAdmin веб-қосымшасы арқылы жасауға болады. phpMyAdmin — PHP-да жазылған ашық бастапқы кодтық веб-қосымшасы және MySQL ДББЖ басқаруға арналған веб-интерфейс. PHPMyAdmin браузер арқылы MySQL серверін басқаруға мүмкіндік береді және тек SQL пәрмендерін іске қосып, кестелер мен дерекқорлардың мазмұнын көруге мүмкіндік береді.

Сур. 1.phpMyAdmin веб-қосымшасында әлеуметтік желінің парсерінің деректер қоры.

Әлеуметтік желіні пайдаланушылардың жазған жеке өмірге қауіпті болатын жарияланымдардың мәтініне негізделген анықтау әдісін қарастырайық.

Әдіс келесі қадамдарды қамтиды:

− бастапқы деректер жиынтығының құрылысы;

− мәтінді алдын-ала өңдеу;

− сипаттаманы құру;

− ақпараттық ерекшеліктерді таңдау;

− оқыту;

− жіктеу.

Барлық кезеңдер, біріншіден басқасы, әр төлсипат үшін бөлек орындалады.

Алғашқы деректер жинағын құру кезеңінде пайдаланушылардың деректерін әлеуметтік желіден жинау керек және олардың желіде барлық қол жетімді хабарламалары сұралады және сақталады, оның зерттеуші көрсеткен атрибуттарының мәндері шығарылады.

Мәтінді алдын-ала өңдеу кезеңінде мәтіннің тілдік тиістілігін анықтау әдісі алдыңғы кезеңде алынған деректер жиынтығының мәтініне қолданылады. Осыдан кейін қолданушы деректері пайдаланушының тіліне байланысты түрлі деректер жинақтарына таратылады. Сонымен қатар, осы кезеңде, пайдаланушыға тиесілі емес хабарламалар сүзіледі. Басқа пайдаланушылардың хабарларына сілтеме жасай отырып, әлеуметтік желідегі ақпарат таратудың өте танымал тәсілі болып табылады, бұл әдіс дәлдігін жақсарту үшін бұл алдын ала өңдеу қадамы аса маңызды. Осылайша, әрбір төлсипат пен тілге арналған деректер жиынтығы — бұл хабарлардың мәтіндері мен Вконтактедегі бір қолданушының профилінен алынатын таңбалар тізбегінің жиынтығы.

Ақпараттық ерекшеліктерді таңдау сатысында шартты өзара ақпараттарды есептеу әдісі қолданылады. Атрибут мәні туралы ең көп ақпаратты қамтитын және бір уақытта алдыңғы итерацияда таңдалған мүмкіндіктерден айтарлықтай ерекшеленетін мүмкіндіктердің итеративті таңдауы орындалады. Жаттығу сатысында онлайн-пассивті агрессивті алгоритм көмегімен классификациялық модель құрылады. Жіктеу сатысында, бастапқы деректердің мәтіні және ерікті пайдаланушының профильдік өрістері пайдаланылады. Көрсетілген тіл мен төлсипат бойынша жіктеу алгоритмі орындалады. Нәтиже — таңдалған пайдаланушының жазған қауіпті сөздері. Нәтижелердің сапасын бағалау үшін сыныптау дәлдігі қолданылады. Бастапқы деректер жиынтығы оқу және тестілеу үлгілеріне бөлінеді. Пайдаланылған деректер бастапқы деректер жиынтығының сынақ дәлдігінен алынған әлеуметтік желіні пайдаланушылардың мәтіндері болып табылады.

Қорытынды. Зерттеу барысында жарияланымдағы сөздердің тәртібін сақтайтын дәйектілікке негізделген модель қолданылды. Желіде қауіпті сөздерді немесе сөз тіркестерін белгілеген соң, сол хабарламаларды жазған адамның идентификациялық номері анықталып, сол пайдаланушының әлеуетін болжауға болады.

Әдебиет:

  1. Далворт М. “Социальные сети: руководство по эксплуатации” / Майк Далворт; пер.с англ.- М.::: ООО Издательство “Добрая книга”, 2010. -248с.
  2. A. McCallum, X. Wang, and A. Corrada-Emmanuel, “Topic and Role Discovery in Social Networks with Experiments on Enron and Academic Email,” Journal of Artificial Intelligence Research, vol. 30, 2007, pp. 249–272, ISSN: 1076–9757.
  3. K. Dinakar, B. Jones, C. Havasi, H. Lieberman, and R. Picard, “Common Sense Reasoning for Detection, Prevention, and Mitigation of Cyberbullying,” ACM Transactions on Interactive Intelligent Systems, vol. 2, 2012, pp. 1–30, ISSN: 2160–6455.
  4. Dinakar, K., Reichart, R., and Lieberman, H. 2011. “Modeling the Detection of Textual Cyberbullying,” in Proceedings of the International Conference on Weblog and Social Media (Social Mobile Web Workshop).
  5. L. Dehue, C. Bolman, and T. Vollink, “Cyberbullying: Youngster’s Experiences and Parental Perception,” CyberPsychology, vol. 4, 2006, pp. 148–169.
  6. S. Hinduja and J. W. Patchin, “Bullies Move Beyond the Schoolyard: A Preliminary Look at Cyberbullying,” Youth Violence and Juvenile Justice, vol. 4, 2006, pp. 148–169.
Основные термины (генерируются автоматически): мена, немес, API, ISSN, ACM, GNIP, IBM, INRIA, JSON, SNS.


Ключевые слова

киберқауіпсіздік, әлеуметтік желілер, жарияланымдар, парсер
Задать вопрос