Механизм распознавания фишинговых сайтов по косвенным признакам | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 15 августа, печатный экземпляр отправим 2 сентября.

Опубликовать статью в журнале

Библиографическое описание:

Механизм распознавания фишинговых сайтов по косвенным признакам / Р. А. Мартынюк, И. А. Кононыхин, Ф. В. Ежов [и др.]. — Текст : непосредственный // Молодой ученый. — 2020. — № 28 (318). — С. 19-22. — URL: https://moluch.ru/archive/318/72550/ (дата обращения: 07.08.2020).



В данной статье представлен метод детекции подозрительных сайтов с использованием только косвенных признаков.

Ключевые слова: фишинг, распознавание, подозрительные сайты, косвенные признаки

Введение

Сейчас в Интернете остро стоит проблема кражи личных данных посредством фишинговых сайтов. На данный момент существуют инструменты, предупреждающие пользователя от том, что ссылка, по которой он пытается перейти, введет на поддельный сайт. Но они не гарантируют полную защиту от фишинга из-за их принципа работы.

В статье [1] описана антифишинговая защита основных популярных браузеров, где можно увидеть один изъян, она опирается на черные списки, хранящиеся в браузере. Это означает, что если домен веб-страницы не добавлен в список подозрительных сайтов, то никакого предупреждения не будет. Поэтому в этой статье представлен способ, который поможет улучшить современные инструменты блокировки подозрительных сайтов.

Постановка задачи

Сайт не будет определен как фишинговый, если его нет в черном списке. По статистике за месяц на один такой сайт заходит от 15 до 18 тысяч пользователей. Опытный пользователь может определить, что сайт поддельный, «на глаз», а обычный, не умеющий определять таким способом, — может лишиться своих данных.

Поэтому ставится задача, создать такой способ определения фишинговых сайтов в режиме реального времени по косвенным признакам, не опираясь на черный список. Данная задача включает в себя:

  1. Определить основные критерии, которые будут симулировать, как опытный пользователь определяет является ли сайт фишинговым.
  2. Создать механизм взаимодействия критериев друг с другом для определения статуса веб-страницы.

Основные критерии

Некоторые из критериев были взяты из [2, 3] и проверены на практике, а остальные были выделены в ходе изучения различных фишинговых сайтов. В итоге был составлен список основных критериев:

  1. соединение по защищенному протоколу https;
  2. наличие домена сайта в HSTS Preload List;
  3. наличие у доменного имени верхнего уровня DNSSEC-записей;
  4. является ли тело сайта картинкой;
  5. наличие тега
    , который отправляется на сторонний сайт;
  6. отношение ссылок, ведущих на этот же сайт, к ссылкам, ведущих на сторонний сайт;
  7. отношение количества ссылок в тегах , использующих CSS-файлы этого сайта, к количеству использующих CSS-файлы с других сайтов;
  8. количество слов на странице;
  9. количество слов с опечатками;
  10. отношение количества слов с опечатками к общему количеству слов на странице.

Пять из этих критериев являются категориальными признаками, а остальные пять — численными.

Нейросетевой подход

В качестве механизма взаимодействия критериев между собой было решено взять немногослойную нейронную сеть, которая после обучения настроит веса каждого критерия.

На основе уже определенных критериев были собраны данные с 230 сайтов, среди которых ровно половина является фишинговыми, а остальные — нормальные. В итоге данные делятся на три основные выборки с определенными размерами:

  1. тренировочная выборка размером 200 сайтов;
  2. тестовая — 20 сайтов;
  3. валидационная — 10 сайтов.

В каждой такой выборке половина сайтов является фишинговыми.

На JavaScript нейронная сеть была написана с помощью библиотеки Brain.js.

Архитектура и параметры обучения:

  1. функция потерь — среднеквадратическая ошибка:

  1. алгоритм оптимизации Adam:
    • скорость обучения — 1e-3;
  2. batch size — 20 сайтов;
  3. максимальное количество эпох — 5000;
  4. минимальная ошибка — 5е-3

Результаты обучения

Таблица 2

Результат обучения нейронной сети на языке JavaScript

Название модели

Эпоха

Ошибка

Model_JS

100

0.02504628191382472

200

0.018852015170452655

300

0.014522773979946852

400

0.01462846398000555

500

0.007162848323984566

Визуализированный результат работы сети на тренировочной и тестовой выборках. Визуализированный результат работы сети на тренировочной и тестовой выборках.

Рис. 1 Визуализированный результат работы сети на тренировочной и тестовой выборках.

Выводы

Данный механизм был реализован в расширении EPSDfree, автором которого являюсь я, и с его исходным кодом можно ознакомиться по ссылке https://github.com/Romamart/EPSDfree. Как показывает практика, этот способ помогает компенсировать некоторые недостатки антифишинговой защиты браузеров.

Литература:

  1. Безмалый В. Современные браузеры. Защита от фишинга [Электронный ресурс]. URL: https://www.osp.ru/pcworld/2011/07/13009498/.
  2. Vayansky I., Kumar S. Phishing — challenges and solutions [Электронный ресурс]. URL: https://www.researchgate.net/publication/322823383_Phishing_-_challenges_and_solutions.
  3. Нежников С. Фишинг в интернете: как не попасть в сети мошенников: [Электронный ресурс]. URL: https://sales-generator.ru/blog/fishing-v-internete/.
  4. Brain.js documentation [Электронный ресурс]. URL: https://github.com/BrainJS/brain.js#about.
Основные термины (генерируются автоматически): сайт, нейронная сеть, опытный пользователь, сторонний сайт, черный список, HSTS, критерий были, результат обучения, критерий, слово.


Ключевые слова

распознавание, фишинг, подозрительные сайты, косвенные признаки

Похожие статьи

Классификация заявок пользователей с помощью нейросети

В статье рассмотрен вариант решения классификации задач, поступающих от пользователей системы, на основе текстовой информации. Инструментом классификации выступает нейронная сеть. В статье рассмотрены этапы построения нейросети, а также процесс подготовки обучения.

Проблемы обучения нейронных сетей | Статья в журнале...

В данной статье рассматриваются проблемы, которые могут возникнуть при работе с нейронными сетями, а также способы их устранения. Ключевые слова: нейронные сети, обучение, подготовка начальных значений весовых коэффициентов...

Критерии отбора учебных интернет-ресурсов в рамках обучения...

Автором статьи доказывается целесообразность и важность разработки критериев отбора

Разработка критериев оценки интернет-ресурсов возможна и со стороны обучающихся

Например, хотлист переводится как список по теме, представляет собой список полезных...

Анализ и классификация погрешностей обучения...

В статье с метрологической точки зрения рассмотрен процесс обучения измерительных систем на базе нейронных сетей. Выделены критерии показателей качества обучения, достоверности результата.

Искусственные нейронные сети | Статья в журнале...

Конечно есть универсальные нейронные сети — многослойный перцептрон, который можно применять практически для любых типов задач.

Таким образом, искусственные нейронные сети представляют очень гибкий аппарат для решение широкого спектра задач, от обучения...

Исследование нейросетевых технологий для выявления...

Поэтому основным критерием для выбора метода обнаружения является его способность решить задачу классификации.

Обычно для обучения и тестирования ИНС имеющиеся экспериментальные данные разбиваются на обучающую БД и контрольную БД.

Формирование нейронной сети | Статья в журнале...

Следующей проблемой нейронных сетей проблема стабильности-пластичности, которой в том, что новому образу изменяет результаты обучения. Сети и алгоритмы APT пластичность, необходимую для новых образов, в то же предотвращая изменение запомненных образов.

Использование Join-layer neural networks для решения задачи...

В статье описан метод извлечения ключевых фраз из постов социальной сети «Твиттер», основанный на построении и обучении нейронной сети с архитектурой Joint-layer. Ключевые слова:обработка естественного языка, нейронные сети, ключевые слова, ключевые фразы.

Применение нейронных сетей для графологического анализа...

Процесс и результаты обучения нейронной сети показаны на рисунке 1 и рисунке 2.

Рис. 2. Результат обучения нейронной сети. Возьмем изображение для проверки работы системы.

В задаче идентификации пользователя по клавиатурному почерку важным этапом является...

Похожие статьи

Классификация заявок пользователей с помощью нейросети

В статье рассмотрен вариант решения классификации задач, поступающих от пользователей системы, на основе текстовой информации. Инструментом классификации выступает нейронная сеть. В статье рассмотрены этапы построения нейросети, а также процесс подготовки обучения.

Проблемы обучения нейронных сетей | Статья в журнале...

В данной статье рассматриваются проблемы, которые могут возникнуть при работе с нейронными сетями, а также способы их устранения. Ключевые слова: нейронные сети, обучение, подготовка начальных значений весовых коэффициентов...

Критерии отбора учебных интернет-ресурсов в рамках обучения...

Автором статьи доказывается целесообразность и важность разработки критериев отбора

Разработка критериев оценки интернет-ресурсов возможна и со стороны обучающихся

Например, хотлист переводится как список по теме, представляет собой список полезных...

Анализ и классификация погрешностей обучения...

В статье с метрологической точки зрения рассмотрен процесс обучения измерительных систем на базе нейронных сетей. Выделены критерии показателей качества обучения, достоверности результата.

Искусственные нейронные сети | Статья в журнале...

Конечно есть универсальные нейронные сети — многослойный перцептрон, который можно применять практически для любых типов задач.

Таким образом, искусственные нейронные сети представляют очень гибкий аппарат для решение широкого спектра задач, от обучения...

Исследование нейросетевых технологий для выявления...

Поэтому основным критерием для выбора метода обнаружения является его способность решить задачу классификации.

Обычно для обучения и тестирования ИНС имеющиеся экспериментальные данные разбиваются на обучающую БД и контрольную БД.

Формирование нейронной сети | Статья в журнале...

Следующей проблемой нейронных сетей проблема стабильности-пластичности, которой в том, что новому образу изменяет результаты обучения. Сети и алгоритмы APT пластичность, необходимую для новых образов, в то же предотвращая изменение запомненных образов.

Использование Join-layer neural networks для решения задачи...

В статье описан метод извлечения ключевых фраз из постов социальной сети «Твиттер», основанный на построении и обучении нейронной сети с архитектурой Joint-layer. Ключевые слова:обработка естественного языка, нейронные сети, ключевые слова, ключевые фразы.

Применение нейронных сетей для графологического анализа...

Процесс и результаты обучения нейронной сети показаны на рисунке 1 и рисунке 2.

Рис. 2. Результат обучения нейронной сети. Возьмем изображение для проверки работы системы.

В задаче идентификации пользователя по клавиатурному почерку важным этапом является...

Задать вопрос