Статьяда автор нейрондық желі негізінде бейнені тану үшін модельді оқыту жұмыстары жүргізілген. Бет-әлпетті тану — бұл адамның бет-әлпетіне негізделген сәйкестендіру процесі. Бұл қазіргі кездегі ең танымал және кеңінен қолданылатын Биометрия әдістерінің бірі. Алайда, нақты уақыт режимінде бет-әлпетті танудың сенімді, тәуелсіз жүйелерімен байланысты проблемалар бар. Бұл зерттеу негізінен төрт бөліктен тұрады, атап айтқанда: бетті сурет арқылы тану, белгілерді алу, нейрондық желіні оқыту және тану. Бетті тану алгоритмі бетті берілген сурет арқылы анықтау үшін қолданылады. Бет бейнесінің ең пайдалы және ерекше ерекшеліктері Объектілерді алу сатысында алынады. Бет аймағы алдымен K2 ішкі топтарына бөлінеді, олардан жергілікті екілік шаблонның (LBP) гистограммалары алынады және нейрондық желіні оқыту үшін қолданылатын белгілердің бірыңғай векторына біріктіріледі. Тану кезеңінде бетті тануды оқытылған нейрондық желі жүзеге асырады.
Кілтік сөздер: Artificial neural network, бетті тану, жергілікті екілік үлгі.
В статье автором проведена работа по обучению модели распознаванию образов на основе нейронной сети. Распознавание лиц — это процесс идентификации, основанный на выражении лица человека. Это один из самых популярных и широко используемых в настоящее время методов биометрии. Однако существуют проблемы, связанные с надежными, независимыми системами распознавания лиц в режиме реального времени. Это исследование состоит в основном из четырех частей, а именно: распознавание лица по изображению, получение знаков, обучение нейронной сети и распознавание. Алгоритм распознавания лиц используется для идентификации лица по заданному изображению. Наиболее полезные и уникальные особенности изображения лица получаются на этапе извлечения объектов. Область лица сначала делится на подгруппы K2, из которых получаются гистограммы локального двоичного шаблона (LBP) и объединяется в единый вектор признаков, используемых для обучения нейронной сети. Распознавание лица на этапе распознавания осуществляется обученной нейронной сетью
Ключевые слова: Artificial neural network, распознавание лица, локальный двоичный паттерн.
Кіріспе. Адамдар жеке өзін идентификация жасау адамның кел беті арқылы жүзеге асады. Адамның келбеті тек адамды тану үшін емес сонымен қатар эмоциялық тұрғыда қандай екенін анықтауға тура келеді. Бет-әлпетті тану, технологиялық күш дамыған сайын белсенді зерттеу саласына айналды. Бұл адамдар аутентификация жасау, құқық қорғау және т. б. салаларында қолданылады. Саусақ ізі мен ирис биометриясының басқа жүйелерінен айырмашылығы, бет-әлпетті тану байланыссыз, яғни қашықтықтан процесті жүзеге асыру арқасында айқын артықшылықтарға ие. Адамның келбетінің сурет бейнесі қашықтықтан түсіріп және бұл процесс адамның әрекеттесуін қажет етпейді. Осы жетістіктерге қарамастан, бетті тану компьютерлік көру зерттеулерінде белсенді тақырып болып қала береді. Бұл қазіргі заманғы жүйелерді салыстырмалы түрде бақыланатын жағдайлардың көмегімен жақсы жұмыс істейтіндігіне байланысты, бірақ әртүрлі факторлардың (мысалы түсіру бұрышы, жарықтандыру және т. б.) өзгеруіне байланысты сапасы төмеуден зардап шегеді [1]. Зерттеулердің мақсаттарының бірі осы факторлардан қорғау алатын сенімді жүйелерін дамыту болып табылады. Бетті танудың алғашқы қадамы, ол бетті кескіннен анықтау болса, ақпарат көздеріне суреттерді немесе бейнекадрларды жатқызуға болады. Бейнені тану қиын міндеттердің бірі болып табылады, себебі суреттер мен бейнекадрларда күрделі фон, бейненің әртүрлі позалары орын алуы мүмкін.
Алгоритмдер. Келтірілген жұмысымызда келесі алгоритмдер ұсынылған олар жергілікті екілік үлгілер (LBP) және жасанды нейрондық желі (ANN). Жергілікті екілік үлгілер компьютерлік көрудегі текстураларды жіктеу үшін қолданылатын қарапайым оператор немесе қуатты текстуралық дескриптор ретінде [2]. LBP операторы, кескіннің пикселдерін әр көршілес 3x3 пиксельдің айналасын орталық пиксель мәнімен салыстыру арықылы және нәтижені екілік сан ретінде түсіндіру арқылы белгілейді. Содан кейін таңбалардың гистограммасын, текстураның дескрипторы ретінде пайдалануға болады. Бұл жұмыста текстуралық дескрипторлар бет-келбетінің белгілерінің векторы ретінде қолданылған және ол келесі (1) теңдеуде ұсынылған.
(1)
бұл жерде орталық пиксельдің сұр мәні көрші пикселдің сұр мәні. N көрші пиксельдің суммалық мәні, R көршілестік радиус, анықтама орталық пиксельден алыс орналасқан пикселдердің қашықтығы. операторын белгілеу анықтамасы 1 пиксель радуисы және 8 іріктелген нүктелер осылайша белгілейміз. Тағы бір маңызды нәрсе — «біркелкі үлгілердің» анықтамасы. LBP біртекті ретінде анықталады, егер оның құрамында кемінде 1–0 немесе 0–1 қамтылуы керек, ол айналмалы бит жолы ретінде қараған кездегі ауысулар айтамыз. Солайша біз 8-биттік 00110000 және 00000000 біркелкі деп, ал 01010100 және 10011010 айта алмаймыз.
Сурет. 1. LBP шаблоны
Текстуралық кескіндермен жүргізілген тәжірибелерде біртекті өрнектер барлық өрнектердің 90 % — нан азын құрайтынын байқады, көршілік ішіндегі (8,1) және шамамен 70 % (16,2) көрсетті. Осылайша, барлық гетерогенді шаблондарға бір еркін санды тағайындау кезінде аз ақпарат жоғалады. 256 мүмкін болатын мәндерің 8 биттік үлгілерінен тек 58-і біртекті болғандықтан, бұл LBP гистограммаларын салу кезінде кеңістікті едәуір үнемдеуге мүмкіндік береді. R = 1, N = 16 біркелкі операторы ретінде берілген.
Жасанды нейрондық желі алгоритімі (ANN) адамның биологиялық жүйке жүйесіне негізделген. ANN күрделі шаблондарды және болжау проблемаларын модельдеу үшін қолданылады. Олар сызықты емес және күрделі қатынастарды зерттеу және модельдеу қабілетіне ие болғандықтан, бұл өте маңызды, өйткені нақты өмірде кіріс және шығыс арасындағы көптеген қатынастар сызықты емес, күрделі болып табылады. Бастапқы кірістер мен олардың арасындағы байланысын зерттей отырып, ол көрінбейтін мәліметтер негізінде көрінбейтін қатынастарды шығара алады, бұл модельге көрінбейтін мәліметтер негізінде жалпылауға және болжауға мүмкіндік береді. ANN оқу процесі кері таралу алгоритмін қолданылған. Кері таралу — бұл тікелей басқарылуы қадағаланатын оқыту желісі айтамыз [3]. Тікелей байланысқан көп қабатты нейрондық желілер үш қабаттан тұрады: кіріс қабаты, жасырын қабат және шығыс қабаты. Қабаттар түйіндері деректерді тәуелсіз есептеуді жүргізеді және оларды келесі деңгейге өткізу арқылы шығысқа апарады. Қабат түйіндеріндегі деректерді есептеу бұл кіріс және шығыс мәндерінің өлшенген қосындысы болып табылады, ал түйіндердің шығуы шекті функция, сигмоидт тәрізді, гиперболалық активтендіру функциясымен арқылы жүзеге асады. Кіріс қабаттары активтендіру функциясын қолданбайтынын айтып кеткен дұрыс.
Шығыс мәні мақсаттық мәнмен салыстырылып және қателер есептеліп қайта жасырын қабаттарға салмақтарын реттеу үшін жіберіледі. Кері таралу және салмақты түзету процесі қате рұқсат етілген деңгейден төмен түскенге дейін жүзеге асырылады. Оқытудың бұл итерация процесі эпоха деп те аталады.
Дерекқорлар. Жергілікті аймақтың және желідегі адамдардың бет-келбетінің суреттерін қолдану негізінде құрылған дерекқорлар қолданылды. -90° ден 90° қа дейінгі және 15° вариациясында орналасқан бейне қолданылған.
Әдіс. Python бағдарламалау тілінде «OpenCV», «PIL» және «scikit image» кескін өңдеу кітапханаларын қолдана отырып модельдер оқытылды. Viola–Jones негізінде Haar каскадталған алгоритм нейронның кіріс қабатында келбеттің кескінін анықтау үшін қолданылды.
Объектілерді алу алдында келесі процесс орын алады, оқыту іріктемелерін құру үшін қырларды алдын ала өңдеу орындалады.
1) Анықталған беттер сағат тілімен бұрылады (1°,3°,4°,6°,7°,9°,10°,12°,13°) сағат тіліне қарсы (1°,2°,4°,5°,7°,8°,10°,11°,13°) 846 оқыту үлгісін құрылды.
2) Бет кіші бөліктерге бөлінеді. Әрбір қосалқы аймақ үшін LBP мәні бірыңғай LBP операторын қолдана отырып есептеледі.
3) Есептелген біртекті LBP мәндерін қолдана отырып, LBP гистограммалары жасалады және бірыңғай белгілер векторына біріктіріледі
Бұл гистограммаларда пиксель деңгейіндегі шаблондар туралы ақпаратды қамтиды, ішкі қабаттардың гистограммалары беттің жалпы сипаттамасын құру үшін біріктіріледі. Бұл есептеу процесі барлық адамдар үшін жасалады және кейіннен нейрондық желіні оқыту үшін қолданылатын мәліметтер базасында сақталады. Біртекті LBP операторын пайдалану кезінде бет бейнесінің әрбір кіші түрі үшін 12 мәннен тұратын гистограмма жасалды. Беттің әр гистограммасы үшін барлығы 108 мән жасалды.
Мақсатты мәндерді есептеу үшін Хи-квадрат қашықтықтың сәйкес келмеу өлшемі қолданылады. Мақсатты мәндер анықталған адамдардың гистограммаларын оқу үлгісінің гистограммаларымен салыстыру арқылы есептеледі. Хи-квадраттың төменгі қашықтық мәні ең жақсы деп саналады. Желінің шығысы қатені есептеу үшін мақсатты мәнмен салыстырылады және салмақты түзету үшін қайтадан таратылады.
Кіріс қабатының 108, 80 түйіні жасырын қабат үшін таңдалады, сондықтан желі тек беттің маңызды ерекшеліктерін жинақтай алады, 47 түйін шығыс қабаты үшін әр адамға бір түйін ретінде таңдалды. Нейрондық желінің оқу жылдамдығы 0,3-ке тең болды, ал бастапқы салмақтар кездейсоқ есептелді. Активтендіру функциясы ретінде логарифмдік сигма тәрізді функция қолданылды. Оқыту кезеңдері 2000 эпохаға тең.
Қорытынды. 1 кестеде әрбір сынақ үлгісі үшін ANN оқу процесін көрсетеді. Жалпы 2000 эпоха жүргізілді. Нейрондық желінің өнімділігі 100 эпохада 17.03 % — дан 1300 эпохада 91,75 %- ға дейін өсті. 1300 эпохадан кейін өнімділік 90,76 % деңгейінде қалды. 1300 эпохада ең жоғары орташа өнімділікке қол жеткізілді — 91,75 %. ANN арқылы оқытуға жұмсалған жалпы уақыт 7 минутты құрады. Нәтижелер ANN деректерді жалпылап, көрінбейтін деректерді болжай алатындығын көрсетеді.
Кесте 1
Жұмыс тиімділігін бағалау
Эпоха |
100 |
300 |
500 |
800 |
Сынақталды |
||||
2° |
11/36 23.4 % |
18/29 38.3 % |
32/15 68.1 % |
37/10 78.7 % |
5° |
9/38 19.1 % |
16/31 34 % |
28/19 59.6 % |
35/12 74.5 % |
8° |
8/39 17 % |
17/30 36.2 % |
21/26 44.7 % |
32/15 68.1 % |
11° |
6/41 12.8 % |
11/36 23.4 % |
20/27 42.6 % |
31/16 66 % |
-3° |
10/37 21.3 % |
16/31 34 % |
31/16 66 % |
38/9 80.9 % |
-6° |
7/40 14.9 % |
15/32 31.9 % |
26/21 55.3 % |
33/14 70.2 % |
-9° |
7/40 14.9 % |
15/32 31.9 % |
23/24 48.9 % |
29/18 61.7 % |
-12° |
6/41 12.8 % |
13/34 27.7 % |
23/24 48.9 % |
29/18 61.7 % |
Сынақ уақыты(сек.) |
20.85 |
20.99 |
20.86 |
21.01 |
Ораташа % |
17.03 % |
32.18 % |
54.26 % |
70.23 % |
Әдебиет:
1. Lian Hock Koh, Surendra Ranganath, and Y. V. Venkatesh, “An integrated automatic face detection and recognition system,” Pattern Recognition, стр. 1259–1273,2002
2. Yongsheng Gao and Maylor K. H. Leung, “Face recognition using line edge map,” 24, ном. 6, стр. 764–779, июнь 2002.
- Yongsheng Gao and Maylor K. H. Leung, “Face recognition using line edge map,” IEEE Transactions on Pattem Analysis and Machine Intelligence. ном. 6, стр. 764–779, июнь 2002