Жасанды нейрон желісі негізінде символдарды оптикалық тану | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 30 ноября, печатный экземпляр отправим 4 декабря.

Опубликовать статью в журнале

Автор:

Рубрика: Молодой ученый Қазақстан

Опубликовано в Молодой учёный №24 (314) июнь 2020 г.

Дата публикации: 13.06.2020

Статья просмотрена: 172 раза

Библиографическое описание:

Жунис, Батырбек Женисбекулы. Жасанды нейрон желісі негізінде символдарды оптикалық тану / Батырбек Женисбекулы Жунис. — Текст : непосредственный // Молодой ученый. — 2020. — № 24 (314). — С. 538-540. — URL: https://moluch.ru/archive/314/71543/ (дата обращения: 18.11.2024).



Символдарды оптикалық тану бейнеден символдарды тану және жіктеу ісіне ие. Тану дәл болу үшін белгілі бір топологиялық және геометриялық қасиеттері есептеледі, олардың негізінде символ жіктеледі және танылады. Сонымен қатар, адам психологиясы олардың жалпы формасы мен ерекшеліктері бойынша символдарды қабылдайды, мысалы, штрихтар, иілу, шығыңқы, қоршаулар және т. б. Бұл қасиеттер, сондай-ақ нысандар деп аталатын пикселдер негізіндегі кеңістіктік есептеу арқылы бейнеден алынады.

Векторлар деп аталатын мұндай белгілер жиынтығы белгілердің осы векторларын қолданатын жасанды нейрондық желінің көмегімен символды анықтауға көмектеседі.

Ключевые слова: Белгілерді Шығару, Векторларды Генерациялау, Корреляция Коэффициенттері, Жасанды Нейрондық Желілер.

Оптическое распознавание символов имеет дело с распознаванием и классификацией символов на изображении. Для точного распознавания рассчитываются определенные топологические и геометрические свойства, на основании которых персонаж классифицируется и распознается. Кроме того, человеческая психология воспринимает персонажей по их общей форме и чертам, таким как штрихи, кривые, выступы, вложения и т. д. Эти свойства, также называемые чертами, извлекаются из изображения с помощью пространственных пиксельных вычислений. Набор таких функций, называемых векторами, помогает в уникальном определении персонажа с помощью искусственной нейронной сети, которая использует эти векторы признаков.

Ключевые слова: извлечение признаков, генерация вектора, коэффициенты корреляции, искусственные нейронные сети.

Автоматты оптикалық тану көбінесе компьютерлік көру, мәтінді интеллектуалды тану және мәтінге негізделген шешім қабылдау жүйелерінде қолданылуына байланысты қарқын алды. Мәтінді тану мәселесін шешуде қолданылатын тәсіл адамдар қабылдаған кейіпкерлердің психологиясына негізделді. Сонымен, тану үшін кейіпкердің геометриялық ерекшеліктері мен оның нұсқалары қарастырылды [1, 126 б.]. Кейін алдын ала анықталған үлгілермен кіріс символдарын салыстыруды қамтитын үлгілердің салыстыру тәсілі қолданылды. Бұл әдіс символдарды нақты сәйкестік немесе мүлдем сәйкестік емес ретінде таниды. Ол сондай-ақ нысанды елеулі өзгертуді көздемеген стильдің еңістігі мен вариациялары сияқты әсерлерді ескермейді. Басқа тәсіл, атап айтқанда, корреляция коэффициенттерін пайдалана отырып тану, елеусіз айырмашылықтарды ескеру үшін кіріс символдарының Қиыспалы корреляциясына немесе олардың деректер базасының шаблондарымен түрлендірілуіне негізделген. Ол «I« мен «J«, «B« мен "8", «O«, «Q« мен "0" және т. б. сияқты формаға өте ұқсас символдар арасында жалған немесе қате тану енгізді. Бұл мәселені шешу ЖНЖ-да, пішін, симметрия, жабық немесе ашық аймақтар және пикселдер саны сияқты топологиялық ерекшеліктердің негізінде символды қабылдай алатын жүйеде жатыр. Мұндай жүйенің артықшылығы ол "үлгілерде» оқытылуы мүмкін, содан кейін белгілердің ұқсас жиынтығы бар символдарды тану үшін пайдаланылуы мүмкін. Осы жүйеде пайдаланылатын ЖНЖ өзінің кіріс деректерін белгілер векторы түрінде алады. Бұл әрбір объект немесе сипат бөлінеді және сандық мән беріледі дегенді білдіреді. Әрбір символды бір мәнді сәйкестендіру үшін пайдалануға болатын осы сандық мәндер жиынтығы оның векторы деп аталады. Осылайша, желіні оқыту үшін оның топологиялық қасиеттері негізінде әрбір символды тиімді тануға мүмкіндік беретін векторлық деректер базасы қолданылады [2, 111 б.].

Алдын-ала өңдеу

Кез келген сурет тану жүйесіне берілгенге дейін кейбір алдын ала өңдеуді қажет етеді. Бірінші қадам-кескіннің кез келген түрін екілік кескінге түрлендіру (пиксельдің мәні тек “0” және “1”) [3].

“Бинаризация” кез келген суретті ақ фонда жазылған қара мәтін сериясына түрлендіреді. Осылайша, ол барлық кіріс суреттерінің біртектілігін ықпалдандырады. Контраст, айқындылық және т. б. сияқты басқа да әсерлер сурет бинаризациядан кейін де оңай өңделуі мүмкін. Жүйеде пайдаланылатын ЖНЖ кіріс деректер ретінде “белгілер векторларын” пайдаланады. Осылайша, әрбір символ алдын ала өңделген бейнеден сегменттейді. Бұл сегменттеу екі кезеңде өтеді. Біріншіден, әрбір жол кіріс бейнесінде бөлінеді. Содан кейін әрбір символ әр жолда бөлінеді. “Блок-кандидатты” бөлу кезеңі суреттің бір бөлігінде ғана танылатын “мәтін” бар жерде қажет екенін атап өтуге болады. Сегменттеу символ қабырғаларын есептеу арқылы орындалуы мүмкін, мұнда “қара” пиксельдердің сомасы символ перифериясы бойынша нөлге тең. Содан кейін осылайша бөлінген әрбір символ ЖНЖ оқыту үшін пайдаланылған “үлгілерге” бару үшін өлшем мен фокус тұрғысынан қалпына келеді [4].

Белгілерді алу

Белгілерді алу екі мақсатқа қызмет етеді: олардың бірі символды бірдей сәйкестендіре алатын қасиеттерді алу болып табылады. Екіншіден, ұқсас симводарды ажырататын қасиеттерді алу. Символ әр түрлі жолдармен жазылуы мүмкін, және ол адаммен оңай дұрыс танылуы мүмкін. Осылайша, барлық вариациялық айырмашылықтардан асып түсетін қағидаттар немесе логикалар жиынтығы бар. Жүйе пайдаланатын белгілер кейіпкерлер психологиясына жақын қасиеттерге әсер етеді. Біздің алгоритмде символдарды анықтау үшін әр түрлі белгілер жиынтығы қолданылды. Олар суретте көрсетілгендей, символ биіктігінің бойымен әр түрлі қашықтықта салынған көлденең сызықтардың бойындағы пикселдердің сомасын қамтиды (сурет 1). Бұл параметрлер биіктігі бойынша профильдің өзгеру еніне байланысты бір символдан екіншісіне ерекшеленеді. Егер қара алдыңғы жоспары (мәтіні) және ақ фоны бар бағандардың “m” жолдары және “n” бағандарының екілік суретін қарастырсақ, онда әрбір пиксель ақ немесе қара болып табылатындығына байланысты “1” немесе “0” мәні бар [5]. Осылайша, объектінің белгілі бір биіктігіндегі барлық тиісті пиксельдердің сомасын c*m деп айтамыз (c = масштабты константа, 0

(1.1)

мұнда I (c*m, p) = орналасқан жердегі қара пиксель (c*m, p).

Сурет 1. Түрлі биіктіктегі көлденең сызықтар

Сол сияқты, пиксельдің сомасын бейнелейтін ені бойынша әр түрлі қашықтықтарда салынған тік сызықтардың жиынтығы да суретте көрсетілгендей басқа объектілер жиынтығы бола алады. Тік сызық бойымен пиксельдердің математикалық сомасы c*n ені кезінде мынадай түрде беріледі (сурет 2).

(1.2)

мұнда I (p, c*n) = орналасқан жердегі қара пиксель (p, c*n).

Сурет 2. Ені бойынша тік сызықтар

Симметрия — бұл “8” және “B” сияқты символдар арасындағы біртектілікті азайту үшін пайдаланылуы мүмкін тағы бір параметр олардың көлденең симметриясы негізінде дифференциалдауы мүмкін, ал “I” және “J” олардың тік симметриясы негізінде оңай дифференциалдауы мүмкін. Бұл параметрлер «симметрия дәрежесін» көрсетеді, яғни «шынайы» немесе «жалған» емес, 0-ден (симметрияның болмауы) 1-ге (тамаша симметрия) дейінгі ондық мәнді көрсетеді. Ол үшін біз матрица жасаймыз, айталық М, екінші жартысы айналы көрініс болатын бірінші жартысы бар (көлденең немесе тік). Содан кейін “М” және “I” арасында корреляция анықталады. Бұл корреляция деңгейі бізге сипатқа ие сол симметрия дәрежесін береді [6].

Қорытынды

ЖНЖ негізіндегі жүйе үлгілердің бір жиынтығында ғана оқуға қарамастан (кез келген алдын ала белгіленген қаріптен тәуелсіз), көп үміт күттіретін нәтижелерді көрсетті, ол тек 21 секундта оқылып қана қоймай, сонымен қатар жоғары тиімділікпен қаріптерді (ол үшін оқытылмаған) тануы мүмкін. Бұл жүйенің өз артықшылықтары бар, мысалы, аз уақыт күрделілігі, өте аз деректер қоры және стандартталмаған кіріс мәліметтеріне жоғары бейімделуі, әдіспен салыстырғанда есептеу үшін функциялардың аз саны бар. Дегенмен, бұл жүйе одан әрі даму үшін үлкен кеңістікке ие.

Жүйенің өнімділігі одан да көп болуы мүмкін:

1) ЖНЖ оқыту үшін пайдаланылатын деректер базасын ұлғайту, ол сондай-ақ стильденген қаріптерді тануы мүмкін;

2) үлкен деректер қорын өңдеу кезінде уақытша қиындықты азайту үшін ЖНЖ оқыту арқылы ең жақсы алгоритмдерді пайдалану;

3) нәтижелердің дәлдігін арттыру үшін белгілерді алудың жақсартылған әдістері;

4) символдарды психология немесе сипат бойынша танитын, оларды шаблондар тізімімен салыстыру жолымен емес алгоритмдерді енгізу. Бұл адамның мәтінді қабылдау үлгісі бойынша жасалған ЖНЖ арқылы тануды шақыру үшін соңғы қадам болар еді.

Әдебиет:

  1. Автоматты идентификация және деректерді жазып алу технологиялары қауымдастығының таңбаларды оптикалық тануы, 2011 ж. — Б. 125–127.
  2. Таяу Шығыс университетінің нейрондық желілерді қолдану арқылы белгілерді тану, Солтүстік Кипр, 2014 ж. — Б. 110–120.
  3. Жасанды нейрондық желілерді пайдалану арқылы жасанды интеллект OCR енгізу Курт Альфред Клювер компьютерлік және ақпараттық ғылымдар колледжі Голизано Рочестер технологиялық институты ақпан 18, 2008
  4. Нейрондық желілерді пайдалана отырып символдарды оптикалық тану (ЕЭК 539 жобалық есебі) Дипаян Саркар, Статистика департаменті Висконсин университеті, 2003 ж. — Б. 5–9.
  5. Нейрондық желілерді пайдалана отырып, CPT өлшеулері бойынша құмдардың геотехникалық параметрлерін болжау. Автор: Хсейн Хуанг, Пинг С. Лу және Кэролайн Дж. Чен.
  6. S. Mori, C. Y. Suen және K. Kamamoto, «OCR зерттеулер мен әзірлемелерге тарихи шолу», 1992 ж. — Б. 1029–1058.
Основные термины (генерируются автоматически): немес, символ, бар, мена.


Ключевые слова

Белгілерді Шығару, Векторларды Генерациялау, Корреляция Коэффициенттері, Жасанды Нейрондық Желілер

Похожие статьи

Қазақ және ағылшын тілдеріндегі «билік» концептісінің көрінісі және аударма мәселесі

Мақалада көптеген тілдердегі негізгі концептілердің бірі болып табылатын және басқа да тірек ұғымдарды біріктіретін және жинақтайтын «билік» концептісінің қазақ және ағылшын тілдеріндегі ұлттық-мәдени ерекшеліктері талданып, аударма мәселелеріне наза...

Мектеп математика курсында графтар теориясын қолдана отырып комбинаторлық есептерді шешуді оқыту әдістемесі

Комбинаторлық есептерді шешуді оқытудың ерекшеліктері негізгі мектептегі графикалық әдіс және олимпиадалық тапсырмаларды таңдау зерттеу тақырыбы. Ғылым мен практикада жиі кездесетін міндеттер бар, оларды шешу біреуіне немесе екіншісіне бағынатын әртү...

Жоғары оқу орындарына басқару еркіндігін беру

Бұл мақалада персоналды басқарудың педагогикалық жағдайларын талдау, білім беру мекемесінің жұмыс істеу ерекшелігі, және жүзеге асырылатын оқытушылық функциялар қарастырылған. Зерттеудің негізгі мазмұны еліміздің жоғары оқу орындарына білім берудің б...

Тіл меңгерушілер арасында әлеуметтік лингвистикалық құзіреттілікті қалыптастыру

Аталған мақалада кез-келген шет тілін үйрену,меңгеру,жетік білу мақсатында қалыптастыра алатын әлеуметтік және лингвистикалық деп аталатын екі түрлі құзіреттіліктерді қалыптастыру жолын үйренеміз.Жалпылама түрғыдан адамзаттың сөйлеу тілі дегеніміз- л...

Орта білім беруде виртуалды оқытудың тиімділігі

Қазіргі уақытта «Виртуалды» деген атау күнделікті өмірде көп пайдаланатын сөзге айналды. «Виртуалды» термині латынның «virtus» (лат. virtus — ақиқат) сөзінен шыққан. Қазіргі таңда осы «виртуалдық» ұғымы білім беру саласына да енді. Виртуалды білім бе...

Үлкен көлемді сақтау және өңдеу әдістері растрлық форматтардағы кеңістіктік деректер

Мақала есептеу желісі ортасында таратылған географиялық ақпараттық жүйелерді (ГАЖ) пайдалану мүмкіндігін қарастырады. Мұндай шешім кеңістіктегі деректердің үлкен көлемін (big data) сақтау және талдау мәселесін шешуді талап етеді. Таратылған ГАЖ қасие...

Кәсіпорын менеджері ақпараттық жүйені қалай тиімді пайдалануы қажет

Соңғы жылдары компьютерлік ақпараттық технологиялар саласындағы жетістіктер менеджерлер шешім қабылдау мен іске асыруда қолданылатын жүйелердің алуан түрлілігіне әкелді. Жалпы алғанда, бұл жүйелер нөлден бастап нақты мақсаттар үшін жасалды және мәлім...

Ақпараттық жүйелерде криптоқорғау тәсілдерін қолдану

Бұл зерттеу криптография киберқылмыскерлерден өте құпия және құнды ақпаратты қорғаудың өте тиімді әдісі болып табылады. Ақпараттық қауіпсіздік бүкіл әлемдегі ең ыстық тақырыптардың бірі болып табылады. Ақпаратты қорғау әдістері мен кілттерін қамтамас...

Мұнай резервуарларын толтыруды автоматтандыру үрдісін анық емес логикалық алгоритмдерде құру

Мұнай өнеркәсібі жалпы, Қазақстан Республикасының маңызды салаларының бірі және мемлекетіміздің бүкіл экономикасының дамуына әсер етеді. Мұнай резервуарларын автоматтандырудың негізгі мақсаты — мұнай өнімдерін қабылдау, сақтау, тарату, өлшеу және есе...

«Комбинаторика» тақырыбы бойынша олимпиада есептерін шешу

Мақалада комбинаторика тақырыбы бойынша оқушыларды олимпиадаға дайындауға арналған тапсырмалар түрлері берілген. Комбинаториканың классикалық мәселесі қайталанбайтын комбинациялар саны туралы мәселе болып табылады, оның мазмұны мына сұрақпен көрсетіл...

Похожие статьи

Қазақ және ағылшын тілдеріндегі «билік» концептісінің көрінісі және аударма мәселесі

Мақалада көптеген тілдердегі негізгі концептілердің бірі болып табылатын және басқа да тірек ұғымдарды біріктіретін және жинақтайтын «билік» концептісінің қазақ және ағылшын тілдеріндегі ұлттық-мәдени ерекшеліктері талданып, аударма мәселелеріне наза...

Мектеп математика курсында графтар теориясын қолдана отырып комбинаторлық есептерді шешуді оқыту әдістемесі

Комбинаторлық есептерді шешуді оқытудың ерекшеліктері негізгі мектептегі графикалық әдіс және олимпиадалық тапсырмаларды таңдау зерттеу тақырыбы. Ғылым мен практикада жиі кездесетін міндеттер бар, оларды шешу біреуіне немесе екіншісіне бағынатын әртү...

Жоғары оқу орындарына басқару еркіндігін беру

Бұл мақалада персоналды басқарудың педагогикалық жағдайларын талдау, білім беру мекемесінің жұмыс істеу ерекшелігі, және жүзеге асырылатын оқытушылық функциялар қарастырылған. Зерттеудің негізгі мазмұны еліміздің жоғары оқу орындарына білім берудің б...

Тіл меңгерушілер арасында әлеуметтік лингвистикалық құзіреттілікті қалыптастыру

Аталған мақалада кез-келген шет тілін үйрену,меңгеру,жетік білу мақсатында қалыптастыра алатын әлеуметтік және лингвистикалық деп аталатын екі түрлі құзіреттіліктерді қалыптастыру жолын үйренеміз.Жалпылама түрғыдан адамзаттың сөйлеу тілі дегеніміз- л...

Орта білім беруде виртуалды оқытудың тиімділігі

Қазіргі уақытта «Виртуалды» деген атау күнделікті өмірде көп пайдаланатын сөзге айналды. «Виртуалды» термині латынның «virtus» (лат. virtus — ақиқат) сөзінен шыққан. Қазіргі таңда осы «виртуалдық» ұғымы білім беру саласына да енді. Виртуалды білім бе...

Үлкен көлемді сақтау және өңдеу әдістері растрлық форматтардағы кеңістіктік деректер

Мақала есептеу желісі ортасында таратылған географиялық ақпараттық жүйелерді (ГАЖ) пайдалану мүмкіндігін қарастырады. Мұндай шешім кеңістіктегі деректердің үлкен көлемін (big data) сақтау және талдау мәселесін шешуді талап етеді. Таратылған ГАЖ қасие...

Кәсіпорын менеджері ақпараттық жүйені қалай тиімді пайдалануы қажет

Соңғы жылдары компьютерлік ақпараттық технологиялар саласындағы жетістіктер менеджерлер шешім қабылдау мен іске асыруда қолданылатын жүйелердің алуан түрлілігіне әкелді. Жалпы алғанда, бұл жүйелер нөлден бастап нақты мақсаттар үшін жасалды және мәлім...

Ақпараттық жүйелерде криптоқорғау тәсілдерін қолдану

Бұл зерттеу криптография киберқылмыскерлерден өте құпия және құнды ақпаратты қорғаудың өте тиімді әдісі болып табылады. Ақпараттық қауіпсіздік бүкіл әлемдегі ең ыстық тақырыптардың бірі болып табылады. Ақпаратты қорғау әдістері мен кілттерін қамтамас...

Мұнай резервуарларын толтыруды автоматтандыру үрдісін анық емес логикалық алгоритмдерде құру

Мұнай өнеркәсібі жалпы, Қазақстан Республикасының маңызды салаларының бірі және мемлекетіміздің бүкіл экономикасының дамуына әсер етеді. Мұнай резервуарларын автоматтандырудың негізгі мақсаты — мұнай өнімдерін қабылдау, сақтау, тарату, өлшеу және есе...

«Комбинаторика» тақырыбы бойынша олимпиада есептерін шешу

Мақалада комбинаторика тақырыбы бойынша оқушыларды олимпиадаға дайындауға арналған тапсырмалар түрлері берілген. Комбинаториканың классикалық мәселесі қайталанбайтын комбинациялар саны туралы мәселе болып табылады, оның мазмұны мына сұрақпен көрсетіл...

Задать вопрос