Жасанды нейрон желісі негізінде символдарды оптикалық тану | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 11 июля, печатный экземпляр отправим 15 июля.

Опубликовать статью в журнале

Автор:

Рубрика: Молодой ученый Қазақстан

Опубликовано в Молодой учёный №24 (314) июнь 2020 г.

Дата публикации: 13.06.2020

Статья просмотрена: 8 раз

Библиографическое описание:

Жунис, Батырбек Женисбекулы. Жасанды нейрон желісі негізінде символдарды оптикалық тану / Батырбек Женисбекулы Жунис. — Текст : непосредственный // Молодой ученый. — 2020. — № 24 (314). — С. 538-540. — URL: https://moluch.ru/archive/314/71543/ (дата обращения: 03.07.2020).



Символдарды оптикалық тану бейнеден символдарды тану және жіктеу ісіне ие. Тану дәл болу үшін белгілі бір топологиялық және геометриялық қасиеттері есептеледі, олардың негізінде символ жіктеледі және танылады. Сонымен қатар, адам психологиясы олардың жалпы формасы мен ерекшеліктері бойынша символдарды қабылдайды, мысалы, штрихтар, иілу, шығыңқы, қоршаулар және т. б. Бұл қасиеттер, сондай-ақ нысандар деп аталатын пикселдер негізіндегі кеңістіктік есептеу арқылы бейнеден алынады.

Векторлар деп аталатын мұндай белгілер жиынтығы белгілердің осы векторларын қолданатын жасанды нейрондық желінің көмегімен символды анықтауға көмектеседі.

Ключевые слова: Белгілерді Шығару, Векторларды Генерациялау, Корреляция Коэффициенттері, Жасанды Нейрондық Желілер.

Оптическое распознавание символов имеет дело с распознаванием и классификацией символов на изображении. Для точного распознавания рассчитываются определенные топологические и геометрические свойства, на основании которых персонаж классифицируется и распознается. Кроме того, человеческая психология воспринимает персонажей по их общей форме и чертам, таким как штрихи, кривые, выступы, вложения и т. д. Эти свойства, также называемые чертами, извлекаются из изображения с помощью пространственных пиксельных вычислений. Набор таких функций, называемых векторами, помогает в уникальном определении персонажа с помощью искусственной нейронной сети, которая использует эти векторы признаков.

Ключевые слова: извлечение признаков, генерация вектора, коэффициенты корреляции, искусственные нейронные сети.

Автоматты оптикалық тану көбінесе компьютерлік көру, мәтінді интеллектуалды тану және мәтінге негізделген шешім қабылдау жүйелерінде қолданылуына байланысты қарқын алды. Мәтінді тану мәселесін шешуде қолданылатын тәсіл адамдар қабылдаған кейіпкерлердің психологиясына негізделді. Сонымен, тану үшін кейіпкердің геометриялық ерекшеліктері мен оның нұсқалары қарастырылды [1, 126 б.]. Кейін алдын ала анықталған үлгілермен кіріс символдарын салыстыруды қамтитын үлгілердің салыстыру тәсілі қолданылды. Бұл әдіс символдарды нақты сәйкестік немесе мүлдем сәйкестік емес ретінде таниды. Ол сондай-ақ нысанды елеулі өзгертуді көздемеген стильдің еңістігі мен вариациялары сияқты әсерлерді ескермейді. Басқа тәсіл, атап айтқанда, корреляция коэффициенттерін пайдалана отырып тану, елеусіз айырмашылықтарды ескеру үшін кіріс символдарының Қиыспалы корреляциясына немесе олардың деректер базасының шаблондарымен түрлендірілуіне негізделген. Ол «I« мен «J«, «B« мен "8", «O«, «Q« мен "0" және т. б. сияқты формаға өте ұқсас символдар арасында жалған немесе қате тану енгізді. Бұл мәселені шешу ЖНЖ-да, пішін, симметрия, жабық немесе ашық аймақтар және пикселдер саны сияқты топологиялық ерекшеліктердің негізінде символды қабылдай алатын жүйеде жатыр. Мұндай жүйенің артықшылығы ол "үлгілерде» оқытылуы мүмкін, содан кейін белгілердің ұқсас жиынтығы бар символдарды тану үшін пайдаланылуы мүмкін. Осы жүйеде пайдаланылатын ЖНЖ өзінің кіріс деректерін белгілер векторы түрінде алады. Бұл әрбір объект немесе сипат бөлінеді және сандық мән беріледі дегенді білдіреді. Әрбір символды бір мәнді сәйкестендіру үшін пайдалануға болатын осы сандық мәндер жиынтығы оның векторы деп аталады. Осылайша, желіні оқыту үшін оның топологиялық қасиеттері негізінде әрбір символды тиімді тануға мүмкіндік беретін векторлық деректер базасы қолданылады [2, 111 б.].

Алдын-ала өңдеу

Кез келген сурет тану жүйесіне берілгенге дейін кейбір алдын ала өңдеуді қажет етеді. Бірінші қадам-кескіннің кез келген түрін екілік кескінге түрлендіру (пиксельдің мәні тек “0” және “1”) [3].

“Бинаризация” кез келген суретті ақ фонда жазылған қара мәтін сериясына түрлендіреді. Осылайша, ол барлық кіріс суреттерінің біртектілігін ықпалдандырады. Контраст, айқындылық және т. б. сияқты басқа да әсерлер сурет бинаризациядан кейін де оңай өңделуі мүмкін. Жүйеде пайдаланылатын ЖНЖ кіріс деректер ретінде “белгілер векторларын” пайдаланады. Осылайша, әрбір символ алдын ала өңделген бейнеден сегменттейді. Бұл сегменттеу екі кезеңде өтеді. Біріншіден, әрбір жол кіріс бейнесінде бөлінеді. Содан кейін әрбір символ әр жолда бөлінеді. “Блок-кандидатты” бөлу кезеңі суреттің бір бөлігінде ғана танылатын “мәтін” бар жерде қажет екенін атап өтуге болады. Сегменттеу символ қабырғаларын есептеу арқылы орындалуы мүмкін, мұнда “қара” пиксельдердің сомасы символ перифериясы бойынша нөлге тең. Содан кейін осылайша бөлінген әрбір символ ЖНЖ оқыту үшін пайдаланылған “үлгілерге” бару үшін өлшем мен фокус тұрғысынан қалпына келеді [4].

Белгілерді алу

Белгілерді алу екі мақсатқа қызмет етеді: олардың бірі символды бірдей сәйкестендіре алатын қасиеттерді алу болып табылады. Екіншіден, ұқсас симводарды ажырататын қасиеттерді алу. Символ әр түрлі жолдармен жазылуы мүмкін, және ол адаммен оңай дұрыс танылуы мүмкін. Осылайша, барлық вариациялық айырмашылықтардан асып түсетін қағидаттар немесе логикалар жиынтығы бар. Жүйе пайдаланатын белгілер кейіпкерлер психологиясына жақын қасиеттерге әсер етеді. Біздің алгоритмде символдарды анықтау үшін әр түрлі белгілер жиынтығы қолданылды. Олар суретте көрсетілгендей, символ биіктігінің бойымен әр түрлі қашықтықта салынған көлденең сызықтардың бойындағы пикселдердің сомасын қамтиды (сурет 1). Бұл параметрлер биіктігі бойынша профильдің өзгеру еніне байланысты бір символдан екіншісіне ерекшеленеді. Егер қара алдыңғы жоспары (мәтіні) және ақ фоны бар бағандардың “m” жолдары және “n” бағандарының екілік суретін қарастырсақ, онда әрбір пиксель ақ немесе қара болып табылатындығына байланысты “1” немесе “0” мәні бар [5]. Осылайша, объектінің белгілі бір биіктігіндегі барлық тиісті пиксельдердің сомасын c*m деп айтамыз (c = масштабты константа, 0

(1.1)

мұнда I (c*m, p) = орналасқан жердегі қара пиксель (c*m, p).

Сурет 1. Түрлі биіктіктегі көлденең сызықтар

Сол сияқты, пиксельдің сомасын бейнелейтін ені бойынша әр түрлі қашықтықтарда салынған тік сызықтардың жиынтығы да суретте көрсетілгендей басқа объектілер жиынтығы бола алады. Тік сызық бойымен пиксельдердің математикалық сомасы c*n ені кезінде мынадай түрде беріледі (сурет 2).

(1.2)

мұнда I (p, c*n) = орналасқан жердегі қара пиксель (p, c*n).

Сурет 2. Ені бойынша тік сызықтар

Симметрия — бұл “8” және “B” сияқты символдар арасындағы біртектілікті азайту үшін пайдаланылуы мүмкін тағы бір параметр олардың көлденең симметриясы негізінде дифференциалдауы мүмкін, ал “I” және “J” олардың тік симметриясы негізінде оңай дифференциалдауы мүмкін. Бұл параметрлер «симметрия дәрежесін» көрсетеді, яғни «шынайы» немесе «жалған» емес, 0-ден (симметрияның болмауы) 1-ге (тамаша симметрия) дейінгі ондық мәнді көрсетеді. Ол үшін біз матрица жасаймыз, айталық М, екінші жартысы айналы көрініс болатын бірінші жартысы бар (көлденең немесе тік). Содан кейін “М” және “I” арасында корреляция анықталады. Бұл корреляция деңгейі бізге сипатқа ие сол симметрия дәрежесін береді [6].

Қорытынды

ЖНЖ негізіндегі жүйе үлгілердің бір жиынтығында ғана оқуға қарамастан (кез келген алдын ала белгіленген қаріптен тәуелсіз), көп үміт күттіретін нәтижелерді көрсетті, ол тек 21 секундта оқылып қана қоймай, сонымен қатар жоғары тиімділікпен қаріптерді (ол үшін оқытылмаған) тануы мүмкін. Бұл жүйенің өз артықшылықтары бар, мысалы, аз уақыт күрделілігі, өте аз деректер қоры және стандартталмаған кіріс мәліметтеріне жоғары бейімделуі, әдіспен салыстырғанда есептеу үшін функциялардың аз саны бар. Дегенмен, бұл жүйе одан әрі даму үшін үлкен кеңістікке ие.

Жүйенің өнімділігі одан да көп болуы мүмкін:

1) ЖНЖ оқыту үшін пайдаланылатын деректер базасын ұлғайту, ол сондай-ақ стильденген қаріптерді тануы мүмкін;

2) үлкен деректер қорын өңдеу кезінде уақытша қиындықты азайту үшін ЖНЖ оқыту арқылы ең жақсы алгоритмдерді пайдалану;

3) нәтижелердің дәлдігін арттыру үшін белгілерді алудың жақсартылған әдістері;

4) символдарды психология немесе сипат бойынша танитын, оларды шаблондар тізімімен салыстыру жолымен емес алгоритмдерді енгізу. Бұл адамның мәтінді қабылдау үлгісі бойынша жасалған ЖНЖ арқылы тануды шақыру үшін соңғы қадам болар еді.

Әдебиет:

  1. Автоматты идентификация және деректерді жазып алу технологиялары қауымдастығының таңбаларды оптикалық тануы, 2011 ж. — Б. 125–127.
  2. Таяу Шығыс университетінің нейрондық желілерді қолдану арқылы белгілерді тану, Солтүстік Кипр, 2014 ж. — Б. 110–120.
  3. Жасанды нейрондық желілерді пайдалану арқылы жасанды интеллект OCR енгізу Курт Альфред Клювер компьютерлік және ақпараттық ғылымдар колледжі Голизано Рочестер технологиялық институты ақпан 18, 2008
  4. Нейрондық желілерді пайдалана отырып символдарды оптикалық тану (ЕЭК 539 жобалық есебі) Дипаян Саркар, Статистика департаменті Висконсин университеті, 2003 ж. — Б. 5–9.
  5. Нейрондық желілерді пайдалана отырып, CPT өлшеулері бойынша құмдардың геотехникалық параметрлерін болжау. Автор: Хсейн Хуанг, Пинг С. Лу және Кэролайн Дж. Чен.
  6. S. Mori, C. Y. Suen және K. Kamamoto, «OCR зерттеулер мен әзірлемелерге тарихи шолу», 1992 ж. — Б. 1029–1058.
Основные термины (генерируются автоматически): немес, символ, бар, мена.


Ключевые слова

Белгілерді Шығару, Векторларды Генерациялау, Корреляция Коэффициенттері, Жасанды Нейрондық Желілер

Похожие статьи

мена, Секта, бар, немес, христианин. Изменение активности...

...символын (символ веры) немесе діни сенімдерінің Католицизм немесе Протестантизмнен айырмашылығын айта алмайды.

Жaңa дiни aғымдapдың aдaм жaн дүниeciнe кepi әcepi. мена, Секта, бар, немес, христианин. Основы исламской экономики – правовые и экономические...

мена, Кино, бар, дар, немес. Темурийлар даври илмида...

мена, Секта, бар, немес, христианин. Изменение активности ферментов углеводного обмена при...

мена, Секта, бар, немес, христианин. Микроорганизмдер арқылы мұнайбергіштікті арттыру тәсілі. Табиғат дүниесінде кеңінен бар әрі тіршілік ететін микроорганизмдердің түрлері...

мена, Секта, бар, немес, христианин.

Основные термины (генерируются автоматически): мена, немес. Похожие статьи. мена, Секта, бар, немес, христианин.

Жaңa дiни aғымдapдың aдaм жaн дүниeciнe кepi әcepi. мена, Секта, бар, немес, христианин.

мена, Секта, бар, немес, христианин. Изменение активности...

Основные термины (генерируются автоматически): мена, магия, магия мен, немес, бар, москва.

Оларды қайың мен шырша ағашынан немесе қалыңдығы 1,5-2 см, биіктігі 12-15 см, ені 20 дан 35 см‑ге дейін болатын тақтайшалардан жасайды.

мена, Секта, бар, немес, христианин. Изменение активности...

EOR, MEOR, мена, немес, теза. мена, Секта, бар, немес, христианин. Изменение активности ферментов углеводного обмена при... Эффективность нарезчика аэрационного дренажа на тяжелых...

мена, Секта, бар, немес, христианин. Похожие статьи.

мена, немес, москва, пар. Похожие статьи. мена, Секта, бар, немес, христианин. Табиғат дүниесінде кеңінен бар әрі тіршілік ететін микроорганизмдердің түрлері де өте мол. EOR, MEOR, мена, немес, теза.

мена, Секта, бар, немес, христианин. Изменение активности...

мена, дама, немес, оса. Похожие статьи. мена, Секта, бар, немес, христианин. Табиғат дүниесінде кеңінен бар әрі тіршілік ететін микроорганизмдердің түрлері де өте мол.

мена, Секта, бар, немес, христианин.

Основные термины (генерируются автоматически): немес, мена. Похожие статьи. мена, Секта, бар, немес, христианин.

Жaңa дiни aғымдapдың aдaм жaн дүниeciнe кepi әcepi. мена, Секта, бар, немес, христианин.

мена, Кино, бар, дар, немес. EOR, MEOR, мена , немес , теза.

мена , Секта, бар, немес, христианин. Микроорганизмдер арқылы мұнайбергіштікті арттыру тәсілі.

мена , Секта, бар, немес , христианин. Осенью поеду в Москву на IT семинар. Қазақ тілінде логикалық екпін түсетін сөз баяндауыштың алдында тұрады.

мена, Секта, бар, немес, христианин.

Кіріктірілген тапсырма немесе есеп дегеніміз – беріліп отырған пәнге қатысы бар шешілуіне әртүрлі ғылым саласынан алған білімін қажет ететін пәнаралық сипатты кешенді мәліметтер бар оқу тапсырмасының бір түрі [7,8]. Кіріктірілген тапсырмалар – химия пәнінің басқа ғылым...

Похожие статьи

мена, Секта, бар, немес, христианин. Изменение активности...

...символын (символ веры) немесе діни сенімдерінің Католицизм немесе Протестантизмнен айырмашылығын айта алмайды.

Жaңa дiни aғымдapдың aдaм жaн дүниeciнe кepi әcepi. мена, Секта, бар, немес, христианин. Основы исламской экономики – правовые и экономические...

мена, Кино, бар, дар, немес. Темурийлар даври илмида...

мена, Секта, бар, немес, христианин. Изменение активности ферментов углеводного обмена при...

мена, Секта, бар, немес, христианин. Микроорганизмдер арқылы мұнайбергіштікті арттыру тәсілі. Табиғат дүниесінде кеңінен бар әрі тіршілік ететін микроорганизмдердің түрлері...

мена, Секта, бар, немес, христианин.

Основные термины (генерируются автоматически): мена, немес. Похожие статьи. мена, Секта, бар, немес, христианин.

Жaңa дiни aғымдapдың aдaм жaн дүниeciнe кepi әcepi. мена, Секта, бар, немес, христианин.

мена, Секта, бар, немес, христианин. Изменение активности...

Основные термины (генерируются автоматически): мена, магия, магия мен, немес, бар, москва.

Оларды қайың мен шырша ағашынан немесе қалыңдығы 1,5-2 см, биіктігі 12-15 см, ені 20 дан 35 см‑ге дейін болатын тақтайшалардан жасайды.

мена, Секта, бар, немес, христианин. Изменение активности...

EOR, MEOR, мена, немес, теза. мена, Секта, бар, немес, христианин. Изменение активности ферментов углеводного обмена при... Эффективность нарезчика аэрационного дренажа на тяжелых...

мена, Секта, бар, немес, христианин. Похожие статьи.

мена, немес, москва, пар. Похожие статьи. мена, Секта, бар, немес, христианин. Табиғат дүниесінде кеңінен бар әрі тіршілік ететін микроорганизмдердің түрлері де өте мол. EOR, MEOR, мена, немес, теза.

мена, Секта, бар, немес, христианин. Изменение активности...

мена, дама, немес, оса. Похожие статьи. мена, Секта, бар, немес, христианин. Табиғат дүниесінде кеңінен бар әрі тіршілік ететін микроорганизмдердің түрлері де өте мол.

мена, Секта, бар, немес, христианин.

Основные термины (генерируются автоматически): немес, мена. Похожие статьи. мена, Секта, бар, немес, христианин.

Жaңa дiни aғымдapдың aдaм жaн дүниeciнe кepi әcepi. мена, Секта, бар, немес, христианин.

мена, Кино, бар, дар, немес. EOR, MEOR, мена , немес , теза.

мена , Секта, бар, немес, христианин. Микроорганизмдер арқылы мұнайбергіштікті арттыру тәсілі.

мена , Секта, бар, немес , христианин. Осенью поеду в Москву на IT семинар. Қазақ тілінде логикалық екпін түсетін сөз баяндауыштың алдында тұрады.

мена, Секта, бар, немес, христианин.

Кіріктірілген тапсырма немесе есеп дегеніміз – беріліп отырған пәнге қатысы бар шешілуіне әртүрлі ғылым саласынан алған білімін қажет ететін пәнаралық сипатты кешенді мәліметтер бар оқу тапсырмасының бір түрі [7,8]. Кіріктірілген тапсырмалар – химия пәнінің басқа ғылым...

Задать вопрос