Символдарды оптикалық тану бейнеден символдарды тану және жіктеу ісіне ие. Тану дәл болу үшін белгілі бір топологиялық және геометриялық қасиеттері есептеледі, олардың негізінде символ жіктеледі және танылады. Сонымен қатар, адам психологиясы олардың жалпы формасы мен ерекшеліктері бойынша символдарды қабылдайды, мысалы, штрихтар, иілу, шығыңқы, қоршаулар және т. б. Бұл қасиеттер, сондай-ақ нысандар деп аталатын пикселдер негізіндегі кеңістіктік есептеу арқылы бейнеден алынады.
Векторлар деп аталатын мұндай белгілер жиынтығы белгілердің осы векторларын қолданатын жасанды нейрондық желінің көмегімен символды анықтауға көмектеседі.
Ключевые слова: Белгілерді Шығару, Векторларды Генерациялау, Корреляция Коэффициенттері, Жасанды Нейрондық Желілер.
Оптическое распознавание символов имеет дело с распознаванием и классификацией символов на изображении. Для точного распознавания рассчитываются определенные топологические и геометрические свойства, на основании которых персонаж классифицируется и распознается. Кроме того, человеческая психология воспринимает персонажей по их общей форме и чертам, таким как штрихи, кривые, выступы, вложения и т. д. Эти свойства, также называемые чертами, извлекаются из изображения с помощью пространственных пиксельных вычислений. Набор таких функций, называемых векторами, помогает в уникальном определении персонажа с помощью искусственной нейронной сети, которая использует эти векторы признаков.
Ключевые слова: извлечение признаков, генерация вектора, коэффициенты корреляции, искусственные нейронные сети.
Автоматты оптикалық тану көбінесе компьютерлік көру, мәтінді интеллектуалды тану және мәтінге негізделген шешім қабылдау жүйелерінде қолданылуына байланысты қарқын алды. Мәтінді тану мәселесін шешуде қолданылатын тәсіл адамдар қабылдаған кейіпкерлердің психологиясына негізделді. Сонымен, тану үшін кейіпкердің геометриялық ерекшеліктері мен оның нұсқалары қарастырылды [1, 126 б.]. Кейін алдын ала анықталған үлгілермен кіріс символдарын салыстыруды қамтитын үлгілердің салыстыру тәсілі қолданылды. Бұл әдіс символдарды нақты сәйкестік немесе мүлдем сәйкестік емес ретінде таниды. Ол сондай-ақ нысанды елеулі өзгертуді көздемеген стильдің еңістігі мен вариациялары сияқты әсерлерді ескермейді. Басқа тәсіл, атап айтқанда, корреляция коэффициенттерін пайдалана отырып тану, елеусіз айырмашылықтарды ескеру үшін кіріс символдарының Қиыспалы корреляциясына немесе олардың деректер базасының шаблондарымен түрлендірілуіне негізделген. Ол «I« мен «J«, «B« мен "8", «O«, «Q« мен "0" және т. б. сияқты формаға өте ұқсас символдар арасында жалған немесе қате тану енгізді. Бұл мәселені шешу ЖНЖ-да, пішін, симметрия, жабық немесе ашық аймақтар және пикселдер саны сияқты топологиялық ерекшеліктердің негізінде символды қабылдай алатын жүйеде жатыр. Мұндай жүйенің артықшылығы ол "үлгілерде» оқытылуы мүмкін, содан кейін белгілердің ұқсас жиынтығы бар символдарды тану үшін пайдаланылуы мүмкін. Осы жүйеде пайдаланылатын ЖНЖ өзінің кіріс деректерін белгілер векторы түрінде алады. Бұл әрбір объект немесе сипат бөлінеді және сандық мән беріледі дегенді білдіреді. Әрбір символды бір мәнді сәйкестендіру үшін пайдалануға болатын осы сандық мәндер жиынтығы оның векторы деп аталады. Осылайша, желіні оқыту үшін оның топологиялық қасиеттері негізінде әрбір символды тиімді тануға мүмкіндік беретін векторлық деректер базасы қолданылады [2, 111 б.].
Алдын-ала өңдеу
Кез келген сурет тану жүйесіне берілгенге дейін кейбір алдын ала өңдеуді қажет етеді. Бірінші қадам-кескіннің кез келген түрін екілік кескінге түрлендіру (пиксельдің мәні тек “0” және “1”) [3].
“Бинаризация” кез келген суретті ақ фонда жазылған қара мәтін сериясына түрлендіреді. Осылайша, ол барлық кіріс суреттерінің біртектілігін ықпалдандырады. Контраст, айқындылық және т. б. сияқты басқа да әсерлер сурет бинаризациядан кейін де оңай өңделуі мүмкін. Жүйеде пайдаланылатын ЖНЖ кіріс деректер ретінде “белгілер векторларын” пайдаланады. Осылайша, әрбір символ алдын ала өңделген бейнеден сегменттейді. Бұл сегменттеу екі кезеңде өтеді. Біріншіден, әрбір жол кіріс бейнесінде бөлінеді. Содан кейін әрбір символ әр жолда бөлінеді. “Блок-кандидатты” бөлу кезеңі суреттің бір бөлігінде ғана танылатын “мәтін” бар жерде қажет екенін атап өтуге болады. Сегменттеу символ қабырғаларын есептеу арқылы орындалуы мүмкін, мұнда “қара” пиксельдердің сомасы символ перифериясы бойынша нөлге тең. Содан кейін осылайша бөлінген әрбір символ ЖНЖ оқыту үшін пайдаланылған “үлгілерге” бару үшін өлшем мен фокус тұрғысынан қалпына келеді [4].
Белгілерді алу
Белгілерді алу екі мақсатқа қызмет етеді: олардың бірі символды бірдей сәйкестендіре алатын қасиеттерді алу болып табылады. Екіншіден, ұқсас симводарды ажырататын қасиеттерді алу. Символ әр түрлі жолдармен жазылуы мүмкін, және ол адаммен оңай дұрыс танылуы мүмкін. Осылайша, барлық вариациялық айырмашылықтардан асып түсетін қағидаттар немесе логикалар жиынтығы бар. Жүйе пайдаланатын белгілер кейіпкерлер психологиясына жақын қасиеттерге әсер етеді. Біздің алгоритмде символдарды анықтау үшін әр түрлі белгілер жиынтығы қолданылды. Олар суретте көрсетілгендей, символ биіктігінің бойымен әр түрлі қашықтықта салынған көлденең сызықтардың бойындағы пикселдердің сомасын қамтиды (сурет 1). Бұл параметрлер биіктігі бойынша профильдің өзгеру еніне байланысты бір символдан екіншісіне ерекшеленеді. Егер қара алдыңғы жоспары (мәтіні) және ақ фоны бар бағандардың “m” жолдары және “n” бағандарының екілік суретін қарастырсақ, онда әрбір пиксель ақ немесе қара болып табылатындығына байланысты “1” немесе “0” мәні бар [5]. Осылайша, объектінің белгілі бір биіктігіндегі барлық тиісті пиксельдердің сомасын c*m деп айтамыз (c = масштабты константа, 0
(1.1)
мұнда I (c*m, p) = орналасқан жердегі қара пиксель (c*m, p).
Сурет 1. Түрлі биіктіктегі көлденең сызықтар
Сол сияқты, пиксельдің сомасын бейнелейтін ені бойынша әр түрлі қашықтықтарда салынған тік сызықтардың жиынтығы да суретте көрсетілгендей басқа объектілер жиынтығы бола алады. Тік сызық бойымен пиксельдердің математикалық сомасы c*n ені кезінде мынадай түрде беріледі (сурет 2).
(1.2)
мұнда I (p, c*n) = орналасқан жердегі қара пиксель (p, c*n).
Сурет 2. Ені бойынша тік сызықтар
Қорытынды
ЖНЖ негізіндегі жүйе үлгілердің бір жиынтығында ғана оқуға қарамастан (кез келген алдын ала белгіленген қаріптен тәуелсіз), көп үміт күттіретін нәтижелерді көрсетті, ол тек 21 секундта оқылып қана қоймай, сонымен қатар жоғары тиімділікпен қаріптерді (ол үшін оқытылмаған) тануы мүмкін. Бұл жүйенің өз артықшылықтары бар, мысалы, аз уақыт күрделілігі, өте аз деректер қоры және стандартталмаған кіріс мәліметтеріне жоғары бейімделуі, әдіспен салыстырғанда есептеу үшін функциялардың аз саны бар. Дегенмен, бұл жүйе одан әрі даму үшін үлкен кеңістікке ие.
Жүйенің өнімділігі одан да көп болуы мүмкін:
1) ЖНЖ оқыту үшін пайдаланылатын деректер базасын ұлғайту, ол сондай-ақ стильденген қаріптерді тануы мүмкін;
2) үлкен деректер қорын өңдеу кезінде уақытша қиындықты азайту үшін ЖНЖ оқыту арқылы ең жақсы алгоритмдерді пайдалану;
3) нәтижелердің дәлдігін арттыру үшін белгілерді алудың жақсартылған әдістері;
4) символдарды психология немесе сипат бойынша танитын, оларды шаблондар тізімімен салыстыру жолымен емес алгоритмдерді енгізу. Бұл адамның мәтінді қабылдау үлгісі бойынша жасалған ЖНЖ арқылы тануды шақыру үшін соңғы қадам болар еді.
Әдебиет:
- Автоматты идентификация және деректерді жазып алу технологиялары қауымдастығының таңбаларды оптикалық тануы, 2011 ж. — Б. 125–127.
- Таяу Шығыс университетінің нейрондық желілерді қолдану арқылы белгілерді тану, Солтүстік Кипр, 2014 ж. — Б. 110–120.
- Жасанды нейрондық желілерді пайдалану арқылы жасанды интеллект OCR енгізу Курт Альфред Клювер компьютерлік және ақпараттық ғылымдар колледжі Голизано Рочестер технологиялық институты ақпан 18, 2008
- Нейрондық желілерді пайдалана отырып символдарды оптикалық тану (ЕЭК 539 жобалық есебі) Дипаян Саркар, Статистика департаменті Висконсин университеті, 2003 ж. — Б. 5–9.
- Нейрондық желілерді пайдалана отырып, CPT өлшеулері бойынша құмдардың геотехникалық параметрлерін болжау. Автор: Хсейн Хуанг, Пинг С. Лу және Кэролайн Дж. Чен.
- S. Mori, C. Y. Suen және K. Kamamoto, «OCR зерттеулер мен әзірлемелерге тарихи шолу», 1992 ж. — Б. 1029–1058.