2021, випуск 3, c. 65-73

Одержано 28.07.2021; Виправлено 08.08.2021; Прийнято 28.09.2021

Надруковано 30.09.2021; Вперше Online 25.10.2021

https://doi.org/10.34229/2707-451X.21.3.6

Попередня  |  Повний текст  |  Наступна

 

УДК 004.852

Порівняльний аналіз застосування багатошарових і згорткових нейронних мереж для розпізнавання рукодрукованих літер на прикладі азербайджанського алфавіту

Е. Мустафаєв * ORCID ID favicon Big,   Р. Азімов ORCID ID favicon Big

Інститут Систем Управління НАН Азербайджану, Баку

* Листування: Ця електронна адреса захищена від спам-ботів. Вам потрібно увімкнути JavaScript, щоб побачити її.

 

Вступ. Впровадження інформаційних технологій у різних сферах суспільного життя диктує створення ефективних і продуктивних систем введення інформації в комп'ютерні системи. В таких системах важливе значення має побудова ефективного розпізнавального модуля. На даний момент найбільш перспективним підходом до вирішення цього завдання є використання штучних багатошарових і згорткових нейронних мереж.

Мета роботи. Провести порівняльний аналіз результатів розпізнавання рукодрукованих символів азербайджанського алфавіту за допомогою багатошарових і згорткових нейронних мереж.

Результати. Проведено аналіз залежності результатів розпізнавання від наступних параметрів: архітектури нейронних мереж, розміру навчальної бази, вибору алгоритму субдискретизації, викори-стання алгоритму виділення ознак. Для збільшення навчальної вибірки використана техніка аугментації зображень. На основі реальної бази з 14000 символів були утворені бази по 28000, 42000 і 72000 символів. Наведено опис алгоритму виділення ознак.

Висновки. Аналіз результатів розпізнавання на тестовій вибірці показав:

·      як і очікувалося, згорткові нейронні мережі показали більш високі результати, ніж багатошарові нейронні мережі;

·      класична згорткова мережа LeNet-5 показала найбільш високі результати серед всіх типів нейронних мереж. Однак, багатошарова 3-х шарова мережа, на вхід якої подавали результати виділення ознак, показала досить високі результати, які можна порівняти зі згортковими мережами;

·      немає певної переваги у виборі методу в субдискретному шарі, вибір методу субдискретизації (max-pooling або average-pooling) для кожної моделі може бути підібраний експериментальним шляхом;

·      збільшення навчальної бази даних для даної задачі не дало відчутного поліпшення результатів розпізнавання для згорткових мереж і мереж з попереднім виділенням ознак. Однак для мереж, що навчаються без виділення ознак, збільшення розміру БД призводило до помітного поліпшення показників.

 

Ключові слова: нейронні мережі, виділення ознак, розпізнавання символів.

 

Цитувати так: Mustafayev E., Azimov R. Comparative Analysis of the Application of Multilayer and Convolutional Neural Networks for Recognition of Handwritten Letters of the Azerbaijani Alphabet. Cybernetics and Computer Technologies. 2021. 3. P. 65–73. https://doi.org/10.34229/2707-451X.21.3.6

 

Список літератури

           1.     Lecun Y., Bottou L., Bengio Y. Haffner P. Gradient-based learning applied to document recognition. Proc. of the IEEE. 1998. 86 (11). P. 2278–2324. https://doi.org/10.1109/5.726791

           2.     Головко В.А. Нейросетевые технологии обработки данных.Минск: БГУ, 2017. 263 с.

           3.     Осовский С. Нейронные сети для обработки информации. М.: Финансы и статистика, 2002. 344 с.

           4.     Мустафаев Э.Э. Методы распознавания рукопечатных текстов. М: Фюзат, 2020. 189 с.

           5.     Айда-заде К.Р., Мустафаев Э.Э. Интеллектуальная система распознавания рукопечатных форм азербайджанского языка. Труды Республиканской научной конференции «Современные проблемы информатизации, кибернетики и информационных технологий». Баку. 2006. Т. III. С. 8588.

           6.     Айда-заде К.Р., Мустафаев Э.Э. Об одной иерархической системе распознавания рукописных форм на основе нейронных сетей. Известия НАН Азербайджана, серия ф.т. и м.н. 2002. № 23. С. 9498.

           7.     Айда-заде К.Р., Мустафаев Э.Э., Гасанов Дж.З. Об использовании баз знаний для повышения интеллектуальности систем распознавания. Доклады XI Всероссийской конференции «Математические методы распознавания образов». М.: 2003. С. 68.

           8.     Мустафаев Э.Э. Многоуровневая иерархическая система распознавания рукописных форм. Материалы научной конференции «Современные проблемы прикладной математики». Баку. 2002. С. 154–157.

           9.     Aida-zade K.R., Mustafayev E.E. Intelligent handwritten form recognition system based on artificial neural networks. Proceedings of the Intern. Conf. on Modeling and Simulation, 2006, 2830 August, Konya, Turkey. P. 609–613.

       10.     Arif A.F., Takahashi H., Iwata A., Tsutsumida T. Handwritten postal code recognition by neural network – a comparative study. IEICE Trans.Inf.&Syst. 1996. E79-D (5). P. 443–449.

       11.     Francois Ch. Deep Learning with Python. Manning Publications, Shelter Island, NY. 362 p.

       12.     Eldan R., Shamir O. The power of depth for feedforward neural networks. Conference on Learning Theory. 2016. 49. P. 907–940.

       13.     https://towardsdatascience.com/metrics-to-evaluate-your-machine-learning-algorithm-f10ba6e38234 (звернення: 26.07.2021)

 

 

ISSN 2707-451X (Online)

ISSN 2707-4501 (Print)

Попередня  |  Повний текст  |  Наступна

 

 

 

© Вебсайт та оформлення. 2019-2022,

Інститут кібернетики імені В.М. Глушкова НАН України,

Національна академія наук України.