2022, випуск 1, c. 49-63

Одержано 28.12.2021; Виправлено 27.01.2022; Прийнято 28.06.2022

Надруковано 30.06.2022; Вперше Online 03.08.2022

https://doi.org/10.34229/2707-451X.22.1.6

Попередня  |  ПОВНИЙ ТЕКСТ  |  Наступна

 

УДК 364.2:331

Розпізнавання геометричних фігур та визначення їх характеристик засобами комп'ютерного зору

О.М. Головін

Інститут кібернетики імені В.М. Глушкова НАН України, Київ

Листування: Ця електронна адреса захищена від спам-ботів. Вам потрібно увімкнути JavaScript, щоб побачити її.

 

Вступ. В багатьох застосуваннях комп'ютерного зору часто використовуються процедури розпізнавання різноманітних фігур та визначення їх габаритних характеристик. Весь конвеєр  такої обробки складається з декількох етапів, кожен з яких не має чітко виражених меж. Однак в ньому можна виділити процеси низького, середнього і високого рівня. Процеси низького рівня стосуються тільки примітивних операцій типу попередньої обробки з метою зменшення шуму, підвищення контрасту або поліпшення різкості зображень. Для низькорівневих процесів характерним є той факт, що на вході і на виході присутні зображення. Обробка зображень на середньому рівні охоплює такі завдання, як сегментація, опис об'єктів і стиснення їх в зручну для комп'ютерної обробки форму, а також класифікація (розпізнавання) окремих об'єктів. Для процесів середнього рівня характерна наявність зображень тільки на вході, на вихід поступають вже тільки ознаки і атрибути, які добувають із зображень. Високорівнева обробка включає в себе «осмислення» набору розпізнаних об'єктів та розпізнавання їх взаємодії.

На прикладі розроблених програмних моделей розпізнавання фігур та визначенні їх характеристик показано, що процес обробки зображення зводиться до перетворення просторових даних зображень у метадані, стисканню об’єму інформації, що приводить до суттєвого зростання важливості даних. Це свідчить про те, що на вході середнього рівня зображення повинно бути максимально інформативним (з високою контрастністю, без завад, артефактів тощо) через те, що після перетворення просторових даних зображення в метадані вже ніякі наступні процедури не в змозі коригувати у бік покращення чи підвищення інформативності отримані відеосенсорами дані.

Реалізувати розпізнавання фігур в зображенні досить ефективно можна через використання процедури визначення контурів фігур. Для цього, потрібно визначати границі об’єктів і локалізувати їх на зображенні, що часто є першим етапом для таких процедур, як відокремлення об’єктів від фону, сегментація зображень, виявлення та розпізнавання різноманітних об’єктів тощо.

Мета роботи. Дослідження конвеєру обробки зображення від моменту фіксації зображення до розпізнавання певного набору фігур (наприклад, геометричних фігур – трикутник, чотирикутник та інше) в зображенні, розробці програмних моделей для розпізнавання фігур в зображенні, визначенні центру мас фігур шляхом застосування засобів комп'ютерного зору. 

Результати. Проведено аналіз одного з найбільш поширеніших методів вибору порогу класифікації зображень та визначені особливості його застосування для сегментації зображень. Розроблено програмну модель визначення оптимального порогу класифікації зображень, проведено аналіз застосування методів вибору порогової класифікації до задач розпізнавання фігур в зображенні, а також визначені особливості  підходу до його вибору. Було розроблено програмні моделі визначення центроїду фігур довільної форми та підрахунку фігур в зображенні та їх розпізнавання.

Висновки. Отримані результати можуть бути використані в багатьох застосуваннях комп'ютерного зору як то підрахунок об’єктів в сцені, визначення їх параметрів, визначення дистанції між об’єктами в сцені  та інше.

 

Ключові слова: контур, сегментація, бінаризація зображень, комп’ютерний зір, гістограма.

 

Цитувати так: Головін О.М. Розпізнавання геометричних фігур та визначення їх характеристик засобами комп'ютерного зору. Cybernetics and Computer Technologies. 2022. 1. С. 49–63. https://doi.org/10.34229/2707-451X.22.1.6

 

Список літератури

           1.     Zhang D.S. Review of shape representation and description techniques. J. Pattern Recognition. 2004. P. 1–19. https://doi.org/10.1016/j.patcog.2003.07.008

           2.     Golovin O. Image Enhancement in Video Analytics Systems. Control Systems and Computers. 2020. 6. P. 3–17. https://doi.org/10.15407/csc.2020.06.003

           3.     Glasbey C.A. An analysis of histogram-based thresholding algorithms. CVGIP: Graphical Models and Image Processing. 1993. 55. P. 532–537. https://doi.org/10.1006/cgip.1993.1040

           4.     Sezgin M., Sankur B. Survey over image thresholding techniques and quantitative performance evaluation. Journal of Electronic Imaging. 2004. 13 (1). P. 146–156. https://doi.org/10.1117/1.1631315

           5.     Otsu N. A threshold selection method from gray-level histogram, IEEE Transactions on System Man Cybernetics. 1979. Vol. SMC-9, No. 1. P. 62–66. https://doi.org/10.1109/TSMC.1979.4310076

           6.     Moghaddam R., Cheriet M. Adotsu: an adaptive and parameterless generalization of Otus’s method for document image binarization, Pattern Recogn. 2012. 45. P. 2419–2431. https://doi.org/10.1016/j.patcog.2011.12.013

           7.     Xu X., Xu S., Jin L., Song E. Characteristic analysis of Otsu threshold and its applications, Pattern Recogn. Lett. 2011. 32. P. 956–961. https://doi.org/10.1016/j.patrec.2011.01.021

           8.     Sirisha P., Raju C., Reddy R., An efficient fuzzy technique for detection of brain tumor. J. Softw. Eng. 2013. 7. https://doi.org/10.26634/jse.7.4.2316

           9.     Alsaeed D.H., Bouridane A., Elzaart A., Sammouda R., Two modified Otsu image segmentation methods based on lognormal and gamma distribution models, in: 2012 International Conference on Information Technology and       e-Services (ICITeS), IEEE. 2012. P. 1–5. https://doi.org/10.1109/ICITeS.2012.6216680

       10.     Cai H., Yang Z., Cao X., Xia W., Xu X. A new iterative triclass thresholding technique in image segmentation, IEEE Trans. Image Process. 2014. 23. P. 1038–1046. https://doi.org/10.1109/TIP.2014.2298981

       11.     Lai Y.K., Rosin P.L. Efficient circular thresholding, IEEE Trans. Image Process. 2014. 23. P. 992–1001. https://doi.org/10.1109/TIP.2013.2297014

       12.     Xue J., Titterington D. t-tests, f-tests and Otus’s methods for image thresholding, IEEE Trans. Image Process. 2011. 20. https://doi.org/10.1109/TIP.2011.2114358

       13.     Arora S., Acharya J., Verma A., Panigrahi P.K. Multilevel thresholding for image segmentation through a fast statistical recursive algorithm. Pattern Recognition Letters. 2008. 29. P. 119–125. https://doi.org/10.1016/j.patrec.2007.09.005

       14.     Dong L.J., Yu G., Ogunbona P., Li W.Q. An efficient iterative algorithm for image thresholding. Pattern Recognition Letters. 2008. 29. P. 1311–1316. https://doi.org/10.1016/j.patrec.2008.02.001

       15.     Huang D.Y., Wang C.H. Optimal multi-level thresholding using a two-stage Otsu optimization approach. Pattern Recognition Letters. 2009. 30. P. 275–284. https://doi.org/10.1016/j.patrec.2008.10.003

       16.     Liao P.S., Chen T.S., Chung P.C. A fast algorithm for multilevel thresholding. Journal of Information Science and Engineering. 2001. 17. P. 713–727.

       17.     Papamarkos N., Gatos B. A new approach for multilevel threshold selection. Graphics Models Image Process. 1994. 56. P. 357–370. https://doi.org/10.1006/cgip.1994.1033

       18.     Flusser J., Suk T., Zitová B. What are moments? Moments and Moment Invariants in Pattern Recognition. John Wiley & Sons Ltd, 2009. P. 6. ISBN 978-0-470-69987-4 https://doi.org/10.1002/9780470684757

       19.     Pouli T., Reinhard E., Cunningham D. Image Statistics in Visual Computing. CRC Press, 2014. P. 35. ISBN 978-1-4665-3982-2

       20.     Farin G. E. Curves and Surfaces for Computer Aided Geometric Design: A Practical Guide. Academic Press, Boston, Massachusetts, 4th edition. 1996.

       21.     Douglas D.H., Peucker T.K. Algorithms for the reduction of the number of points required to represent a digitized line or its caricature. The Canadian Cartographer, 1973. 10 (2). P. 112–122. https://doi.org/10.1002/9780470669488.ch2

       22.     Ramer U. An Iterative Procedure for the Polygonal Approximation of Plane Curves. Computer Graphics and Image Processing. 1972. 1 (3). P. 244–256. https://doi.org/10.1016/S0146-664X(72)80017-0

       23.     Ramer–Douglas–Peucker algorithm. http://en.wikipedia.org/wiki/Ramer-Douglas-Peucker_algorithm (звернення: 28.12.2021)

 

 

ISSN 2707-451X (Online)

ISSN 2707-4501 (Print)

Попередня  |  ПОВНИЙ ТЕКСТ  |  Наступна

 

 

 

© Вебсайт та оформлення. 2019-2022,

Інститут кібернетики імені В.М. Глушкова НАН України,

Національна академія наук України.