Використання афінних перетворень для корекції зображень з подальшим використанням у системах розпізнавання

Автор(и)

  • Дмитро Костянтинович Марчук Державний університет «Житомирська політехніка», Україна

DOI:

https://doi.org/10.26642/ten-2023-2(92)-125-130

Ключові слова:

відеозображення; геометричні параметри; комп’ютеризована система; афінні перетворення; нейронні мережі

Анотація

Нині нейронні мережі набувають все більшої популярності і все частіше використовуються в різних галузях життя. Їх застосовують для аналізу даних, кластеризації, класифікації, виявлення об’єктів або схованих закономірностей. Все частіше зустрічаються варіанти застосування нейронних мереж у завданнях бізнес-прогнозування. Системи комп’ютерного зору не є винятком. Важливою складовою цих процесів є попередня обробка зображень. Відомо, що зображення, отримані з відеокамер, можуть виявляти перспективні спотворення, що походять від неідеальних кутів розташування камери. Зазвичай техніка афінного перетворення використовується для корекції геометричних спотворень або деформацій, таких як масштабування, переміщення, зсув, обертання. В роботі були проведені дослідження особливостей афінних перетворень і їх застосування з нейронними мережами. Розглянуто методи розпізнавання геометричних параметрів під час трансформації та переміщення зображень. Увагу приділено елементарним перетворенням, які враховують перенесення, масштабування, зсув, обертання. Розроблено математичну модель перетворення зображень для систем комп’ютерного зору. На базі запропонованого методу побудовано алгоритм перспективних перетворень зображень, отриманих з відеокамер, які знаходяться на автостоянках або парковках міста, що значно полегшує в подальшому виявлення, сегментацію і класифікацію об’єктів. Для покращення роботи класичної Mask R-CNN було проведено дослідження, в якому було додано блок з афінними перетвореннями до згорткової нейронної мережі. Афінні трансформації застосовано для корекції перспективного сходження ліній у кадрі, паралельних у реальності.

Посилання

Flusser, J. and Suk, T. (1993), «Pattern recognition by affine moment invariants», Pattern recognition, No 26 (1), pp.167–174.

Hao, Y., Hu, P., Li, S., Udupa, J.K., Tong, Y. and Li, H. (2022), «Gradient-Aligned convolution neural network», Pattern Recognition, No 122, p. 108354.

Han, D., Liu, Q. and Fan, W. (2018), «A new image classification method using CNN transfer learning and web data augmentation», Expert Systems with Applications, No 95, pp. 43–56.

Lowe, D.G. (1999), «September. Object recognition from local scale-invariant features», In Proceedings of the seventh IEEE international conference on computer vision, Vol. 2, pp. 1150–1157. IЕЕЕ.

Mai, F., Chang, C.Q. and Hung, Y.S. (2010), «September. Affine-invariant shape matching and recognition under partial occlusion». In 2010 IEEE international conference on image processing, pp. 4605–4608. IEEE.

Mikolajczyk, K. and Schmid, C. (2004), «Scale & affine invariant interest point detectors», International journal of computer vision, No 60, pp.63–86.

Zhang, H. and Wu, Q.J (2011), «September. Pattern recognition by affine legendre moment invariants», In 2011 18th IEEE International Conference on Image Processing, pp. 797–800. IEEE.

Levkivskyi, V. et al. (2022), «Available parking places recognition system», CEUR Workshop Proceedings 4th Workshop for Young Scientists in Computer Science & Software Engineering, Virtual Event, Kryvyi Rih, 18 December 2021, P. 123–134, [Online], available at: https://ceur-ws.org/Vol-3077/paper07.pdf.

He, K., Gkioxari, G., Dollar, P. & Girshick R. (2017), IEEE International Conference on Computer Vision, ICCV, Mask r-cnn, рр. 2980–2988, [Online], available at: https://ieeexplore.ieee.org/document/8237584

Marchuk, D.K. (2023), «Analiz suchasnykh alhorytmiv vyyavlennya i rozpiznavannya ob’yektiv z video potoku dlya system upravlinnya parkuvannyam v real'nomu chasi», Visnyk Khmel'nyts'koho natsional'noho universytetu Seriya: Tekhnichni nauky, No 3 (321), рр. 17–23.

##submission.downloads##

Опубліковано

2023-11-29

Як цитувати

Марчук, Д. К. (2023). Використання афінних перетворень для корекції зображень з подальшим використанням у системах розпізнавання. Технічна інженерія, (2(92), 125–130. https://doi.org/10.26642/ten-2023-2(92)-125-130

Номер

Розділ

ІНЖЕНЕРІЯ ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ