Використання згорткових нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень

Автор(и)

DOI:

https://doi.org/10.26642/ten-2022-1(89)-93-100

Ключові слова:

нейрон; штучна нейронна мережа; зображення; класифікація об’єктів; згортка

Анотація

Досліджується застосування штучних нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень. Розглядається класична задача класифікації об’єктів на зображенні, а саме визначення статі особи за її обличчям. Це зумовлено тим, що існує вдалий набір даних, який складається з 47009 зображень облич чоловіків та жінок для навчання та 11649 зображень облич для тестування штучної нейронної мережі. Запропоновано використання згорткової нейронної мережі. Такий підхід дозволяє зменшити обсяг інформації, що зберігається у пам’яті, а також ієрархічно виділити та агрегувати ознаки вхідних даних. Згорткова нейронна мережа складається з декількох блоків згорткових й агрегувального шарів, шару вирівнювання, шарів повнозв’язних нейронів, вихідного нейрона. Пороговою активаційною функцію для всіх нейронів, окрім вихідного, обрано функцію «ReLU». Активаційною функцією вихідного нейрона є сигмоїдальна. Здійснено побудову нейронної мережі, її навчання та тестування із застосуванням бібліотеки «TensorFlow», API «Keras.NET», а також розробленої бібліотеки методів на базі платформи «.NET Standard 2.0». Для візуального відображення налаштування відповідних процесів розроблено віконний додаток на базі платформ «.NET 6.0» та «WPF». Для побудови необхідних графіків використано бібліотеку «OxyPlot». Досліджено якість роботи пропонованої згорткової нейронної мережі залежно від кількості блоків та розмірів фільтра згортки. Найкращі результати роботи досягаються із 3 блоками згорткових та агрегувального шарів та розмірами фільтра згортки 3 x 3 пікселів. Оптимальної точності класифікації об’єктів зображень мережа набуває при її навчанні протягом 14 епох.

Посилання

Reynolds, M. (2017), «New computer vision challenge wants to teach robots to see in 3D», New Scientist, [Online], available at: https://cutt.ly/sKlw30e

Krizhevsky, A., Sutskever, I. and Hinton, E.G. (2017), «Advances in Neural Information Processing Systems», Communications of the ACM, Vol. 6, No. 60, pp.84–90.

Simonyan, K. and Zisserman, A. (2015), Very Deep Convolutional Networks for Large-Scale Image Recognition, International Conference on Learning Representations 2015, [Online], available at: https://arxiv.org/pdf/1409.1556.pdf

Le Cun, Y., Boser, B., Denker, J. et al. (1989), «Handwritten Digit Recognition with a Back-Propagation Network», Advances in Neural Information Processing Systems, No. 2, pp. 396–404.

Hagan, M.T., Demuth, H.B., Beale, M.H. and De Jesus, O. (2014), Neural Network Design, 2nd ed., 1012 p.

Novotars'kyj, M.A. and Nesterenko, B.B. (2004), Shtuchni nejronni merezhi: obchyslennja, Instytut matematyky NAN Ukrai'ny, Kyi'v, 408 р.

Rosenblatt, F. (1958), «The perceptron: A probabilistic model for information storage and organization in the brain», Psychological Review, No. 65 (6), pp. 368–408.

Goodfellow, I., Bengio, Y. and Courville, A. (2016), Deep Learning, MIT Press, 781 p.

Chaunah, A. (2020), Gender Classification Dataset, [Online], available at: https://cutt.ly/NKleYG3

Karra, J. (2020), Deep learning using Keras.Net with C#, [Online], available at: https://cutt.ly/4KleSlY

Reznykov, I. (2017), Wpf application with real-time data in OxyPlot charts, [Online], available at: https://svitla.com/blog/wpf-application-with-real-time-data-in-oxyplot-charts

Список використаної літератури:

Reynolds M. New computer vision challenge wants to teach robots to see in 3D / M.Reynolds // New Scientist. – 2017 [Electronic resource]. – Access mode : https://cutt.ly/sKlw30e.

Krizhevsky A. ImageNet classification with deep convolutional neural networks / A.Krizhevsky, I.Sutskever, E.Geoffrey // Communications of the ACM. – 2017. – Vol. 6, № 60. – P. 84–90.

Simonyan K. Very Deep Convolutional Networks for Large-Scale Image Recognition / K.Simonyan, A.Zisserman // International Conference on Learning Representations 2015. – 2015 [Electronic resource]. – Access mode : https://arxiv.org/pdf/1409.1556.pdf.

Handwritten Digit Recognition with a Back-Propagation Network / Y.Le Cun, B.Boser, J.Denker and other // Advances in Neural Information Processing Systems. – 1989. – № 2. – P. 396–404.

Neural Network Design / M.T. Hagan, H.B. Demuth, M.H. Beale, O.De Jesus. – 2nd ed. – 2014. – 1012 p.

Новотарський М.А. Штучні нейронні мережі: обчислення / М.А. Новотарський, Б.Б. Нестеренко. – Київ : Інститут математики НАН України, 2004. – 408 с.

Rosenblatt F. The perceptron: a probabilistic model for information storage and organization in the brain / F.Rosenblatt // Psychological Review. – 1958. – № 65 (6). – P. 386–408.

Goodfellow I. Deep Learning / I.Goodfellow, Y.Bengio, A.Courville. – MIT Press, 2016. – 781 p.

Chauhan A. Gender Classification Dataset / A.Chauhan. – 2020 [Electronic resource]. – Access mode : https://cutt.ly/NKleYG3.

Karra J. Deep learning using Keras.Net with C# / J.Karra. – 2020 [Electronic resource]. – Access mode : https://cutt.ly/4KleSlY.

Reznykov I. Wpf application with real-time data in OxyPlot charts / I.Reznykov. – 2017 [Electronic resource]. – Access mode : https://svitla.com/blog/wpf-application-with-real-time-data-in-oxyplot-charts.

##submission.downloads##

Опубліковано

2022-07-07

Як цитувати

Кушнір, Н. О. ., Локтікова, Т. М. ., Морозов, А. В. ., & Юрченко, В. О. . (2022). Використання згорткових нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень. Технічна інженерія, (1(89), 93–100. https://doi.org/10.26642/ten-2022-1(89)-93-100

Номер

Розділ

ІНЖЕНЕРІЯ ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ