Використання згорткових нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень
DOI:
https://doi.org/10.26642/ten-2022-1(89)-93-100Ключові слова:
нейрон; штучна нейронна мережа; зображення; класифікація об’єктів; згорткаАнотація
Досліджується застосування штучних нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень. Розглядається класична задача класифікації об’єктів на зображенні, а саме визначення статі особи за її обличчям. Це зумовлено тим, що існує вдалий набір даних, який складається з 47009 зображень облич чоловіків та жінок для навчання та 11649 зображень облич для тестування штучної нейронної мережі. Запропоновано використання згорткової нейронної мережі. Такий підхід дозволяє зменшити обсяг інформації, що зберігається у пам’яті, а також ієрархічно виділити та агрегувати ознаки вхідних даних. Згорткова нейронна мережа складається з декількох блоків згорткових й агрегувального шарів, шару вирівнювання, шарів повнозв’язних нейронів, вихідного нейрона. Пороговою активаційною функцію для всіх нейронів, окрім вихідного, обрано функцію «ReLU». Активаційною функцією вихідного нейрона є сигмоїдальна. Здійснено побудову нейронної мережі, її навчання та тестування із застосуванням бібліотеки «TensorFlow», API «Keras.NET», а також розробленої бібліотеки методів на базі платформи «.NET Standard 2.0». Для візуального відображення налаштування відповідних процесів розроблено віконний додаток на базі платформ «.NET 6.0» та «WPF». Для побудови необхідних графіків використано бібліотеку «OxyPlot». Досліджено якість роботи пропонованої згорткової нейронної мережі залежно від кількості блоків та розмірів фільтра згортки. Найкращі результати роботи досягаються із 3 блоками згорткових та агрегувального шарів та розмірами фільтра згортки 3 x 3 пікселів. Оптимальної точності класифікації об’єктів зображень мережа набуває при її навчанні протягом 14 епох.
Посилання
Reynolds, M. (2017), «New computer vision challenge wants to teach robots to see in 3D», New Scientist, [Online], available at: https://cutt.ly/sKlw30e
Krizhevsky, A., Sutskever, I. and Hinton, E.G. (2017), «Advances in Neural Information Processing Systems», Communications of the ACM, Vol. 6, No. 60, pp.84–90.
Simonyan, K. and Zisserman, A. (2015), Very Deep Convolutional Networks for Large-Scale Image Recognition, International Conference on Learning Representations 2015, [Online], available at: https://arxiv.org/pdf/1409.1556.pdf
Le Cun, Y., Boser, B., Denker, J. et al. (1989), «Handwritten Digit Recognition with a Back-Propagation Network», Advances in Neural Information Processing Systems, No. 2, pp. 396–404.
Hagan, M.T., Demuth, H.B., Beale, M.H. and De Jesus, O. (2014), Neural Network Design, 2nd ed., 1012 p.
Novotars'kyj, M.A. and Nesterenko, B.B. (2004), Shtuchni nejronni merezhi: obchyslennja, Instytut matematyky NAN Ukrai'ny, Kyi'v, 408 р.
Rosenblatt, F. (1958), «The perceptron: A probabilistic model for information storage and organization in the brain», Psychological Review, No. 65 (6), pp. 368–408.
Goodfellow, I., Bengio, Y. and Courville, A. (2016), Deep Learning, MIT Press, 781 p.
Chaunah, A. (2020), Gender Classification Dataset, [Online], available at: https://cutt.ly/NKleYG3
Karra, J. (2020), Deep learning using Keras.Net with C#, [Online], available at: https://cutt.ly/4KleSlY
Reznykov, I. (2017), Wpf application with real-time data in OxyPlot charts, [Online], available at: https://svitla.com/blog/wpf-application-with-real-time-data-in-oxyplot-charts
Список використаної літератури:
Reynolds M. New computer vision challenge wants to teach robots to see in 3D / M.Reynolds // New Scientist. – 2017 [Electronic resource]. – Access mode : https://cutt.ly/sKlw30e.
Krizhevsky A. ImageNet classification with deep convolutional neural networks / A.Krizhevsky, I.Sutskever, E.Geoffrey // Communications of the ACM. – 2017. – Vol. 6, № 60. – P. 84–90.
Simonyan K. Very Deep Convolutional Networks for Large-Scale Image Recognition / K.Simonyan, A.Zisserman // International Conference on Learning Representations 2015. – 2015 [Electronic resource]. – Access mode : https://arxiv.org/pdf/1409.1556.pdf.
Handwritten Digit Recognition with a Back-Propagation Network / Y.Le Cun, B.Boser, J.Denker and other // Advances in Neural Information Processing Systems. – 1989. – № 2. – P. 396–404.
Neural Network Design / M.T. Hagan, H.B. Demuth, M.H. Beale, O.De Jesus. – 2nd ed. – 2014. – 1012 p.
Новотарський М.А. Штучні нейронні мережі: обчислення / М.А. Новотарський, Б.Б. Нестеренко. – Київ : Інститут математики НАН України, 2004. – 408 с.
Rosenblatt F. The perceptron: a probabilistic model for information storage and organization in the brain / F.Rosenblatt // Psychological Review. – 1958. – № 65 (6). – P. 386–408.
Goodfellow I. Deep Learning / I.Goodfellow, Y.Bengio, A.Courville. – MIT Press, 2016. – 781 p.
Chauhan A. Gender Classification Dataset / A.Chauhan. – 2020 [Electronic resource]. – Access mode : https://cutt.ly/NKleYG3.
Karra J. Deep learning using Keras.Net with C# / J.Karra. – 2020 [Electronic resource]. – Access mode : https://cutt.ly/4KleSlY.
Reznykov I. Wpf application with real-time data in OxyPlot charts / I.Reznykov. – 2017 [Electronic resource]. – Access mode : https://svitla.com/blog/wpf-application-with-real-time-data-in-oxyplot-charts.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2022 Надія Олександрівна Кушнір, Тамара Миколаївна Локтікова, Андрій Васильович Морозов, Владислав Олегович Юрченко
Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial 4.0 International License.
Автор, який подає матеріали до друку, зберігає за собою всі авторські права та надає відповідному виданню право першої публікації, дозволяючи розповсюджувати даний матеріал із зазначенням авторства та джерела первинної публікації, а також погоджується на розміщення її електронної версії на сайті Національної бібліотеки ім. В.І. Вернадського.