Розпізнавання об'єктів у відеопотоці
DOI:
https://doi.org/10.30837/0135-1710.2021.177.018Анотація
Проаналізовані етапи процесу розпізнавання об'єктів у відеопотоці, виділені проблеми, які виникають на кожному з етапів. Запропоновано удосконалення методу еквіваріантного детектора розпізнавання об'єктів, що швидко рухаються. Створена та пройшла навчання нейрона мережа для розпізнавання об'єктів у відеопотоці. Описані рекомендації по вдосконаленню алгоритму пошуку локальних ознак при навчанні нейронної мережі. Проведено експеримент, якій демонструє роботу нейронної мережі при роботі із зображеннями у різних умовах. Наведені результати розпізнавання композитних сцен.
Посилання
Nechiporenko A.S., Gubarenko E.V., Gubarenko M.S. Authentication of users of mobile devices by their motor reactions. Telecommunications and Radio Engineering. 2019. V. 78 (11). P. 987-1003. doi: 10.1615 / TelecomRadEng.v78.i11.60.
Ebrahim Karami, Siva Prasad, and Mohamed Shehata. Image Matching Using SIFT, SURF, BRIEF and ORB: Performance Comparison for Distorted Images. 2017. arXiv preprint arXiv:1710.0272.
Локтєв Д.А., Кочнев В.А., Локтєв А.А. Вивчення функцій розмиття зображення у вигляді інформативного параметра стану і поведінки аналізованого об'єкта. Динаміка складних систем - XXI століття. 2020. № 2. С. 16-27.
Loktev D., Loktev A. Image blurring function as an informative criterion. Advances in Intelligent Systems and Computing. 2021. V. 1258. P. 173-183.
Фісенко В.Т., Фісенко Т.Ю. Комп'ютерна обробка і розпізнавання зображень: навчальний посібник. СПб: СПбГУ ІТМО, 2008. 192 с.
Huang G.B., Ramesh M., Berg T., Learned-Miller E. Labeled faces in the wild: A database for studying face recognition in unconstrained environments. Technical Report 07-49, University of Massachusetts. 2007. No. 1 (2). pp. 3-37.
Gourier N., Hall D., Crowley J.L. Estimating face orientation from robust detection of salient facial structures. FG Net Workshop on Visual Observation of Deictic Gestures, 2004. V. 6(4).
Gourier N., Hall D., Crowley J.L. Caffe: Convolutional architecture for fast feature embedding. FG Net Workshop on Visual Observation of Deictic Gestures. 2004. P. 1-9.
Singular Inversions. FaceGen modeller (Version 3.3). Singular Inversions, 2008. 10. Bishop C.M. Neural networks for pattern recognition. Oxford: Oxford university press, 1995. P. 482.
Bishop C.M. Pattern recognition and machine learning. New York: Springer, 2006. P. 758.
Tan X., Triggs B. Enhanced Local Texture Feature Sets for Face Recognition Under Difficult Lighting Conditions. IEEE Transactions on image processing. 2010. Vol. 19, No 6. P. 1635-1650.
Viola P., Jones M. Rapid object detection using a boosted cascade of simple features. 2001. No. 1. P. 502-511.
Szegedy et al., Going deeper with convolutions. 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2015. P. 1-9, doi: 10.1109/CVPR.2015.7298594.
Hinton G.E. A practical guide to training restricted Boltzmann machines. Momentum. 2010. No. 9 (1). P. 926.
Hubel D.H., Wiesel T.N. Brain and visual perception. ISBN13, 2005.
Hinton G.E., Salakhutdinov R.R. Reducing the dimensionality of data with neural networks. Science. 2006. No.313 (5786). P. 504-507.
Duin R.P., Pekalska E. Open issues in pattern recognition. Computer Recognition Systems. 2005. P. 27-42.
Leo B. Random forests. Machine learning. 2001. No. 45 (1). P. 5-32.