Identificación de personas sin barbijo utilizando Deep Learning
DOI:
https://doi.org/10.52428/20758944.v18i52.236Palabras clave:
Visión por computador, Aprendizaje profundo, Red neuronal convolucional, Detección de objetos, YOLOResumen
Este trabajo hace uso de las redes neuronales convolucionales para la detección de personas sin barbijo, ya que debido a la coyuntura actual del COVID-19 y de acuerdo con las medidas de bioseguridad instruidas por las instituciones gubernamentales y de salud, se ha visto de una manera comprobada que el uso de los barbijos o mascarillas quirúrgicas ayudan a reducir el riesgo de contagio de la enfermedad, por esta razón se hace evidente la necesidad de realizar la detección o identificación de personas que no estén utilizando un barbijo, incumpliendo con esta medida de bioseguridad y poniendo en riesgo a un grupo de la población.
Inicialmente se estableció un repositorio de entrenamiento compuesto por imágenes de personas con y sin barbijos, dichas imágenes habrían sido obtenidas de distintas fuentes.
Se han entrenado y comparado tres tipos de redes neuronales convolucionales, Faster R-CNN, SSD (Single Shot MultiBox Detector) y YOLO (You Only Look Once), cada una realiza la detección de personas con y sin barbijos, destacándose una de otra por su rapidez, precisión o rendimiento.
Para la obtención de los modelos de detección de objetos, se han utilizado los frameworks Darknet y TensorFlow Object Detection API, además de Google Colab que al ser un servicio de un proveedor gratuito, proveyó también potentes características computacionales.
Descargas
Citas
Bisong, E. (2019). Google Colaboratory. En Building Machine Learning and Deep Learning Models on Google Cloud Platform. Apress. https://doi.org/10.1007/978-1-4842-4470-8_7 DOI: https://doi.org/10.1007/978-1-4842-4470-8
Bochkovskiy, A. (2021). GitHub - AlexeyAB/darknet: YOLOv4 / Scaled-YOLOv4 / YOLO - Neural Networks for Object Detection (Windows and Linux version of Darknet). Recuperado el 27 de Marzo de 2021, de GitHub: https://github.com/AlexeyAB/darknet
Bochkovskiy, A. (2021). Running a YOLOv4 Object Detector with Darknet in the Cloud! (GPU ENABLED). Recuperado el 27 de Marzo de 2021, de Google Colab: https://colab.research.google.com/drive/1_GdoqCJWXsChrOiY8sZMr_zbr_fH-0Fg
Bochkovskiy, A., Wang, C.-Y., & Liao, H.-Y. M. (2020). YOLOv4: Optimal Speed and Accuracy of Object Detection. arXiv:2004.10934.
Girshick, R. (2015). Fast R-CNN. Proceedings of the IEEE International Conference on Computer Vision, (págs. 1440-1448). https://doi.org/10.1109/ICCV.2015.169 DOI: https://doi.org/10.1109/ICCV.2015.169
Joshi, N. (2020). How to fine-tune your artificial intelligence algorithms. Recuperado el 20 de Abril de 2022, de Allerin: https://www.allerin.com/blog/how-to-fine-tune-your-artificial-intelligence-algorithms
Khandelwal, R. (2019). COCO and Pascal VOC data format for Object detection. Recuperado el 28 de Marzo de 2021, de Towards Data Science: https://towardsdatascience.com/coco- data-format-for-object-detection-a4c5eaf518c5
Liu, W., Anguelov, D., Erhan, D., Szegedy, C., Reed, S., Fu, C.-Y., & Berg, A. (2016). SSD: Single Shot MultiBox Detector. European Conference on Computer Vision, (pp. 21-37). https://doi.org/10.1007/978-3-319-46448-0_2 DOI: https://doi.org/10.1007/978-3-319-46448-0_2
Padilla, R., Netto, S. L., & da Silva, E. A. (2020). A Survey on Performance Metrics for Object-Detection Algorithms. International Conference on Systems Signals and Image Processing. https://doi.org/10.1007/978-3-319-46448-0_2 DOI: https://doi.org/10.1109/IWSSIP48289.2020.9145130
Pan, S. J., Yang, Q. (2010). A Survey on Transfer Learning. IEEE Transactions on Knowledge and Data Engineering, vol. 22, (pp. 1345-1359), doi: https://doi.org/10.1007/978-3-319-46448-0_2 DOI: https://doi.org/10.1109/TKDE.2009.191
Ponnusamy, A. (24 de Marzo de 2021). Preparing Custom Dataset for Training YOLO Object Detector. Obtenido de Vision Geek: https://www.visiongeek.io/2019/10/preparing- custom-dataset-for-training-yolo-object-detector.html
Redmon, J. (2013-2016). Darknet: Open Source Neural Networks in C. Obtenido de http://pjreddie.com/darknet/
Redmon, J., Divvala, S., Girshick, R., & Farhadi, A. (2016). You Only Look Once: Unified, Real-Time Object Detection. IEEE. https://doi.org/10.1109/CVPR.2016.91 DOI: https://doi.org/10.1109/CVPR.2016.91
TensorFlow 2 Detection Model Zoo. (1 de Mayo de 2021). Obtenido de GitHub:
https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/tf2_d etection_zoo.md
TensorFlow. (1 de Mayo de 2021). Obtenido de www.tensorflow.org https://doi.org/10.1007/978- 1-4842-6373-0_1
TensorFlow Object Detection API. (1 de Mayo de 2021). Obtenido de https://github.com/tensorflow/models/tree/master/research/object_detection
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2022 Giovanny German Rocha Vallejo
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Los autores/as que publiquen en esta revista aceptan las siguientes condiciones:
- Los autores/as conservan los derechos de autor y ceden a la revista el derecho de la primera publicación, con el trabajo registrado con la licencia de atribución de Creative Commons 4.0, que permite a terceros utilizar lo publicado siempre que mencionen la autoría del trabajo y a la primera publicación en esta revista.
- Los autores/as pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.
- Se permite y recomienda a los autores/as a compartir su trabajo en línea (por ejemplo: en repositorios institucionales o páginas web personales) antes y durante el proceso de envío del manuscrito, ya que puede conducir a intercambios productivos, a una mayor y más rápida citación del trabajo publicado.