8 ideas de proyectos de aprendizaje profundo para principiantes

Tags: Principiantes, Aprendizaje profundo, Proyecto

¿Ha estudiado técnicas de Deep Learning, pero nunca ha trabajado en un proyecto útil? Aquí, destacamos ocho ideas de proyectos de aprendizaje profundo para principiantes que lo ayudarán a perfeccionar sus habilidades y mejorar su currículum.

comentarios

By Aqsa Zafar, Doctor. Académico en aprendizaje automático | Fundador de MLTUT | Solopreneur | Blogger.

1. Identificación de la raza del perro

Hay varias razas de perros y la mayoría son similares entre sí. Como principiante, puede construir un modelo de identificación de raza de perro para identificar la raza del perro.

Para este proyecto, puede utilizar el conjunto de datos de razas de perros para clasificar varias razas de perros a partir de una imagen. Puede descargar el conjunto de datos de razas de perros desde Kaggle.

También encontré este tutorial completo para Clasificación de razas de perros mediante aprendizaje profundo por Kirill Panarin.

2. Detección de rostros

Este también es un buen proyecto de aprendizaje profundo para principiantes. En este proyecto, debes construir un modelo de aprendizaje profundo que detecte los rostros humanos de la imagen.

El reconocimiento facial es tecnología de visión por computadora. En la detección de rostros, debes localizar y visualizar los rostros humanos en cualquier imagen digital.

Puede construir este proyecto en Python usando OpenCV. Para obtener el tutorial completo, consulte este artículo, R Reconocimiento facial en tiempo real con Python y OpenCV.

3. Detección de enfermedades de cultivos

En este proyecto, debes construir un modelo que prediga enfermedades en los cultivos. utilizando imágenes RGB. Para construir un modelo de detección de enfermedades de cultivos, se utilizan redes neuronales convolucionales (CNN).

CNN toma una imagen para identificar la enfermedad y detectarla. Hay varios pasos en la red neuronal convolucional. Estos pasos son:

Operación de convolución.
Capa ReLU.
Agrupación.
Aplastamiento.
Conexión completa.

Puede descargar el conjunto de datos de imágenes de cultivos agrícolas en Kaggle.

4. Clasificación de imágenes con el conjunto de datos CIFAR-10

La clasificación de imágenes es el mejor proyecto para principiantes. En un proyecto de clasificación de imágenes, debe clasificar las imágenes en varias clases.

Para este proyecto, puede utilizar CIFAR-10 Dataset, que contiene 60,000 imágenes en color. Estas imágenes se clasifican en 10 clases, como automóviles, pájaros, perros, caballos, barcos, camiones, etc.

Fuente: conjunto de datos CIFAR-10.

Para los datos de entrenamiento, hay 50,000 imágenes y para los datos de prueba, se utilizan 10,000 imágenes. La clasificación de imágenes es una de las aplicaciones más utilizadas del aprendizaje profundo. Puede descargar el Conjunto de datos CIFAR-10 esta página.

5. Reconocimiento de dígitos escritos a mano

Para explorar y probar sus habilidades de aprendizaje profundo, creo que este es el mejor proyecto a considerar. En este proyecto, creará un sistema de reconocimiento que reconoce los dígitos escritos a mano por humanos.

Puede consultar este tutorial para Reconocimiento de dígitos escritos a mano usando Python.

Este tutorial usa el Conjunto de datos MNIST y un tipo especial de red neuronal profunda que son las redes neuronales convolucionales.

6. Detección de color

Este es un proyecto de nivel principiante en el que debe crear una aplicación interactiva. Esta aplicación identificará el color seleccionado de cualquier imagen. Hay 16 millones de colores basados en los diferentes valores de color RGB, pero solo conocemos algunos colores.

Para implementar este proyecto, necesita tener un conjunto de datos etiquetado de todos los colores que conocemos, y luego debe calcular qué color se parece más al valor de color seleccionado.

Para implementar este proyecto, debe estar familiarizado con las bibliotecas OpenCV y Pandas de Computer Vision Python.

Puedes consultar todos los detalles sobre este proyecto esta página.

7. Animación de imágenes en tiempo real

Este es un proyecto de código abierto sobre visión por computadora. En este proyecto, debe realizar la animación de imágenes en tiempo real utilizando OpenCV. Tomé esta imagen del repositorio de GitHub del proyecto.

Fuente: GitHub.

Como puede ver en la imagen, el modelo imita la expresión de la persona frente a la cámara y cambia la expresión de la imagen en consecuencia.

Este proyecto es útil, especialmente si planea entrar en la industria de la moda, el comercio minorista o la publicidad. Puedes consultar el código de este proyecto en GitHub y Cuaderno Colab

8. Detección de somnolencia del conductor

Los accidentes de tráfico son un problema grave y la principal razón son los conductores somnolientos. Pero puede prevenir este problema creando una detección de somnolencia del conductor .

El sistema de detección de somnolencia del conductor detecta la somnolencia del conductor al evaluar constantemente los ojos del conductor y alertarlo con alarmas.

Para este proyecto, se necesita una cámara web para monitorear los ojos del conductor. Python, OpenCV y Keras se utilizan para alertar al conductor cuando tiene sueño.

Puedes consultar este tutorial completo del proyecto aquí, Sistema de detección de somnolencia del conductor con OpenCV y Keras.

Original. Publicado de nuevo con permiso.

Bio: Aqsa Zafar, Doctor. El investigador en minería de datos investiga "Detección de depresión en las redes sociales a través de la minería de datos" y escribe sobre ciencia de datos y aprendizaje automático en MLTUT para compartir conocimientos y experiencias en el campo.

Relacionado:

= ← Publicación anterior

Publicación siguiente → =>

Historias principales de los últimos 30 días

Más popular
Automatice Microsoft Excel y Word con Python ¿Lee archivos de Excel con Python? Hay una forma 1000 veces más rápida La diferencia entre científicos de datos e ingenieros de ML Preguntas y respuestas más comunes de entrevistas sobre ciencia de datos Las 9 aplicaciones más comunes de Django

Lo más compartido
La diferencia entre científicos de datos e ingenieros de ML Cómo consultar su marco de datos de Pandas Prefecto: Cómo escribir y programar su primer canal de ETL con Python Prueba de hipótesis explicada Hoja de referencia de ciencia de datos 2.0