8 ý tưởng về dự án học sâu cho người mới bắt đầu

tags: Người mới bắt đầu, Học kĩ càng, Dự án

Bạn đã từng nghiên cứu các kỹ thuật Deep Learning, nhưng chưa bao giờ làm việc trên một dự án hữu ích? Ở đây, chúng tôi nêu bật tám ý tưởng dự án học sâu dành cho người mới bắt đầu sẽ giúp bạn rèn giũa các kỹ năng và thúc đẩy hồ sơ xin việc của mình.

Bình luận

By Aqsa Zafar, Bằng tiến sĩ. Học giả về Học máy | Người sáng lập tại MLTUT | Solopreneur | Blogger.

1. Nhận dạng giống chó

Có nhiều giống chó khác nhau, và hầu hết chúng đều giống nhau. Khi mới bắt đầu, bạn có thể xây dựng mô hình nhận dạng giống Chó để xác định giống chó.

Đối với dự án này, bạn có thể sử dụng bộ dữ liệu về giống chó để phân loại các giống chó khác nhau từ một hình ảnh. Bạn có thể tải xuống bộ dữ liệu về các giống chó từ Kaggle.

Tôi cũng tìm thấy hướng dẫn đầy đủ này cho Phân loại giống chó bằng cách sử dụng Học sâu của Kirill Panarin.

2. Nhận diện khuôn mặt

Đây cũng là một dự án học sâu tốt cho người mới bắt đầu. Trong dự án này, bạn phải xây dựng một mô hình học sâu phát hiện khuôn mặt người từ hình ảnh.

Nhận dạng khuôn mặt là công nghệ thị giác máy tính. Trong nhận diện khuôn mặt, bạn phải xác định vị trí và hình dung khuôn mặt người trong bất kỳ hình ảnh kỹ thuật số nào.

Bạn có thể xây dựng dự án này bằng Python bằng OpenCV. Để có hướng dẫn đầy đủ, hãy xem bài viết này, R Nhận dạng khuôn mặt eal-time với Python & OpenCV.

3. Phát hiện bệnh cây trồng

Trong dự án này, bạn phải xây dựng một mô hình dự đoán dịch bệnh trên cây trồng sử dụng hình ảnh RGB. Để xây dựng mô hình phát hiện bệnh trên cây trồng, Mạng thần kinh chuyển đổi (CNN) được sử dụng.

CNN chụp ảnh để xác định bệnh và phát hiện. Có nhiều bước khác nhau trong Mạng thần kinh chuyển đổi. Các bước sau là:

Hoạt động Convolution.
Lớp ReLU.
Tổng hợp.
Làm phẳng.
Kết nối đầy đủ.

Bạn có thể tải xuống bộ dữ liệu hình ảnh cây trồng nông nghiệp từ Kaggle.

4. Phân loại hình ảnh với Bộ dữ liệu CIFAR-10

Phân loại hình ảnh là dự án tốt nhất cho người mới bắt đầu. Trong một dự án phân loại hình ảnh, bạn phải phân loại hình ảnh thành các lớp khác nhau.

Đối với dự án này, bạn có thể sử dụng Bộ dữ liệu CIFAR-10, chứa 60,000 hình ảnh màu. Những hình ảnh này được phân loại thành 10 lớp, chẳng hạn như ô tô, chim, chó, ngựa, tàu, xe tải, v.v.

Nguồn: Bộ dữ liệu CIFAR-10.

Đối với dữ liệu đào tạo, có 50,000 hình ảnh và đối với dữ liệu thử nghiệm, 10,000 hình ảnh được sử dụng. Phân loại hình ảnh là một trong những ứng dụng được sử dụng nhiều nhất của học sâu. Bạn có thể tải xuống Bộ dữ liệu CIFAR-10 tại đây.

5. Nhận dạng chữ số viết tay

Để khám phá và kiểm tra kỹ năng học sâu của bạn, tôi nghĩ đây là dự án tốt nhất để xem xét. Trong dự án này, bạn sẽ xây dựng một hệ thống nhận dạng có thể nhận ra các chữ số viết tay của con người.

Bạn có thể kiểm tra hướng dẫn này cho Nhận dạng chữ số viết tay bằng Python.

Hướng dẫn này sử dụng Bộ dữ liệu MNIST và một loại mạng nơ-ron sâu đặc biệt là Mạng nơ-ron hợp pháp.

6. Phát hiện màu sắc

Đây là một dự án cấp độ người mới bắt đầu, nơi bạn phải xây dựng một ứng dụng tương tác. Ứng dụng này sẽ xác định màu đã chọn từ bất kỳ hình ảnh nào. Có 16 triệu màu dựa trên các giá trị màu RGB khác nhau, nhưng chúng ta chỉ biết một vài màu.

Để thực hiện dự án này, bạn cần có một tập dữ liệu được gắn nhãn của tất cả các màu mà chúng tôi biết, sau đó bạn cần tính toán màu nào giống nhất với giá trị màu đã chọn.

Để thực hiện dự án này, bạn nên làm quen với các thư viện Python của Computer Vision là OpenCV và Pandas.

Bạn có thể kiểm tra tất cả các chi tiết liên quan đến dự án này tại đây.

7. Hoạt ảnh thời gian thực

Đây là một dự án mã nguồn mở về thị giác máy tính. Trong dự án này, bạn phải thực hiện hoạt ảnh trong thời gian thực bằng OpenCV. Tôi đã lấy hình ảnh này từ kho lưu trữ GitHub của dự án.

Nguồn: GitHub.

Như bạn có thể thấy trong hình ảnh, người mẫu bắt chước biểu cảm của người trước máy ảnh và thay đổi biểu cảm hình ảnh cho phù hợp.

Dự án này rất hữu ích, đặc biệt nếu bạn dự định tham gia vào ngành thời trang, bán lẻ hoặc quảng cáo. Bạn có thể kiểm tra mã của dự án này tại GitHub và Sổ tay Colab quá.

8. Phát hiện buồn ngủ khi lái xe

Tai nạn trên đường là một vấn đề nghiêm trọng, và nguyên nhân chính là do người lái xe buồn ngủ. Nhưng bạn có thể ngăn chặn vấn đề này bằng cách tạo trình phát hiện tình trạng buồn ngủ của người lái xe hệ thống.

Hệ thống Phát hiện Buồn ngủ của Người lái xe phát hiện tình trạng buồn ngủ của người lái xe bằng cách liên tục đánh giá mắt của người lái xe và cảnh báo anh ta bằng chuông báo.

Đối với dự án này, một webcam là cần thiết để giám sát đôi mắt của người lái xe. Python, OpenCV và Keras được sử dụng để cảnh báo người lái xe khi anh ta cảm thấy buồn ngủ.

Bạn có thể kiểm tra hướng dẫn dự án hoàn chỉnh này tại đây, Hệ thống phát hiện buồn ngủ cho người lái xe với OpenCV & Keras.

Nguyên. Đăng lại với sự cho phép.

Tiểu sử: Aqsa Zafar, Bằng tiến sĩ. học giả về Khai phá dữ liệu nghiên cứu “Phát hiện trầm cảm từ phương tiện truyền thông xã hội thông qua khai thác dữ liệu” và viết về Khoa học dữ liệu và học máy tại MLTUT để chia sẻ kiến thức và kinh nghiệm trong lĩnh vực này.

Liên quan:

= Trước bài

Bài tiếp theo =>

Câu chuyện hàng đầu trong 30 ngày qua

Phổ biến nhất
Tự động hóa Microsoft Excel và Word bằng Python Bạn có đọc tệp Excel bằng Python không? Có một cách nhanh hơn 1000 lần Sự khác biệt giữa các nhà khoa học dữ liệu và kỹ sư ML Câu hỏi và câu trả lời phỏng vấn khoa học dữ liệu phổ biến nhất 9 ứng dụng phổ biến nhất của Django

Được chia sẻ nhiều nhất
Sự khác biệt giữa các nhà khoa học dữ liệu và kỹ sư ML Cách truy vấn khung dữ liệu gấu trúc của bạn Prefect: Cách viết và lập lịch trình đường ống ETL đầu tiên của bạn với Python Kiểm tra giả thuyết được giải thích Bảng tóm tắt khoa học dữ liệu 2.0