Trích xuất âm thanh từ video

Nút nguồn: 748962

Tổng kết

Trong mẫu mã này, hãy tìm hiểu cách trích xuất âm thanh từ video và lưu trữ nó trong Bộ lưu trữ đối tượng đám mây của IBM® khi được cung cấp bản ghi video về cuộc họp ảo hoặc lớp học ảo.

Mô tả

Bước đầu tiên để hiểu rõ hơn về video là trích xuất âm thanh từ video và lưu trữ nó trong một không gian lưu trữ chung có thể truy cập được. Mẫu mã này cho biết cách xem bản ghi video cuộc họp và trích xuất âm thanh từ tệp video đó bằng mã nguồn mở FFmpeg thư viện trong thời gian chạy Python Flask. FFmpeg là một giải pháp đa nền tảng, hoàn chỉnh để ghi, chuyển đổi và truyền phát âm thanh và video. Sau đó, bạn lưu trữ âm thanh được trích xuất trong IBM Cloud Object Storage, một dịch vụ lưu trữ đám mây có khả năng mở rộng cao được thiết kế để có độ bền, khả năng phục hồi và bảo mật cao. Các tệp âm thanh được lưu trữ được sử dụng để xử lý thêm nhằm cung cấp khả năng ghi nhật ký của người nói trong mẫu mã tiếp theo của Trích xuất thông tin chi tiết từ video với IBM Watson dung dịch.

Sau khi hoàn thành mẫu mã này, bạn sẽ hiểu cách:

  • Tạo nhóm lưu trữ đối tượng đám mây của IBM
  • Tải dữ liệu tệp video lên nhóm
  • Trích xuất âm thanh từ các tệp video và lưu trữ nó trong nhóm
  • Kết nối trực tiếp các ứng dụng Flask với Bộ lưu trữ đối tượng đám mây của IBM

Dòng chảy

Extract audio from video and store it in Cloud Object Storage

  1. Người dùng tải file video lên ứng dụng.
  2. Thư viện FFmpeg trích xuất âm thanh từ tệp video.
  3. Tệp âm thanh được trích xuất được lưu trữ trong Bộ lưu trữ đối tượng đám mây của IBM.

Hướng Dẫn

Tìm các bước chi tiết cho mẫu này trong README tài liệu. Các bước đó chỉ cho bạn cách:

  1. Sao chép kho lưu trữ GitHub.
  2. Tạo dịch vụ Lưu trữ đối tượng đám mây của IBM.
  3. Thêm thông tin đăng nhập vào ứng dụng.
  4. Triển khai ứng dụng.
  5. Chạy ứng dụng.

Mẫu mã này là một phần của Trích xuất thông tin chi tiết từ video với IBM Watson loạt ca sử dụng, giới thiệu giải pháp trích xuất thông tin chi tiết có ý nghĩa từ video bằng cách sử dụng các dịch vụ Watson Speech to Text, Watson Natural Language Processing và Watson Tone Analyzer.

Nguồn: https://developer.ibm.com/patterns/extract-audio-from-video-and-store-in-cloud-object-storage/

Dấu thời gian:

Thêm từ Nhà phát triển IBM