Özet
Bu kod kalıbı, video ve ses dosyalarında bir konuyu aramak için kullanabileceğiniz bir uygulamanın nasıl oluşturulacağını açıklar.
Açıklama
Bir podcast'i veya kursların video veya ses dosyalarını dinlerken, genellikle konu dışı bilgileri dinlemek yerine doğrudan konuya atlamak istersiniz. Ancak, tüm kaydın içindeki konuları ve anahtar kelimeleri bulmak zor olabilir.
Bu kod modelinde, video veya ses dosyalarında arama yapmak için kullanabileceğiniz bir uygulama oluşturun. Uygulama ile yalnızca arama yapmakla kalmaz, aynı zamanda arama dizesinin veya konunun dosyada geçtiği metni de vurgulayabilirsiniz. Kod modeli, ses dosyalarında doğal bir dilde sorgu araması gerçekleştirir ve sonuçları, arama konunuzun tartışıldığı uygun zaman dilimiyle döndürür. Bu örnek, süreci açıklamak için bir IBM® Watson ™ Machine Learning tanıtım videosu kullanır.
Kod modelini tamamladığınızda, aşağıdakilerin nasıl yapılacağını anlarsınız:
- Ses ve video verilerini hazırlayın ve birlikte çalışmak için daha küçük parçalara ayırmak için parçalar oluşturun
- Sesi veya videoyu metne dönüştürmek için API çağrıları aracılığıyla Watson Speech to Text hizmetiyle çalışın
- Metin parçalarında arama yapmak için API çağrıları aracılığıyla Watson Discovery hizmetiyle çalışın
- Bir Python Flask uygulaması oluşturun ve bunu IBM Cloud'da devreye alın.
akış
- Kullanıcı, videoyu veya ses dosyasını kullanıcı arayüzüne yükler.
- Video veya ses dosyası,
moviepy
vepydub
Python kitaplıkları ve birlikte çalışmak için daha küçük parçalar oluşturmak için parçalara ayrılmıştır. - Kullanıcı, sağlanan uygulama UI'si aracılığıyla Watson Speech to Text hizmetiyle etkileşime girer. Ses parçaları, Watson Speech to Text ile metin yığınlarına dönüştürülür.
- Metin parçaları, Python SDK'ları ile Watson Discovery API'leri çağrılarak Watson Discovery'ye yüklenir.
- Kullanıcı, Watson Discovery'yi kullanarak bir arama sorgusu gerçekleştirir.
- Sonuçlar kullanıcı arayüzünde gösterilir.
talimatlar
Ayrıntılı adımları izleyin beni oku dosya. Bu adımlar şunların nasıl yapılacağını gösterir:
- GitHub deposunu klonlayın.
- Watson Metinden Konuşmaya hizmetini oluşturun.
- Bir Watson Discovery örneği oluşturun.
- Uygulamayı yerel olarak çalıştırın.
Kaynak: https://developer.ibm.com/patterns/audio-search-on-podcasts/