sonus

transcriptiondiarizationwhisperxgoogle-cloud-platformterraformpythoncloud-runpub-sub

Opis Link to heading

Sonus to skalowalny, chmurowy system automatycznej transkrypcji i diarizacji zbudowany na Google Cloud Platform. Wykorzystuje WhisperX do precyzyjnej konwersji mowy na tekst oraz identyfikacji mówców. Architektura opiera się na Cloud Run Jobs i Pub/Sub do asynchronicznego przetwarzania zadań. System skanuje źródła, takie jak Google Drive, w poszukiwaniu nowych plików audio i wideo. Obsługuje formaty mp3, wav, m4a, flac, mp4, mov, avi oraz mkv. Infrastruktura jest zarządzana za pomocą Terraform lub OpenTofu. Projekt składa się z dwóch głównych komponentów: aktywatora i transkrybera. Kod źródłowy jest napisany w Pythonie i testowany przy użyciu pytest. Wymaga konta GCP, Dockera oraz Pythona 3.11+. Licencja CC0 1.0 Universal pozwala na swobodne wykorzystanie projektu.

Linki Link to heading