Auphonic
,🎙️ Wie Auphonic entstand – Ein Blick hinter die Kulissen mit Gründer Georg.
In dieser Episode haben wir Georg, den Gründer von Auphonic, zu Gast und sprechen mit ihm darüber, wie alles begann. 🚀 Früher gab es für die Nachbearbeitung von Audio fast ausschließlich Echtzeit-Tools – aber warum eigentlich? Für Podcasts, bei denen die gesamte Aufnahme bereits vorliegt, wäre eine leistungsfähige Batch-Verarbeitung viel naheliegender gewesen. Genau hier setzte Auphonic an! 🤔
Natürlich sind auch Johannes, Dominik und Jochen wieder mit dabei! Gemeinsam werfen wir einen Blick auf die Entwicklung der letzten zehn Jahre: Während frühere Machine-Learning-Modelle hauptsächlich dazu dienten, die Parameter klassischer Audioprozessoren wie Kompressoren und Limitern automatisch einzustellen, setzen moderne Systeme zunehmend auf End-to-End-Deep-Learning. Heute sind Audio-to-Audio-Modelle der Stand der Technik, die das Signal direkt transformieren – ohne den Umweg über klassische Audiotools. 🎛️➡️🎶
Außerdem gibt Georg spannende Einblicke in die technische Infrastruktur von Auphonic:
- ⚙️ Django im Backend, Vue.js für den Transkripteditor, ein bisschen htmx und alpine.js
- 🚀 Celery als Task-Queue, das seit zehn Jahren treue Dienste leistet
- 🎧 Eigenes Training von Machine-Learning-Modellen auf On-Premise-GPUs, Inferenz über GPU-Instanzen bei Hetzner.
Und natürlich diskutieren wir darüber, warum es kein „One-Size-Fits-All“-Modell für Podcasts gibt – schließlich will ein True-Crime-Podcast vielleicht Atemgeräusche entfernen, während ein Yoga-Podcast genau diese beibehalten möchte. 🧘♂️🔎
Hört rein – viel Spaß bei dieser Episode! 🎧
Shownotes
Unsere E-Mail für Fragen, Anregungen & Kommentare: hallo@python-podcast.de
Auphonic
- Auphonic
- scikit-learn / NumPy / SciPy
- Schnelle Fourier-Transformation (FFT)
- Levelator
- TensorFlow / keras / PyTorch
- podcast-transcript | Das command line tool, das ich auf dem PyDDF-Herbstsprint geschrieben habe, mit dem ich den Podcast hier transkribiere
- Django / Vue.js / htmx / Alpine.js / tailwindcss
- Celery - Distributed Task Queue / NVIDIA Triton Inference Server
- Thoughts on my first machine learning project | OCR für Noten - geht das eigentlich auch umgekehrt - Notentranskripte aus Musik?
- Picks
Ben on 25. Februar 2025 07:36
Vielen Dank für die neue Folge, ich hab schon sehnsüchtig gewartet. Ich glaube ihr habt bei Spotify die Folge 60 nochmal hochgeladen unter dem Namen dieser Folge.
Jochen Wersdörfer on 25. Februar 2025 08:10
Hallo Ben :),
arg - alles was man nicht häufiger macht, geht, wenn man es dann doch mal wieder macht, natürlich schief. Hatte zwar das richtige Audio für den web-player, aber das falsche (Python 3.13) für den Feed. Gerade gefixt! Vielen Dank fürs Bescheidsagen ❤️.
Viele Grüße
Jochen