Von der Idee zur Stimme - Brigitte E.S. Jansen & Klaus Lichtenauer

Von der Idee zur Stimme

By Brigitte E.S. Jansen & Klaus Lichtenauer

  • Release Date: 2026-04-30
  • Genre: Computers & Internet

Description

Von der Idee zur Stimme: KI-Speech-Technologien für moderne Content-Macher und Entwickler, 2., erweiterte und aktualisierte Auflage 2026. KI-Stimmen klingen 2026 täuschend echt, emotional, nuanciert und mehrsprachig. Doch welche Plattform passt zu welchem Projekt? Und worauf müssen Entwicklerinnen und Entwickler bei der technischen Integration achten? Dieser Band der Reihe GfA-Info to Go gibt einen praxisorientierten Überblick über den aktuellen Stand der KI-gestützten Sprachsynthese (Text-to-Speech) und Spracherkennung (Speech-to-Text). Die Autorin und der Autor vergleichen die wichtigsten Plattformen und APIs systematisch anhand klar definierter Kriterien, von Natürlichkeit und Ausdruckskraft über Sprachklonung und SSML-Unterstützung bis hin zu Echtzeitfähigkeit und Preisgestaltung. Für Content-Ersteller werden ElevenLabs, Hume AI OCTAVE TTS, Murf AI, Smallest.ai (Waves), Play.ht, MyEdit, PowerDirector und Minimax.io vorgestellt und verglichen, mit konkreten Empfehlungen für Hörbücher, Podcasts und Video-Voiceovers. Für Entwicklerinnen und Entwickler werden die führenden APIs bewertet: OpenAI Whisper v3 und Realtime API, Google Gemini 2.5, Amazon Polly, Google Cloud Speech-to-Text (Chirp 2), Microsoft Azure Speech Service, Assembly AI und Deepgram Nova-3. Darüber hinaus beleuchtet der Band die rechtlichen Rahmenbedingungen der EU-KI-Verordnung (AI Act), insbesondere Transparenzpflichten bei KI-generierten Inhalten und Zustimmungsanforderungen bei der Stimmklonung. Ein Abkürzungsverzeichnis, ein Glossar mit 14 Fachbegriffen sowie ein vollständiges Literaturverzeichnis nach APA 7 runden den Band ab. Brigitte E.S. Jansen und Klaus Lichtenauer, GfA e.V. Baden-Baden.