Das KI-Startup Speechify verleiht Hörbüchern eine ganz eigene Note und gibt Ihnen als Zuhörer eine führende Rolle. Du kannst der Star sein, wenn du willst.
Sie können Ihre eigene Stimme importieren, um einen KI-Klon zu erstellen, und dann den Text mit Ihrer Stimme oder der Ihrer Freundin hören, wie im Fall von CEO Cliff Weitzman.
Sie können auch zwischen Prominenten wie Snoop Dogg und Gwyneth Paltrow wählen, die sich angemeldet haben, um ihre Stimmen als Optionen hinzuzufügen. Der Clou ist, dass sie von der KI generiert werden und nicht von den Prominenten selbst, die sie lesen.
„Sie können einfach Ihre eigenen Stimmen auswählen und es ist ein großartiges Erlebnis“, sagte Weitzman.
Es ist diese Möglichkeit, die gewünschte Stimme auszuwählen und jedes Buch in ein Hörbuch zu verwandeln, was Speechify laut Weitzman von Branchenriesen wie Apple Books, Audible und Spotify unterscheidet.
Hörbücher sind ein begehrtes Gut. Nach Angaben der Audio Publishers Association 2023 markiert das zwölfte Jahr in Folge mit einem Umsatzwachstum von rund 2 Milliarden US-Dollar für das Jahr. Die APA stellte außerdem fest, dass 52 % der amerikanischen Erwachsenen irgendwann einmal Hörbücher gehört haben, was etwa 150 Millionen Menschen entspricht.
Da künstliche Intelligenz und insbesondere generative KI überall ihren Einfluss ausüben, sehen wir Unternehmer, die Technologie nutzen wollen, um den Status quo in einer Vielzahl von Branchen in Frage zu stellen, von der Rechtswissenschaft über die Medizin bis hin zur generativen KI selbst. Das sieben Jahre alte Unternehmen Speechify positioniert sein Text-to-Speech-Lesetool durch den Einsatz von KI-generierten menschlichen Stimmen als Alternative zu herkömmlichen Hörbüchern.
Als Kind mit Legasthenie war Weitzman darauf angewiesen, dass seine Eltern ihm Bücher vorlasen. Aber als er ans College kam, konnte er keine Audioversionen seiner Lehrbücher finden, also entwickelte er ein Programm, um ihm mithilfe von Deep Learning vorzulesen, einer KI-Technik, die Computern beibringt, Daten wie das menschliche Gehirn und alles, was bekannt ist, zu verarbeiten als konkatenative Text-zu-Sprache, eine Form der Sprachgenerierung, die vorab aufgezeichnete Sprachproben nutzt.
Der hebräische Muttersprachler verfügte außerdem über die Möglichkeit, die Geschwindigkeit zu ändern – eine Funktion, die Speechify bis heute beibehält.
„Als ich anfing, sprach ich kein Englisch, also hörte ich mir alles mit 0,75-facher Geschwindigkeit an und erhöhte sie dann mit der Zeit auf 1x, 1,25x, 1,5x, 2x, 3x“, sagte er. „Wenn ein Satz leicht zu verstehen wäre, würde ich ihn sehr schnell schreiben. Wenn der Satz schwierig wäre, würde ich ihn sehr langsam machen.“
Weitzmans Bruder Tyler kam 2018 als Mitbegründer hinzu und fungiert seit 2022 als Leiter der Abteilung KI und Präsident. Tyler Weitzman half bei der Entwicklung des Algorithmus, der schließlich zur ersten Version von Speechify wurde. Er wurde mit 100.000 Stunden Audio trainiert, damit die Vorlesestimme menschlich klang.Als sich das Produkt verbesserte, schloss sich das Startup mit Prominenten zusammen, um auch deren Stimmen zu nutzen.
Speechify kann Bücher, Dokumente und Artikel auf einem mobilen Gerät lesen. Um es zu verwenden, können Sie eine PDF-Datei in die Web-App hochladen, die den Ton zu Ihrer mobilen App hinzufügt, oder Sie können die Chrome-Erweiterung herunterladen, um Text von Google Drive, iCloud oder Dropbox anzuhören.
Eine eingeschränkte Version von Speechify ist kostenlos. Es enthält sechs Lesestimmen, um Ihnen den Einstieg zu erleichtern, und Sie können mit bis zu 1-facher Geschwindigkeit zuhören. Zu diesen Stimmoptionen gehören computergenerierte amerikanische Männer namens Nate und John sowie Stephanie, eine weibliche Stimme aus dem Vereinigten Königreich, zusammen mit Snoop Dogg, Gwyneth Paltrow und dem amerikanischen YouTuber Mr.
Ich habe mich für Stephanie entschieden und dann teilte mir die App mit, dass in der App auch über 100 Stimmen verfügbar sein würden. (Sie müssen sich anschließend ein etwa einminütiges Verkaufsgespräch mit der von Ihnen gewählten Stimme anhören, bevor Sie fortfahren können.)
Speechify Premium, das 11,67 US-Dollar pro Monat und Benutzer kostet, verfügt über mehr als 250 Lesestimmen und mehr als 50 Sprachen und Sie können mit bis zu 4,5-facher Hörgeschwindigkeit hören.
Laut Cliff Weitzman hat Speechify 40 Millionen Nutzer. (Die App selbst gibt jedoch an, dass über 23 Millionen Menschen Speechify verwenden, während Sie sich anmelden.)
Das Startup wird angeblich unterstützt von 4,5 Millionen US-Dollar aus einer Risikokapitalrunde im Frühstadium im Jahr 2020. Das Unternehmen lehnte eine Stellungnahme zur Finanzierung ab.
Dies ist eines aus einer Reihe kurzer KI-Startup-Profile, die Ihnen helfen sollen, die Landschaft der laufenden KI-Aktivitäten zu verstehen. Um mehr über KI zu erfahren, schauen Sie sich unseren neuen AI Atlas-Hub an, der Produktbewertungen, Neuigkeiten, Tipps und Erklärungen enthält.