Home Uncategorized Einem neuen Patent zufolge arbeitet Microsoft möglicherweise an einem Audio-zu-Bild-Generator

Einem neuen Patent zufolge arbeitet Microsoft möglicherweise an einem Audio-zu-Bild-Generator

4
0
Einem neuen Patent zufolge arbeitet Microsoft möglicherweise an einem Audio-zu-Bild-Generator

spfdigital/Getty Images

Derzeit gibt es viele Tools für künstliche Intelligenz (KI) auf dem Markt, die Benutzertexte und -bilder in Bilder und Videos umwandeln können, die den anfänglichen Befehlen entsprechen. Ein neues Patent enthüllt, dass Audio bald eine Eingabeoption sein wird, um Ihre Vision zum Leben zu erwecken.

Wie gesehen von MSPowerUserDas US-Patent- und Markenamt (USPTO) veröffentlichte eine 20-seitiges Dokument eingereicht von Microsoft am 5. April 2023 und veröffentlicht am 10. Oktober 2024, in dem ein neues KI-gestütztes System beschrieben wird, das Live-Audio in Bilder umwandelt.

Außerdem: Der kostenlose KI-Videogenerator von Adobe ist da – wie man ihn ausprobiert

Das System nimmt Live-Streaming-Audio, beispielsweise von einem Meeting oder einer Vorlesung, auf und wandelt es in ein Live-Texttranskript um. Das Transkript wird dann mit einem großen Sprachmodell (LLM) zusammengefasst und in ein Text-zu-Bild-Modell eingespeist, wo ein Bild generiert und auf dem Bildschirm angezeigt wird, wie im Bild unten zu sehen ist.

Patent Microsoft
Microsoft

Das System führt dies während des gesamten Audiostreams durch und erzeugt kontinuierlich ein Livebild. Laut Microsoft kann die Anzeige von Bildern in Echtzeit dazu beitragen, die Kommunikation effektiver zu gestalten, da visuelle Hilfsmittel die Menschen stärker einbeziehen und Konzepte leichter verständlich machen.

„Die Anzeige von Bildern im Zusammenhang mit mündlich übermittelten Informationen kann die Effektivität der Kommunikation steigern, indem sie sie ansprechender, einprägsamer und leichter verständlich macht“, sagte Microsoft.

Außerdem: Beste KI-Chatbots des Jahres 2024: ChatGPT, Copilot und würdige Alternativen

Wenn Sie sich fragen, ob die Funktion bald eingeführt wird, lautet die Antwort wahrscheinlich nein. Die Einreichung eines Patents ist ein langer Weg von der Herstellung eines Produkts oder einer Funktion, und viele Patente gelangen nie in die Produktion und bleiben nur Ideen.

Wenn Microsoft sich jedoch dazu entschließt, diese Funktion einzuführen, wird sie wahrscheinlich in Microsoft Teams, seiner Videokonferenz-Meeting-Plattform, verfügbar sein und über das KI-Add-on Copilot wie Copilot Pro oder Microsoft 365 Copilot for Business zugänglich sein.

Source link