Home Uncategorized Grok erhält ein beeindruckendes Upgrade – und eine scheinbar unkontrollierte KI-Bilderzeugung

Grok erhält ein beeindruckendes Upgrade – und eine scheinbar unkontrollierte KI-Bilderzeugung

21
0
Grok erhält ein beeindruckendes Upgrade – und eine scheinbar unkontrollierte KI-Bilderzeugung

SOPA Images / Mitwirkender / Getty Images

Elon Musk war bei der Gründung des Unternehmens im Jahr 2015 ein Investor von OpenAI, hat seitdem aber nicht nur die Verbindung zum Unternehmen abgebrochen, sondern auch dessen Ansatz in Bezug auf politische Korrektheit und Sicherheit kritisiert. Daraufhin brachte Musk seinen eigenen KI-Chatbot Grok auf den Markt, der gerade ein ziemlich großes Upgrade erhalten hat.

Außerdem: Nvidia wird in einer weltweit ersten Partnerschaft 100.000 Kalifornier in KI ausbilden

Am Dienstag hat xAI, ein von Musk gegründetes KI-Unternehmen, angekündigt Früher Vorschaustart von Grok-2, einem führenden Large Language Model (LLM) mit erweiterten Chat-, Codierungs- und Argumentationsfunktionen. Zur Markteinführung gehört auch der Grok-2 mini, der, wie der Name schon sagt, eine leichte Version des Grok-2 ist.

Vor dieser Veröffentlichung wurde eine frühe Version von Grok-2 in der Chatbot Arena der Large Model Systems Organization (LMSYS) unter dem anonymen Namen „sus-column-r“ getestet, eine Praxis, die viele KI-Unternehmen anwenden, bevor sie ein neues Modell auf den Markt bringen.

Auf dieser Crowdsourcing-Plattform können Benutzer LLMs bewerten, indem sie mit zwei Modellen nebeneinander chatten und ihre Antworten vergleichen, ohne den Namen des Modells zu kennen, sodass die Ergebnisse wirklich zeigen, wie leistungsfähig sie sind. Im Vergleich zu branchenführenden Modellen wie dem GPT-4o von OpenAI und dem Gemini 1.5 Pro von Google konnte sich der Grok-2 behaupten und belegte in der Kategorie „Gesamt“ den dritten Platz und lag gleichauf mit dem GPT-4o, wie unten zu sehen ist.

Wenn Sie, wie ich, vorbeikommen Bestenliste der Chatbot-Arena und überrascht, nicht die gleichen Ergebnisse zu sehen, gab LMSYS bekannt, dass sie vorläufige Ergebnisse auf Twitter (X) veröffentlicht hatten, mit „Offizielles Update für Grok 2 folgt bald …!“

Außerdem: KI-Risiken sind überall – und jetzt fügt das MIT sie alle einer Datenbank hinzu

Zu den weiteren bemerkenswerten Ergebnissen der Chatbot Arena zählen die Kompetenz von Grok-2 in den Kategorien Mathematik und Codierung, die ihm in beiden Kategorien den zweiten Platz einbrachte, und Hard Prompts, die ihm den vierten Platz belegten. Wenn Sie es in der Arena testen möchten, besuchen Sie uns WebseiteKlicken Sie nebeneinander auf „Arena“ und geben Sie dann den Beispielbefehl ein.

Das Unternehmen bewertete die Leistung von Grok-2 auch anhand beliebter LLM-Leistungsbenchmarks, einschließlich der Massive Multitask Language Understanding (MMLU) und MATH-Benchmarks. Die Ergebnisse sind besser als beim Vorgänger, dem Grok 1.5, und mit branchenführenden Modellen konkurrenzfähig, darunter GPT-4o, Claude 3 Opus, Llama 3 und mehr.

Bestenliste in Bezug auf die Elo-Gesamtpunktzahl
xAI

Über die fortschrittliche Textleistung hinaus ermöglicht Grok 2 Benutzern die Erstellung hochwertiger Bilder durch die Zusammenarbeit mit dem FLUX.1-Bildgeneratormodell von Black Forest Labs.

Während bei vielen Bildgeneratoren auf dem Markt strenge Beschränkungen für die Erstellung von Bildern mit Persönlichkeiten des öffentlichen Lebens wie Prominenten und Politikern gelten, ist dies bei Grok-2 nicht der Fall, da viele Betatester die Plattform übermäßig genutzt haben und Bilder von Politikern in provokanten Situationen erstellt haben. Im Folgenden beziehe ich eine der weniger provokativen Generationen ein.

Die angezeigten Bilder sind von hoher Qualität und realistisch, aber es scheint auf der Plattform keine Offenlegung zu geben, die eindeutig erklärt, dass die Bilder erstellt wurden, ein weiterer Ansatz, den viele Social-Media-Plattformen verfolgen, um die Sicherheit der Benutzer zu gewährleisten.

Außerdem: Googles neue Pixel-Screenshots könnten das Feature sein, das endlich Lust auf KI macht

Grok-2 und Grok-2 mini werden in der Betaversion für Premium- und Premium+ X- bis X-Benutzer eingeführt. Diese Premium-, Prioritätsantworten, ID-Verifizierung und mehr. Beide Modelle werden noch in diesem Monat über die neue API-Plattform des Unternehmens für Entwickler freigegeben.



Source link