Stability AI telah menjadi pemain kunci dalam bidang pembuat gambar kecerdasan buatan (AI) berkat model Difusi Stabil sumber terbuka, yang menetapkan standar kualitas, penyesuaian, dan kecepatan. Kini, perusahaan ini menambah jajaran modelnya dengan generator teks-ke-gambar tercanggih yang pernah ada.
Pada hari Rabu, Stability AI meluncurkan Stable Diffusion 3 Medium, yang diklaim perusahaan sebagai model penghasil gambar “paling canggih”. Model dengan dua miliar parameter ini menawarkan beberapa peningkatan dari pendahulunya, sehingga menghasilkan generasi dengan kualitas lebih tinggi.
Juga: Cara menggunakan Stable Diffusion AI untuk membuat gambar menakjubkan
Misalnya, model baru ini dapat mengatasi tugas-tugas sulit yang biasanya dilakukan pembuat gambar, termasuk menghasilkan gambar fotorealistik (bahkan tangan dan wajah) dan teks akurat tanpa artefak atau kesalahan ejaan. Ia juga dapat mengikuti petunjuk yang kompleks dan memahami hubungan spasial, seperti yang terlihat pada gambar di bawah.
Menurut perusahaan, Stable Diffusion 3 Medium adalah model yang lebih kecil, menjadikannya kandidat yang baik untuk dijalankan pada sistem komputasi individual dan GPU tingkat perusahaan. Stability AI menambahkan bahwa model ini juga ideal untuk penyesuaian karena kemampuannya mengumpulkan “detail bernuansa dari kumpulan data kecil”.
Juga: Generator gambar AI terbaik tahun 2024: Diuji dan ditinjau
Bobot Stable Diffusion 3 Medium tetap bersumber terbuka dan dapat diakses oleh semua pengguna dengan lisensi non-komersial gratis melalui Hugging Face. Mereka yang tertarik menggunakan model komersial dianjurkan untuk melakukannya hubungi Stabilitas AI untuk informasi perizinan.
Stable Diffusion 3 Medium tersedia di API Stability AI, Stable Assistant, chatbot perusahaan, dan Discord melalui Stable Artisan.