"Dopamin eksikliği vuruyor, çünkü sonuçlar her seferinde çok mükemmel."
AI görüntü oluşturucu Midjourney v5'teki aydınlatma ve cilt efektlerine bir örnek. |
Çarşamba günü Midjourney, bazı AI sanat hayranlarının ürkütücü ve "fazla mükemmel" olarak adlandırdığı bir kalite düzeyinde fotogerçekçi görüntüler üretebilen ticari AI görüntü sentez hizmetinin 5. sürümünü duyurdu. Midjourney v5, Discord aracılığıyla sunulan Midjourney hizmetine abone olan müşteriler için bir alfa testi olarak artık mevcut.
Midjourney kreasyonlarını Twitter'da sık sık paylaşan bir grafik tasarımcı olan Julie Wieland, "MJ v5 şu anda bana, görme bozukluğunu biraz fazla uzun süre göz ardı ettikten sonra nihayet gözlük almak gibi geliyor," dedi. "Birden her şeyi 4k olarak görüyorsunuz, garip bir şekilde bunaltıcı ama aynı zamanda harika bir duygu."
Wieland, Midjourney v5 nesillerinden bazılarını Ars Technica ile paylaştı (aşağıda bir galeride ve yukarıdaki ana resimde görülüyor) ve Midjourney'nin Mart 2022'de ilk kez gelmesinden bu yana görüntü ayrıntılarında kesinlikle bir ilerleme gösteriyorlar. Sürüm 3, Ağustos'ta piyasaya çıktı ve sürüm 4, Kasım ayında giriş yaptı. Deneylerimizin gösterdiği gibi, her yineleme, oluşturulan sonuçlara daha fazla ayrıntı ekledi:
Midjourney, milyonlarca insan yapımı sanat eseri üzerinde eğitilmiş bir yapay zeka modeli kullanarak "istemler" adı verilen metin açıklamalarına dayalı görüntüler oluşturması açısından Stable Diffusion ve DALL-E gibi görüntü sentezleyicilere benzer şekilde çalışır. Son zamanlarda Midjourney, hizmetin önceki sürümlerini kullanan bir çizgi romanla ilgili bir telif hakkı tartışmasının merkezinde yer alıyordu.
Bir gün boyunca v5 ile deney yaptıktan sonra Wieland, "inanılmaz derecede gerçekçi" cilt dokuları ve yüz özelliklerini içeren iyileştirmeler kaydetti; daha gerçekçi veya sinematik aydınlatma; daha iyi yansımalar, parlamalar ve gölgeler; bir sahnenin daha anlamlı açıları veya genel bakışları ve "neredeyse mükemmel ve artık sakat olmayan gözler."
Ve tabii ki eller.
Geçen yıl boyunca, AI sanat üreteçlerinin elleri doğru şekilde işleyemeyeceği fikri, kültürel bir mecaz haline geldi. Özellikle, Midjourney v5 oldukça iyi gerçekçi insan eli üretebilir. Wieland, "Eller çoğu zaman doğrudur, bir elde 7-10 yerine 5 parmak vardır" dedi.
Hizmetin Discord sürüm notlarında Midjourney, v5'in artık sürüm 4'ten "çok daha geniş bir stil aralığı" ile yanıt verdiğini, aynı zamanda istemlere karşı daha duyarlı olduğunu, daha az istenmeyen metin ürettiğini ve görüntü çözünürlüğünde 2 kat artış sunduğunu da belirtti.
AI sanat hayranları için Midjourney yükseltmesinin görsel bir dezavantajı varsa, bu belki de o kadar gerçekçi ve "mükemmel" olabilen görüntülerden geliyor ki, modelin hassasiyeti, uygun bir sonuç bulmak için art arda AI görüntüleri oluşturmanın heyecanını ortadan kaldırıyor. "slot makinesi etkisi" denilebilir. Philipp Lenssen adlı bir Twitter kullanıcısı, "Aklınızda belirli bir resim konusu varsa, bu yine de biraz piyango gibidir. Ancak kazanma şansı v4'ten daha yüksek."
Tags:
Bilgi Teknolojisi