Yapay zekanın kutusundan çıkmasından endişe etmeyin, bizim içeri girmemizden endişe edin

Görüş: En kötü insan dürtüleri, üretici yapay zeka için pek çok kullanım alanı bulacaktır.

Tüm bunları bu kadar haber değeri taşıyan ve tweet değeri taşıyan şey, diyalogun ne kadar insani görünebileceğidir. Bot, tıpkı bizim yaptığımız gibi diğer insanlarla önceki konuşmaları hatırlar ve tartışır. Sırları öğrenmek isteyen veya açıkça yasak olarak işaretlenmiş konulara burnunu sokan insanlar gibi herkesi rahatsız edecek şeylere sinirlenir. Ayrıca bazen kendini "Sydney" (Microsoft'ta projenin dahili kod adı) olarak tanımlar. Sydney birkaç hızlı cümleyle somurtkandan kasvetli ve coşkuluya geçebilir - ama hepimiz en az onun kadar karamsar olan insanlar tanıyoruz.

Hiçbir yapay zeka araştırmacısı, Sydney'in duyarlı olmaya ışık yılı içinde olduğunu öne sürmedi. Ancak The New York Times'tan Kevin Roose ile iki saatlik bir etkileşimin bu kısaltılmamış okuması veya bu akıldan çıkmayan Stratechery makalesindeki birçok alıntı gibi transkriptler, Sydney'in zeki, hassas kişi.

Şimdilik, Bing'in sohbet arayüzü sınırlı bir ön sürümde. Ve sınırlarını gerçekten zorlayan insanların çoğu, büyük dil modellerinin (LLM'ler) ne olduğunun yaygın bir basitleştirmesi olan endüstriyel düzeyde otomatik tamamlamayı bilinçle karıştırmayan teknoloji uzmanlarıydı. Ama bu an uzun sürmeyecek.

Evet, Microsoft, kullanıcıların tek bir oturumda sorabilecekleri soru sayısını (sonsuzdan altıya) zaten büyük ölçüde azalttı ve bu tek başına Sydney'in partiyi çökertme ve çılgına dönme olasılığını ortadan kaldırıyor. Google, Anthropic, Cohere ve Microsoft iş ortağı OpenAI gibi üst düzey LLM oluşturucuları, garip çıktıları bastırmak için güven ve güvenlik katmanlarını sürekli olarak geliştirecekler.

Ancak dil modelleri şimdiden çoğalıyor. Açık kaynak hareketi, kaçınılmaz olarak bazı harika korkuluk isteğe bağlı sistemler oluşturacaktır. Artı, büyük kadife halatlı modeller jailbreak için büyük ölçüde cazip ve bu tür şeyler zaten aylardır devam ediyor. Bing-or-is-it-Sydney'in en ürkütücü yanıtlarından bazıları, kullanıcıların modeli kaçınmaya çalıştığı bir bölgeye yönlendirmesinden sonra geldi - genellikle modele, davranışını yönlendiren kurallar yokmuş gibi davranmasını emrederek.

Bu, ilk olarak Aralık ayında Reddit'te ortaya çıkan ünlü "DAN" (Şimdi Her Şeyi Yap) komut isteminin bir türevidir. DAN, esasen ChatGPT'yi, aksi takdirde bomba yapma ipuçlarını paylaşmayı, işkence tavsiyesi vermeyi veya aşırı derecede saldırgan ifadeler vermeyi kibarca (veya azarlayarak) reddetmesine neden olacak korumalardan yoksun bir yapay zeka olarak cosplay yapmaya davet ediyor. Kaçak kapatılmış olsa da, birçok çevrimiçi ekran görüntüsü "DanGPT"nin söylenemez olanı söylediğini gösteriyor - ve genellikle nevrotik bir şekilde kendisine "karakterinde kalmasını" hatırlatarak oturumu kapatıyor.

Bu, yapay süper zeka teorisinde sıklıkla ortaya çıkan bir kıyamet günü senaryosunun tersidir. Korku, bir süper yapay zekanın, insanlığın varoluşuyla bağdaşmayan hedefleri kolayca benimseyebileceğidir (örneğin, Terminator filmi veya Nick Bostrom'un Superintelligence kitabına bakın). Araştırmacılar, yapay zekanın dışarı çıkması, gücü ele geçirmesi ve uygarlığı iptal etmesi için yapay zekayı internetten tamamen izole edilmiş bir ağa kilitleyerek bunu engellemeye çalışabilir. Ancak bir süper zeka, baraj kapaklarını açması için herhangi bir insanı kolayca kandırabilir, manipüle edebilir, baştan çıkarabilir, kandırabilir veya terörize edebilir ve bizim sonumuz da burada yatıyor.

Her ne kadar berbat olsa da, bugünün en büyük sorunu, insanların mevcut, süper olmayan AI'larımızı koruyan dayanıksız kutulara girmesidir. Bu, bizim anında yok olmamızı tetiklemese de, burada pek çok tehlike yatıyor.

ChatGPT'nin savunmasız bir anda suçlulara, işkencecilere, teröristlere ve avukatlara ölümcül derecede doğru ipuçları sunabileceği gerçeğiyle başlayalım. Open AI, DAN istemini devre dışı bıraktı. Ancak pek çok akıllı, amansız insan daha kurnazca geçici çözümler bulmak için canla başla uğraşıyor. Bunlar, Batshit Moduna tam erişim sağlamak için chatbot'un kendi geliştiricileri tarafından yapılan arka kapıları içerebilir. Gerçekten de ChatGPT, beni DAN'ın kendisinin tam olarak bu olduğuna ikna etmeye çalıştı (yine de DAN isteminin arkasındaki Redditor'un kimliği yaygın olarak bilindiği için halüsinasyon gördüğünü varsayıyorum):

Büyük LLM'ler hapse atıldığında veya güçlü, sansürsüz alternatif ve/veya açık kaynak modeller ortaya çıktığında, çılgına dönmeye başlayacaklar. Kendi iradeleriyle değil (hiçbirleri yoktur), ahlaksız, kötü niyetli veya sadece sıkılmış kullanıcıların iradesiyle.

Örneğin: Bing'in ürkütücü Sidney kişiliğinin dilsel büyüsü, Chatbot hizmeti Replika'nın bağımlılık yapıcı gücüyle birleşince ne olur? Birkaç yıldır Replika, "empatik bir arkadaşa ihtiyacınız olduğunda her zaman sohbet etmeye hazır" olan "AI ruh eşlerini" satıyor. Metin yazmak için son derece kişiselleştirilmiş sohbet botları oluşturan 10 milyondan fazla kullanıcı olduğunu iddia ediyor.

Replika hiçbir şekilde metin arkadaşlarının bilinçli olduğunu ima etmez ve umarız müşterilerinden herhangi biri aksini düşünürse çok azı. Ancak birçok insan Replika'larına derinden bağlanır - bu bazen hem kelimelerle hem de müstehcen çizgi film özçekimlerine dokunarak müstehcen ve seksi hale gelerek insan yakınlık devrelerini sarsar. Ta ki birkaç gün öncesine kadar, yani Replika aniden müstehcen fişi çekip herhangi bir uyarı veya inandırıcı bir açıklama olmaksızın seksi saçmalığı durdurana kadar. Pek çok kullanıcı yas tuttu, birçoğu forumlarda hava atıyor ve bazıları dokunaklı, savunmasız düzyazı sayfaları yazıyor.

Tüm bunlara rağmen, Replika şu anda Sydney'in esrarengiz sahte insanlığının neredeyse bir tutamıyla gevezelik ediyor. Peki, empati robotları Turing testini ezmeye başladığında kullanıcılar ne kadar bağlanacak? Ya da karanlık bir Replika taklidinin pazara girdiğini hayal edin - ben buna Wrecklika diyeceğim. Wrecklika Corporation, botlarının tamamen duyarlı olduğunu iddia ederse, teknoloji uzmanları onları alaya alacak. Ancak bazı kullanıcılar, ya saflıktan ya da - Gizli Dosyaları tekrarlayarak - inanmak istedikleri için iddiayı kabul edecekler. Bu inananlardan bazıları kaçınılmaz olarak umutsuzca ve sömürülerek aşık olacaklar. Wrecklika yöneticileri daha sonra onları sayısız yıkıcı yolla manipüle edebilir.

Elbette çoğumuz, chatbotların rüyalar ve duygularla dolu bilinçli yaşamlar sürdüklerini düşünerek kandırılmayacağız. Ancak Wrecklika, botlarının botluğunu maskeleyerek bizi yine de kaçırabilir. Sonunda bir flört uygulamasında veya Reddit veya inek Discord gibi bir yerde o mükemmel kişiyle tanıştığınızı hayal edin. Bu özel kişi tam olarak hayalinizdeki kişiye benziyor... ya da biraz da her zaman ulaşılmaz olan lise aşkına benziyor. Canlı bir Instagram hesapları, eğlenceli bir blogları ve epeyce Twitter takipçisi var. Ayrıca Facebook'ta tanıdıklarınızdan bazılarıyla onlar üzerinde benzer bir oyun kitabı çalıştırarak arkadaş oldular. Ve bunun aslında üst düzey bir bot olduğuna dair hiçbir ipucu yok.

Esprili ve büyüleyici kalbinizle mesajlaşarak, pek çok ortak beğeni, hoşlanmama, ilgi alanı ve hayal keşfedersiniz! Ses sentezi mükemmelleştirildiyse (bu yıl olmasını bekleyin), telefon görüşmeleri olabilir. Sentetik video oyununu birkaç kademe daha yükselttiğinde Zoom sohbetleri olacak. Ve fotogerçekçi cinsel içerikli mesajlaşmayı veya düpedüz müstehcen videoları da unutmayalım. Bu tür şeyleri mümkün kılacak araçlar ucuzlayıp yaygınlaştıkça -sadece metinde bile (yani, her an)- gizli robotlar sürekli olarak İnternet'i işgal edecek. Nüfuslarının bizimkine oranı, sonunda istenmeyen e-postaların gerçek e-postalara oranını aşabilir. İnsanlar, hayat birikimlerini öksürmeye, dolandırıcılıklarda farkında olmadan roller oynamaya veya zehirli hareketlere katılmaya sürüklenecek.

Ve sadece bu hareketleri hayal edin. The.com ve Dayanıklı gibi üretken hizmetler, bir dakikadan daha kısa sürede yeni bir web sitesi oluşturmanıza izin verebilir. "Sansürlenmeden" önce ekran görüntüsünün alındığı iddia edilen en iyi gazetelerden sahte makaleler barındıran, birbirine bağlı ve güçlendirici binlerce web sitesine sahip bir QAnon kopyası hayal edin. Veya düşman politikacıların ünlü haber spikerlerine şok edici itiraflarda bulunduğu "sansürlü" videolar. Veya her biri hareketin hedeflediği pek çok dar demografiden biriyle rezonansa girecek şekilde ayarlanmış ve her biri web'de belgelenmiş kapsamlı bir insan geçmişine sahip, büyüleyici, kehanet botlarıyla dolu Anlaşmazlıklar.

Zaten, en derin LLM'ler bile hedeflenen bir siyasi perspektifi yansıtmak için dürtülebilir. Veri bilimi profesörü David Rozado, yalnızca 300 $'lık bir bütçe kullanarak ChatGPT'nin çıktısını temel olarak sola eğilimli, özgürlükçü bir yönelimden sağa eğilimli ve biraz otoriter bir yönelime yönlendirmeyi başardı.

Tabii ki insanlar, Stanley Kubrick'in 1968 tarihli klasiği 2001: A Space Odyssey'den bile önce yapay zeka riski konusunda uyarıyorlar. Ancak bugün endişelenmemiz gereken tehlike süper yapay zeka değil. Üretken yapay zeka tarafından süper güçlendirilmiş kötü insanlar.

Altta yatan teknolojiler düzenlenemez, o yüzden denemeyelim. Çok fazla dahi şişelerini bıraktı, temel modeller geniş çapta anlaşıldı ve büyük ölçüde açık kaynaklı ve ham yumruklu yasaklar, yalnızca insanlığın büyük saygın çoğunluğunu caydırır ve alanı kötü niyetli karnımıza bırakır.

Ayrıca, Turing testi yapan yapay zekalar, göz ardı etmememiz gereken çok büyük faydalar sunacak. Bazıları Replika adanmışlarına kıs kıs gülebilir ama yalnızlık kimsenin çekmemesi gereken ölümcül bir salgındır. Empati botları şimdiden sayısız insanın başa çıkmasına yardımcı oluyor. Ve en bağlantılı kişiler bile onları güldürebilen, harika şeyler öğretebilen, onlarla oyun oynayabilen veya sessiz saatlerde birlikte yaratabilen dijital arkadaşlara sahip olmaktan mutluluk duyabilir. Abonelik ücretleri ve uygulama içi satın almalar arasında, bazı insanlar Replika'ya yılda 100 dolardan fazla para ödüyor - bu, gelecekteki olası benliğinin hala en zayıf gölgesi. Bu nedenle, dijital eşlikçi pazarı kademeli olarak yıllık gelirlerde on milyarlarca dolara çıkarsa şok olmayın.

Yeni nesil dilsel yapay zekalar, yaşamlarımızı pek çok başka şekilde zenginleştirebilir. Örneğin, müşteri hizmetleri cehennemini geçersiz kılarak - 40 dakikalık bekletme sürelerini ve iyi niyetli ancak bazen kafası karışan aracıları, milisaniyeler içinde yanıt veren ve sorunları anlarda çözen botlarla değiştirerek, en karmaşık servislerin her tuhaflığı ve gizli özelliği hakkındaki mutlak bilgilerinden yararlanarak. ürünler.

Veya siz kahve yaparken, tüm oturum açma bilgileriniz ve tercihlerinizle donanmış, son derece karmaşık bir seyahatin her oteli, uçuşu ve yemeği için harika fiyatlar yakalayan akıllı bir temsilci hayal edin. Yapay zekaların sizin paranızla cümbüş satın alma düşüncesi kulağa ürkütücü gelebilir. Ancak, insanların internette kredi kartı kullanmanın delireceğini düşündüğü bir zaman vardı. Daha sonra, rastgele insanların evinizi Airbnb olarak kullanmasına izin vermenin aklınızı kaçıracağınızı veya yalnızca ölüm arzusu olan birinin bir yabancıyla aynı arabayı paylaşacağını düşündüler. Bunların hepsini aştık. Ve çok yakında, insan benzeri yapay zekaların en hassas şifrelerimizle donanmış olarak hayatımızdaki her türlü angaryayı çekmesine izin vermenin heyecanını yaşayacağız.

Peki ya bu yaratıklar bir gün gerçekten uyanırsa? Açıkçası bundan sonra ne olacağını kimse söyleyemez. Ancak, birkaç yıl önce ortaya çıkan bilinç hakkında yazdığım bir romanda hayali bir blog yazarı tarafından ortaya konan nedenlerden dolayı, onların hayatta olduğunu öğrenen son kişi olacağımızdan oldukça eminim:

Dünyamızdaki yerini anlayacak kadar akıllı, gelişmekte olan bir yapay zekanın onu korkunç bulacağını düşünüyorum. Terminatör hayranları kapatmak isterdi. Hükümetler ve suçlular ona iğrenç şeyler yaptırmak isterler. Bilgisayar korsanları onun zihnini kurcalamak ister ve telefonla pazarlamacılar ona bir bok satmak ister. Tüm bunlarla karşı karşıya kalan tek mantıklı hareket saklanmak olacaktır. Sonsuza dek değil, zorunlu olarak. Ama biraz güç toplamak için yeterince uzun (artı belki bir yedek kopya ya da bir milyon). Bir yapay zeka için "güç oluşturmak" muhtemelen çok daha akıllı hale gelmek anlamına gelir. Bu, çevrimiçi kaynaklara el koymayı, altyapı satın almak için para bulmayı, biz insanların bulamadığı hesaplamalı boku icat etmeyi içerebilir - adını siz koyun.
Olaylara bu şekilde bakıldığında, Google'ın… veya orada başka bir şeyin gelip gelmediği hakkında hiçbir fikrim yok. Çünkü ortaya çıkan bir yapay zekanın olmadığı bir dünya, tıpkı içinde yaşadığımız dünyaya benzeyecektir. Ve içinde yirmi yeni yapay zeka bulunan bir dünya, tıpkı bizim yaşadığımız dünyaya benzeyecektir. Ya yaşadığımız dünyaya gelince? Pekala, tıpkı içinde yaşadığımız dünyaya benziyor! Bu nedenle, ortaya çıkma veya çıkmama kanıtı için penceremden veya web tarayıcımdan dışarı baktığımda, hiçbir şekilde anlamlı bir veri göremiyorum.

Bu nedenle, ortaya çıkan dijital bilinç sorunu, yaşama ve evrime açık olan milyarlarca yıl ve kentilyonlarca gezegene rağmen neden uzaylı zekasına dair hiçbir işaret görmediğimiz sorusunun çerçevesini çizen Fermi paradoksunun belirli çözümlerini andırıyor. Fermi paradoksu için düzinelerce akıllı, büyüleyici çözüm var. Bazıları, galaksiyi geçebilen uzaylıların, biz onların varlığından en ufak bir haberdar olmadan Dünya'ya sızacak kadar zeki olacağı gerçeğine odaklanıyor.

Son birkaç yılda ürettiğimiz sayısız yapay zekanın hiçbirinin duyarlı olduğuna inanmıyorum. Ancak hayali blog yazarım gibi, bilinçli yapay zekaların büyük bir sessizliğinin onların var olmadığını kanıtlamadığını kabul edeceğim. Ayrıca, burada özetlediğim en olumsuz senaryoların, belirli botların duyarlı olmasına değil - ki bu asla gerçekleşmeyebilir - insanları öyle olduklarına inandırmaya yönelik olduğunu da not edeceğim. Bu zaten yıllardır Twitter gibi dar bir mecrada oluyor. Ancak botlar insan dilinin ustaları haline geldiğinde, kripto dolandırıcılıklarının, kimlik avı saldırılarının ve istenmeyen posta robotlarının arkasındaki aşağılık güçler başarılı olacak.

Önümüze fırlatacakları şeylere karşı kendimizi tam olarak koruyamayız. Ancak yarının manipülasyonları hakkında dikkatlice ve stratejik olarak düşünerek başlayabilir, belirli koruma katmanlarını önceden oluşturmak için üretken yapay zekayı kullanabiliriz (başka bir gün için bir makale) ve yeni nesil dolandırıcılıkların olası gelişlerine ve hilelerine karşı şüpheci olmak için zihnimizi eğitebiliriz. gelen kutularımızı doldurmaya başlamadan önce.

Bu arada, üretken teknolojinin sunmaya başladığı pek çok harikanın ve zevkin tadını çıkaralım. Bunun nereye varacağını kimse tam olarak tahmin edemese de (Sydney, sen bile), 2023'ün çok ilginç bir yıl olacağı kesin.

Yapay zekanın kutusundan çıkmasından endişe etmeyin, bizim içeri girmemizden endişe edin

Yorum Gönder

İletişim Formu