Ortalama işlerin girdabı: ChatGPT
Çan, IQ, titizlik
İstesek de istemesek de ChatGPT gibi yapay zekalar — daha doğru adıyla büyük dil modelleri — hayatımızın bir parçası olmaya başladı. Kimimiz onları Vikipedi gibi kullanırken kimimiz de profesyonel süreçlerinin vazgeçilmez birer parçası haline getirdi. İkinci bahsettiğim gruba bir süredir ben de dahilim, zira çalıştığım şirket tarafından daha hızlı ürün araştırıp geliştirebilmek adına kullanmaya teşvik edildim. Kullandığım süre boyunca zaman zaman üretkenliğimin çok düştüğünü, ancak kendimce bir “doğru” kullanım keşfettikten sonra bir hayli arttığını gözlemledim.
Yapay zekanın sınırlarını göz önünde bulundurarak, özellikle bir alanda bilgi edinmek ya da bazı işlerde en yüksek verimle nasıl kullanılabileceği üzerine ayrı bir yazı yazmak istiyorum ancak bu hafta amacım psikolojinin en temel kavramlarından birisi olan, aynı zamanda da hemen her yapay zekanın handikabı olan bir kavramdan kısaca bahsetmek: Çan eğrisi.
Bu çan eğrisini hayatımızın ve psikolojinin hemen hemen her noktasında görebiliriz. Özellikle de elimizde yeterince gözlem varsa. Mesela beş kişinin IQ dağılımına baktığımızda yukarıdaki resim gibi bir dağılım göremeyiz ancak iki yüz bin kişinin IQ’suna baktığımızda çoğunluğun ortalarda bir yerlerde IQ’ya sahip olduğunu, düşük ya da yüksek uçlara doğru gidildikçe bu zeka seviyelerine sahip insanların gitgide azaldığını görürüz. Burada IQ’yu bir üniversite vize sınavından alınan not ile de değiştirebiliriz, insanların titizlik oranlarıyla da, disiplin oranlarıyla da veyahut herhangi bir konu hakkındaki fikirleriyle de.
ChatGPT gibi büyük dil modellerine baktığımızda da onları eğitmek için milyarlarca kelimeleri geçmiş olan yazılar kullanılıyor. Bu metinler aslında sizin ya da benim gibi insanların yazdığı yazılar, ileri sürdüğü söylemler, iki saniyede derleyip paylaştığı sosyal medya gönderileri. Vikipedi’de yazılmış — ve doğruluğundan emin olamadığımız — yazılardan tutun fikirlerine katılıp katılmayacağımızı dahi bilmediğimiz milyonlarca kitaba kadar, ortada ne kadar yazı varsa onları ne yapıp ne edip bir şekilde yapay zeka modellerine entegre ediyorlar.
Bu kadar yazıyla eğitilen büyük dil modellerinin çalışma prensibine bakarsak, en temelinde bu modeller bazı kelime dizilimlerinden sonra hangi kelimenin gelmesinin daha olası olduğunu hesaplayarak o ödevimizi yaparken kullandığımız cümleleri oluşturuyorlar:

Bu süreçte herhangi bir bilgi doğrulaması yok. Hatta ChatGPT’nin ayırt edici bir özelliği, herhangi bir şekilde “doğru” örnek göstermeksizin direkt kendisine verilen metinlerden kendisini eğitebilmesi. Bu, ilk zamanlarda eğitime ne kadar çok yazı harcanırsa bir o kadar iyi sonuç vereceği anlamına geliyordu, öyle de oldu. Lakin son zamanlarda internetteki çoğu yazıyı topladıklarından olsa gerek, bu modellerin performansları eskisi kadar hızlı iyileşmiyor.
Son birkaç senedir bu performans gelişimini artırmak için yeni bir yola başvurdular aslında. Artık sadece yazıyla eğitilmiyor ChatGPT; insanların onun sonuçlarına verdiği geri bildirimlere göre de eğitiliyor. Fakat bu geri bildirimler, bilgilerin doğruluğu ve tutarlılığıyla ilgili değil. Bu geri bildirimler, insanların kendi fikirlerince yapay zekayı ne kadar faydalı ya da kullanılabilir bulduklarıyla ilgili. Misal bir ChatGPT’nin herhangi bir cevabına “iyi yanıt” ya da “kötü yanıt” şeklinde bir geri bildirim yapabiliyoruz. Sonucunda ise bu yapay zekalar, biz onları daha kullanışlı bulalım diye tasarlanıyor, doğru bilgiyi bulalım diye değil.
Aynı IQ ya da titizlik seviyemiz gibi, yazdığımız yazılar ve fikirlerimiz de çan eğrisine dahil olmak zorunda. Belki beş, on ya da on bin kişi için bu eğri görünür değil ancak milyarlarca veriden bahsettiğimizde, o verinin içindeki tarih, psikoloji, bilim, edebiyat vb. metinlerinin de ortalamaya doğru çekildiğini, çan eğrisinin elini öptüğünü görebiliriz.
Tabii ki bütün bu disiplinler içerisinde dünyanın akışını değiştiren fikirler, teknolojiler ve sanat eserleri bir hayli çok. Lakin bunlar dünyadaki tüm fikirlerin, teknolojilerin ve sanat eserlerinin çok küçük bir oranına tekabül ediyor. Yukarıda gösterdiğim “Bu sabah hava...” cümlesi belki Yaşar Kemal’in edebiyatı sarsacak bir betimlemesinin yolunu açacaktı, ancak bunun olma olasılığı düşük olduğu için havanın sadece güneşli olmasıyla yetinmek durumunda kaldık.
Kıssadan hisseye, eğer yapay zekanın çıktılarını bizim için önemli bir iş doğrultusunda mutlak bir kılavuz veyahut bir pusula gibi kullanırsak, kuzeye giden yolun ortalamaya çıkacağından emin olabiliriz. Bizi biz yapan yaşanmışlıklarımızı, hatalarımızı, can sıkıntımızı, huyumuzu, huysuzluğumuzu, yaşımızı ve daha nice özelliklerimizi — yapay zekanın da yardımıyla — dahil edeceğimiz bir iş belki yine “ortalama” olacak ancak bizim ortalamamız olacak [2].
Bu denkleme bir de madalyonun diğer yüzünden bakarsak: Biz bir yapay zekanın gerçekten çok işe yarar, niş ve o alanda çalışan insanların bile söylemeyeceği bir bilgiyi verdiğine mi inanıyoruz, yoksa biz o alanda ortalama ya da ortalama altı kaldığımız için yapay zekanın sonuçlarına hayret mi ediyoruz?
Saygılarımla,
Buğra
Kaynaklar & Dipnotlar
[1] “Bu psikoloji bloğu değil miydi, yapay zeka nereden çıktı?” diye bir soru sorabilirsiniz. Gayet de haklı bir soru olacaktır zira sosyal medya ve televizyon her konuda uzman (!) insanlardan geçilmiyor. Haliyle psikoloji ve teknoloji alanındaki ehliyetlerim hakkında hızlı bir dipnot geçmek isterim: Bilgisayar mühendisliğinden mezun olduktan sonra bir süre özel sektörde olarak çalıştım. Bir “çeyrek yaş krizi” sonrası sıfırdan psikoloji lisansı okumaya karar verdim. Akabinde mühendislerin psikoloji ihtiyacını karşılamak (!) yerine psikolojinin mühendislik ihtiyacını karşılamayı tercih ederek yapay zeka alanına yöneldim. Şu anda ise klinik psikolog ve psikiyatristlere — ve onların danışan ya da hastalarına — yardımcı olabilecek yapay zeka tabanlı yazılımlar üzerine yoğunlaşan bir şirkette çalışıyorum. Haliyle işimin yarısı psikolojiyle alakalı bilimsel literatürü taramakken diğer yarısı bu bilimsel bulguları elle tutulabilir bir yapay zeka yazılımının parçası yapmak. Bunlar beni tabii ki de bir uzman yapmaz — zira kırk fırın ekmeğin ikisini ancak yiyebilmişimdir — fakat yazarken sağlam bilimsel temeli olan çalışmaları kendime kılavuz edinmeye gayret ediyorum. Bir konu hakkında bilimsel makaleleri yine az çok kullandığım ancak daha çok kendi fikrimi beyan ettiğim yazılarımı ise “deneme” etiketi altında bulabilirsiniz.
[2] Bu bakış açısı aslında yapay zekayı ne amaçla kullandığımıza göre de değişir. Bir işin ortalama olmasını umursamak zorunda da değiliz, her iş ortalamadan daha üst bir efor talep etmek zorunda da değil. Buradaki değinmek istediğim nokta, ChatGPT vb. modelleri önemli bulduğumuz işlerde körü körüne takip etmemek, kendi kaçınılmaz yetersizliğimizin maskelenmesinin önüne geçmek.
İlginizi Çekebilecek Diğer Yazılar
Yapsam mı, yapmasam mı? Hangisi doğru karar?
Kitap Okumanın Psikolojisi - III
Pişmanlığın Psikolojisi Üzerine


