Dilbilimciler, doğal dillerin biyolojik bir mekanizmaya sahip; ama sosyal, kültürel ve tarihsel bir olgu olduğu konusunda aşağı yukarı hemfikirler. İçinde konuşulduğu toplumsal, kültürel bağlam dile yansıyor ve chatbotların asıl zorluğu burada ortaya çıkıyor. Yapay zekâ teknolojisi bu zorluğu aşabilecek mi?
Dil modelleme algoritmaları kullanarak, insanların kendisiyle başlattığı iletişimi, doğal dilleri taklit yoluyla sürdürebiliyor; veri metinlerinden sözcüklerle cümleler arasındaki ilişkileri öğrenip sorulara daha doğru ve makul yanıtlar veriyor; zengin veri tabanı sayesinde insanlarla hemen her konuda doğal bir biçimde sohbet edebiliyor; derin öğrenmeyle aynı sorulara çeşitli yanıtlar üretebiliyor; konuşma dilinin yapısını ve gramerini öğrenip kullanabiliyor; istenen konuda metin yazabilme, metinleri özetleyebilme, çeviri yapabilme gibi dil temelli birçok işlemi gerçekleştirebiliyor; karşılıklı konuşmanın anlamına ve akışına dikkat ederek sohbeti bağlamında sürdürebiliyor; istediğiniz karaktere bürünüp o karakter olarak sizinle konuşuyor; istenen temada şiirler, belirtilen karakterlerle öyküler yazabiliyor…
Yukarıda sıralananlar, OpenAI (Açık Yapay Zekâ) şirketi tarafından geliştirilen, son versiyonu 14 Mart 2023’te kullanıma açılan ChatGPT-4 adlı yapay zekâ chatbotuna (sohbet robotu) ait sosyal medyada saymakla bitirilemeyen becerilerden birkaçı. Doğal dil işleme (NLP) ve yapay öğrenme teknolojileriyle donanmış ChatGPT’nin bu yeni sürümü, insanlarla doğal bir etkileşim kurmak için geliştirilmiş. Yeni chatbot, görev tanımını “İnsanların sorularını yanıtlamak, konuşma partnerlerine önerilerde bulunmak ve bilgi sunmak gibi konularda yardımcı olmak.” biçiminde yapıyor. Bunun için de geniş bir veri kümesiyle eğitilmiş.
Ayrıca doğal dil işleme teknolojileriyle çalıştığı için 40’tan fazla dilde konuşabiliyormuş. Tabi en başarılı olduğu dil, veri kümesinin büyük kısmının dayandığı İngilizceymiş. Bu dili anlama, okuma ve yazma becerilerini geliştirmek için yoğun bir şekilde eğitilmiş. İngilizcenin günlük hayatta kullanılan çeşitli kelimelerini, cümle yapılarını, argo sözlerini ve hatta kültürel ifadelerini bile anlayabiliyormuş. Türkçede de iddialıymış, belli bir oran vermemekle birlikte başarısının yüksek olduğunu söylüyor…

18. yüzyılda buharlı makinenin icadıyla ilk atılımını gerçekleştiren sanayi devrimiyle metanın seri üretimine geçilirken, matbaanın yaygın kullanımıyla kitap ile gazete, ilk enformasyon kaynağı ve iletişim aracı olarak ortay çıktı. 19. yüzyılda kapitalizmin içten patlamalı motor ve elektrik temelli ikinci endüstriyel atılımı, iletişimde sıçramalı bir gelişmeye yol açtı; bilgi ve iletişimde telgraf, telefon, radyo, televizyon üstünlüğü ele geçirdi. Endüstrinin 20. yüzyılın sonlarında jeotermal, rüzgâr ve güneş gibi yeşil enerjilerle yaşadığı dönüşüm, ekonomik yaşamın fabrika merkezli yapısını, yatay örgütlenmeye dönüştürürken temel iletişim biçimi de internet oldu. Günümüzde teknolojinin üstel bir biçimde artarak gelişmesi, interneti son birkaç on yılda 300 milyarı aşkın nesnenin bağlı olduğu bir ağa dönüştürdü.
Bu devasa ağ içinde e postalarla, SMS’lerle, Google gezintileriyle, sosyal platformlarla; metin, görsel, ses paylaşımları… ile oluşan büyük veri (big data) artık zettabaytlarla (1 Zettabayt =1021 Bayt, 1 Bayt= 2 milyar fotoğraf, yani akla zarar bir veri miktarı) ölçülüyor. Bu denli büyüyen veriyi işleyebilecek yapay zekâ da hızla güçleniyor. ChatGPT de o güçlü yapay zekâlardan biri. Doğal dil işleme teknolojileriyle çalışan bu araçların dil becerilerine, biraz daha yakından bakmak kaçınılmaz görünüyor. Zira eğer yazının girişinde aktardığımız bu sohbet robotlarıyla ilgili söylenenler doğruysa, dil felsefesi alanında yazanların ve dilbilimcilerin uzun yıllar üzerinde çalıştıkları doğal dillerin sırları önemli ölçüde çözülmüş demektir!
NLP (doğal dil programlama), doğal dillerdeki sözcüklerin, cümlelerin yapısını anlamaya odaklanan bir teknoloji. İlgili kaynaklardan öğrendiğimize göre bu teknoloji, dilin semantik (anlambilimsel) ve sentaktik (sözdizimsel) yapısını, sözcük dağarcığını ve dilbilgisi kurallarını tanıyabiliyor. Bu sayede kullanıldıkları konuşma robotları, örneğin kullanıcının “Sütlaç nasıl yapılır?” gibi bir sorusunu anlayıp gerekli veri taraması yaparak soruya doğru ve anlaşılır yanıt(lar) oluşturabiliyor; hatta kelime oyunları, nüanslar, metafor, istiare, ironi gibi dilin daha karmaşık anlam katmanlarını bile çözümleyebiliyor.
Ne var ki doğal dil işleme teknolojisi, hâlâ tam olarak insan dilinin karmaşık yapısını tümüyle anlamak için yeterli olmadığından sohbet robotları bazen yanlış anlamalara sapabiliyor ve hatalı yanıtlar oluşturabiliyorlar. Bu nedenle chatbotların doğal sohbetler ve doğru yanıtlar üretebilmesi için daha çok eğitilmeleri gerekiyor. Bilişsel bilimciler bu konuda yakın gelecek için umutlu; öte yandan bu önemli ölçüde bizim işimiz! Biz onları ne kadar çok kullanırsak, yani onların kullanabilecekleri ne kadar çok veri oluşturursak, eğitimlerine o kadar çok katkıda bulunmuş oluyoruz. Üreticilerince ücretsiz denecek kadar ucuz kullanıma açılmalarının nedeni bu. Onlar bizim sayemizde kusursuzlaştıkça biz de onların giderek daha pahalı kullanıcıları olacağız!
Madem bir dil yazısı okuyoruz, chatbotların dil temelli bunca işi nasıl ve ne kadar becerdiklerini anlamamız gerekiyor. NLP teknolojileri bilgisayarların doğal dilleri anlaması ve yorumlaması için kullanılıyor. Yapay zekâ, insan dilinin karmaşık işleyişini anlaşılabilir bir forma dönüştürebilmek için kelime, cümle ve metin gibi dilsel verileri semantik, sentaks ve dilbilgisi kurallarına göre analiz ediyor. Bunun için de öncelikle bir dizi belirsizliği gidermesi gerekiyor. Örneğin “yüz” (sayı, surat, yüzey, yüzmek), “ben” (1. Tekil kişi, tende koyu renkli leke) gibi eş sesliliğin getirdiği sözcüksel belirsizlikler; “Çocuk annesini ağlarken gördü.” gibi ögelerin yerinde kullanılmamasından kaynaklanan sözdizimsel belirsizlikler; “Adresini biliyorum.” gibi ögelerin eksikliğinden doğan anlamsal belirsizlikler; “Saatin var mı?” gibi amaçlanan anlamı dolaylayan pragmatik belirsizlikler ve “uncle” (İngilizce ‘dayı’, ‘amca’) gibi çeviriye ait belirsizlikler…
İnsan insana iletişimin ortamında veya konuşmanın fiziksel katkılarında bir sorun yaratmayan bu türden ifadelerdeki belirsizliklerin giderilmesi için algoritma bazı işlemler yapıyor: Öncelikle bütünlüklü metni paragraflara, paragrafları cümlelere, cümleleri sözcük ve sözcük öbekleri gibi anlam birimlerine bölüyor. Sözcükleri de eklerini ayrılarak kök ve gövde biçiminde sadeleştirmek yapay zekânın işini kolaylaştırıyor. Bundan sonra sıra “bir”, “o”, “the”, “she” gibi “etkisiz” sözcüklerin filtrelenmesinde. Gerisi, bağımlılık ayrıştırmasıyla cümledeki sıfat, belirteç, tamlama gibi yapıları bulmak, tanımak ve bu birimlerle cümleler arasındaki ilişkiyi kurmaktan ibaret. Chatbot, ancak bu bir dizi işlemden sonra girdilerin sözdizimi ve anlam analizini yaparak iletişim metinleri üretebiliyor.
Sözcüklerin anlam ilişkileri dikkate alınarak oluşturulan vektör uzayında, semantik ve sentaktik özelliklerine ve bu özelliklerin benzerliklerine göre sözcükler uzaklık-yakınlık kümelerinde bir araya getiriliyor. Yapay sinir ağı, bu kümelerdeki sözcüklerin kullanılma sıklıkları, anlamsal ilişkileri ve bağlamları konusunda büyük verilerle eğitiliyor. Dil modellemesiyle, metnin sıralı yapısını dikkate alarak belirli bir sözcükten sonra hangisinin geleceğini olasılıksal olarak modelliyor. Örneğin “Bugün hava güzel, dışarı çıkıp ……. ” cümlesinin yüklemini tahmin etmeye çalışıyor. Dil modellemesi, bu tahmini, veri kümesindeki sözcük sıklığı istatistiklerine dayanarak yapıyor ve “yürüyeceğim”, “koşacağım” sözcüklerinden veri kümelerinde hangisi daha sık kullanılmışsa cümleyi onunla tamamlıyor: “Bugün hava güzel, dışarı çıkıp yürüyeceğim.”
Bir yanlışı düzeltmek gerekiyor: Sohbet robotlarının kullandıkları dil “doğal dil” değildir. Zira doğal dil, metin temelli bir dizge değil, insanların birbirleriyle iletişim kurmak için kullandıkları, genellikle “sözlü” olarak ifade edilen sosyal, tarihsel ve kültürel bir iletişim sistemidir. Oysa yazılı ya da sözlü chatbot algoritmaları yazı, yani metin temellidir. Kolayca anlaşılabileceği gibi yazı, konuşma ile karakterize olan doğal dilin canlı, gelişen yapısını dondurup dili yapaylaştırır. Chatbotlar aldıkları sesli veriyi analiz etmek için konuşma tanıma (ASR) aracı kullanırlar. Bu araç, konuşmayı bir mikrofon aracılığıyla alır ve sesi yazıya dönüştürür. Daha sonra NLP, yazılı metni analiz eder ve kullanıcının isteklerini anlamaya çalışır; yanıt metni oluşturur. Sesli yanıt verecekse yazıyı sese dönüştürmek için yazılı metni seslendirme olanağı sağlayan konuşma sentezi (TTS) teknolojisi kullanarak iletişime geçer.
Tabi bu süreçte chatbot algoritmalarının başarısı, dilin yazıyla dondurulmuş semboller sistemi kategorisine indirgenmesiyle mümkün. Konuşmada beden, jest ve mimiklerinin söyleme kattığı anlam zenginliği önemlidir. Yazı bu olanaklardan yoksundur; onun sadece metni vardır, beden ve sesten soyulmuştur. Bu nedenle anlatımda zenginlik ve canlılık değişmecelerle olanaklıdır. Örneğin “Ankara, İsveç’in NATO üyeliğine göz kırptı.” cümlesinde “Ankara” sözüyle yapılan düz değişmece, “göz kırptı” ile yapılan kalıplaşmış değişmece ile “Ege’nin incisini bir günde gezmezsin.” cümlesindeki “Ege’nin incisi” sözüyle yapılan eğretileme dile etki ve canlılık katar. Oysa ChatGPT’ye birkaç düz değişmece ve eğretileme örneği yazıp açıklama istediğimde aldığım yanıt, chatbotun dilin katmanlı anlamlarla ilgili daha fazla eğitime gereksinim duyduğunu gösterdi. Aynı biçimde “Atatürk, Birinci Dünya Savaşı’nda 17 milyon kişi öldü, dedi.” gibi cümlelerdeki mantık hatalarını düzeltmekte, “kadın, gülmek, kınamak” gibi yalın sözcüklerden cümle oluşturmakta, anlatımı bozuk cümleleri düzeltmekte de yetersizdi.
İngilizce metinlerle yaptığımız benzer denemelerdeki başarısı, Türkçedekinden daha iyiydi. Ama chatbotun başarısı, dilin daha karmaşık, rafine ve insanın iç dünyasına dönük biçimi olan şiir söz konusu olunca daha da düşüyordu. Doğal dili anlamadaki başarı eğrisi chatbotu, dili bilişsel işleve indirgeyen, poetik işlevini gereksiz gören Noam Chomsky’e yaklaştırıyor; dili ortaya çıkaranın insanın “konuşma hazzı” dediği şiirsellik olduğuna inanan Humboldt’tan uzaklaştırıyordu. Ama bütün bunlar, dilin biyolojik bir mekanizmaya sahip, sosyal, kültürel ve tarihsel bir olgu olduğunu söyleyen Tomasello’yu doğruluyor. Çünkü içinde konuşulduğu toplumsal, kültürel bağlam dile yansıyor ve chatbotların asıl zorluğu da burada ortaya çıkıyor.
Daha önemlisi; Humboldt’un “sonlu ögelerden sonsuz biçimde yararlanmaya olanak tanıyan” dediği dilin çift eklemliliği, Jürgen Trabant’ın vurguladığı gibi dilsel ve kültürel başarının anahtarıdır; ama biyolog ve nörologlar bunun farkında değildirler (Dil, 2020). Ekleyelim, yapay zekâ yazılımcıları da…