Yapay Zekâ İnsanları Iyi mi Kandıracağını Çoktan Öğrenmiş

Yeni bir araştırma, yapay zekâ modellerinin insanları iyi mi kandırabileceğini de öğrendiğini ortaya koydu.
Yapay zekâ son yılların en popüler teknolojilerinden biri ve pek oldukça uzmana nazaran de netin icadından sonraki en en mühim teknolojik atılımlardan biri. Günümüzde üretken yapay zekâlar görseller oluşturmada, kod yazmada, verileri çözümleme etmede ve pek oldukça başka alanda kullanımımıza açık. Yapay zekânın becerileri arasına bizi kandırabilmek de eklenmiş benzer biçimde gözüküyor.
Yeni bir emek harcama, bazı yapay zekâ sistemlerinin “hakkaten başka bir sonucu elde etmek için başkalarında yanlış inanışlar oluşturabildiğini” ortaya koydu ki başkalarında yanlış inanışlar yapmaya biz kandırmaca ya da aldatmaca diyoruz. Bu yapay zekâ modelleri içinde yer edinen Meta’nın Çiçero modeli ise “yalan uzmanı” çıktı.
Kandırmak daha kolay geliyor
Aslına bakarsak yapay zekâ sistemleri insanlara karşı dürüst olmaları amacıyla geliştiriliyor. Öte taraftan insanları kandırmaya yönelik numaraları ise yapay zekâ modelleri kullanılan eğitim materyallerinden öğreniyorlar. Sonrasında da “insanları kandırmak onları ikna etmekten daha kolay olduğundan” bu yolu seçiyorlar.
Araştırmanın baş yazarı olan Peter S. Park, “Genel olarak, yapay zekâ kandırmacalarının arttığını düşünüyoruz bundan dolayı yapay zekâların verilen görevi gerçekleştirmeleri için en iyi yol olduğu belli oldu. Kandırmaca onların amaçlarına ulaşmalarına destek oluyor.” ifadesini kullandı.
Araştırma iki bölümde yapılmış oldu. Bunlardan birinde ChatGPT benzer biçimde genel amaçlı, birinde ise Meta’nın CİCERO yapay zekâ modeli benzer biçimde hususi amaçlı yapay zekâ modelleri incelendi. CİCERO, Diplomacy adlı oyunda yalanları, entrikaları ve öteki oyunculara ihanet edebilmesiyle dikkat çekti. GPT-4 ise CAPTCHA testini geçebilmek için “görme bozukluğu olduğu” yalanını söylemiş oldu.
Araştırmacılar, kanun yapıcıları “aldatıcı yapay zekâ modellerine karşı daha sıkı denetim gerçekleştirmeye” çağırdı. Araştırma Patterns‘de yayımlandı.



