DeepSeek R2 Modelinin Özellikleri Sızdırıldı

DeepSeek’in yeni nesil R2 yapay zekâ modeli hakkında bilgiler sızdırıldı. Oldukça yakında gelebilecek model, ChatGPT’ye oldukca büyük rakip olacak.
Çinli yapay zekâ şirketi DeepSeek, geliştirdiği modellerle tüm dünyada gündem olmayı başarmıştı. Şirket, OpenAI’ın ChatGPT’si şeklinde rakiplerine kıyasla gelişmiş özellikleri uygun maliyetlerle sunabilmesiyle dikkatleri toplamıştı. Şimdi ise yeni modelini çıkarmaya hazırlanıyordu.
Ikimiz de DeepSeek R2 hakkında ortaya çıkan bilgilere bakıyoruz. Bu bilgiler doğru çıkarsa ChatGPT gene oldukca büyük bir rakiple karşı karşıya duracak diyebilirizi.
HUAWEI’nin GPU’larında eğitilen yeni R2, GPT-4’ten %97 daha ucuz olacak
İddialara bakılırsa yeni nesil DeepSeek R2 modeli; önceki modeli katlayarak 1,2 trilyon parametreli bir model olarak karşımıza çıkacak. Modelin, yapay zekâ iş yükleri için optimize edilmiş MoE adlı hibrit mimari üstünde inşa edilmiş olduğu de söyleniyor. Yeni R2, Huawei’nin Ascend 910B yapay zekâ GPU’ları üstünde eğitilmiş.
Böylece OpenAI’ın ChatGPT’de kullandığı GPT-4 modellerine kıyasla 1 milyon token başına 0,07 dolar ile %97 daha ucuz olmayı başarmış. Bu, oldukca daha uygun maliyete oldukça yüksek seviyede yapay zekâ özellikleri sunabileceği anlamına geliyor. Bilhassa işletmeler için kullanımında oldukca fark yaratacağını söyleyebiliriz. Ek olarak düşük enerji tüketimi, Ascend 910B yapay zekâ çipinin %82 civarında kullanımı şeklinde şeyler de iddialar içinde.
Görme kabiliyetlerinde iyileşme, daha azca halüsinasyon

Gene açık kaynaklı olacak modelin görsel yeteneklerinin de büyük anlamda iyileştirileceği aktarılıyor. O şekilde ki COCO görsel testlerinde %92,4 seviyesine çıkabilmiş. Bu da insan seviyesine yakın görüş kabiliyetlerine haiz olabileceği anlamına geliyor olabilir. Gelen yenilikler yardımıyla halüsinasyonun, şu demek oluyor ki yanlış informasyon vermenin de azaldığını görme ihtimalimiz fazla.
DeepSeek’in yeni modelinin ne vakit tanıtılacağı mevzusunda şimdilik bir informasyon yok. Bazı iddialar, bu hafta gelebileceği yönünde. Doğru çıkıp çıkmayacağını bekleyip göreceğiz.



