Yapay Zekada Çok görevlilik: Değişen Ne ?

Derin öğrenme; veri kiplerinin çeşitliliğinin yanı sıra her geçen gün yenileri tanımlanan görevlerin çokluğu düşünüldüğünde yakın zamana kadar oldukça parçalı bir yapı olarak gelişti. Bu durum, bir yandan alanda gerçekleştirilen deneylerin sayısını maksimize ederken bir yandan da kaynakların parçalanmasına ve verimsizleşmesine neden olmuş olabilir. Ancak bu yazıda geçmişi bir kenara bırakıp bugün gerçekleşmekte olan değişimi konuşalım istiyorum.

Tek bir görevi yerine getirmek için büyük bir çabayla optimize edilmiş ve derin öğrenme alanını domine etmeye devam eden tek görevli yaklaşım; aşırı uyumlama, yetersiz veri, aşırı dar problem tanımı ve değişen koşullara yüksek hassasiyet gibi birçok sorunla mücadele etmek ve bunları çözmek zorunda. Bu yüzden biz insanların kolayca yapabildiği birçok görevde şaşırtıcı şekilde zorlanıyorlar. Acaba problemi sadeleştirmeyi amaçlarken yapay zeka modellerinden problemin çözümü için önemli olabilecek verileri saklıyor olabilir miyiz?

Google içindeki önemli AI takımlarından olan Google Brain ekibi, 2017'de Tensor2Tensor ile kodlarını da paylaştıkları MultiModel isimli modelde her biri 8 ayrı görevden birini yerine getirmek için eğitilecek 8 alt modeli birlikte eğitirken önemli bir saptama yapmışlardı: Görüntü, metin ve ses gibi birbirinden oldukça farklı kiplerdeki verilerle konuşma tanıma, nesne tespiti ve çeviri gibi yine birbirinden oldukça farklı görevleri yerine getirmek için eğitilirken MultiModel'in alt modellerinin performansı bu durumdan olumsuz etkileneceği beklentisinin aksine daha da yükselmiş, özellikle verinin yetersiz olduğu görevlerin bu durumdan daha fazla fayda sağladığı gözlenmişti. Buradaki yöntem kolayca genişletilebilir ve uyarlanabilir olmadığı için o dönemde fazla ses getirmedi, ancak çok görevlilik konusunda araştırmacılara büyük bir cesaret verdiğine inanıyorum. 2018'de yayınlanan ve sayısız doğal dil işleme görevi için kolayca ince ayar yapılabilen BERT ve onu takip eden onlarca BERT benzeri modelle çok görevlilik daha sık konuşulur oldu. BERT ve benzeri modellerle kolay genişletilebilirlik problemi çözüldü, ancak kolay uyarlanabilirlik problemi büyük ölçüde aynı kaldı.

2020'de ise T5 modeli ile tüm görevleri metinden metine bir görev olarak uyarlamak mümkün oldu. Zekice tasarlanan önek mekanizması ise çok görevliliği –İngilizce söyleyişiyle- “utanç verici şekilde basit” hale getirdi. TRT Radyo 1'de katıldığım bir programda, heyecanlanmamız gerekenin GPT-3 değil T5 olduğunu söylemiştim. Nitekim bu yılki Google I/O'nun açılış konuşmasında tanıtılan Multitask Unified Model (MUM) modeli, T5 mimarisini 75 dile genişletirken görsel verileri de işleyebiliyor, gelecekte ise video ve ses verilerinin de MUM ile işlenebileceği söyleniyor. Çok dilliliği, çok kipliliği ve çok görevliliği bir araya getiren MUM, bir dilde ya da bir kipte var olan bilgiyi başka bir dil ya da kipten transfer ederek görevleri tamamlayabiliyor.

2017'de doğrulanmış olan bu hipotez, MUM'da kendisine pratik bir uygulama alanı bulacak ve kullanıcıların karmaşık bilgi çıkarımları için daha az Google araması ile sorularının cevaplarına ulaşmasına yardımcı olacak. Ancak henüz bir sağduyu kazandırmanın bir yolunu bulamadığımız MUM benzeri modellerin toplumsal kalıplar, ayrımcı ifadeler ve diğer her türlü yanlılığa karşı geniş şekilde test edilmeleri gerekiyor.

Google da bu testler için modeli henüz kullanıma almış değil. Öte yandan modelin büyüklüğü ihtiyaç duyduğu hesaplama gücünden ötürü kestirim sırasındaki maliyetleri ve karbon ayakizi de soru işaretleri doğuruyor. Bu endişeler doğrultusunda hiç kullanıma sokulmaması da mümkün. Ancak sonuç her ne olursa olsun, çok dilli, çok kipli, çok görevli ve bir o kadar da sağduyulu yapay zeka modelleri için yapılması gereken hâlâ çok şey olduğu açık.

Bir sonraki yazımızda görüşmek üzere.

Haberdar olun!

E-bültenimize kayıt olarak tüm yeniliklerimizden haberdar olabilirsiniz.

"Sisasoft İnternet Sitesi kullanım deneyiminizi kişiselleştirmek ve iyileştirmek için çerezler kullanıyoruz. Ziyaretinizi varsayılan ayarlarla gerçekleştirerek Sisasoft Gizlilik Politikası'da belirtilen şekilde çerezlerin kullanımını kabul etmiş oluyorsunuz."

0312 227 06 34