Video: Yann LeCun: "Energy-Based Self-Supervised Learning" (Kasım 2024)
Bu ayın başlarında AI ve Çalışmanın Geleceği konulu bir atölyede, Facebook'ta AI Araştırma Direktörü ve NYU Veri Bilimi Merkezi'nin Kurucu Direktörü Yann LeCun "derin öğrenmenin gücü ve sınırları" hakkında konuştu. AI'daki son gelişmelerin çoğunun merkezinde yer alan evrişimsel sinir ağlarına öncülük eden LeCun, alanın son yıllarda kaydettiği ilerlemede hevesli ve bu tür sistemlerin yapabilecekleri ve yapamadıkları konusunda gerçekçi.
LeCun, birden çok AI dalgası olduğunu söyledi ve mevcut dalga derin öğrenmeye odaklanırken, en önemli örneklerin tıbbi görüntüleme ve kendi kendini süren otomobiller gibi uygulamalarla geldiğinin "algı" olduğunu belirtti. Bu uygulamaların hemen hemen tümü denetimli öğrenme kullanır ve çoğu LeCun'un 1989'da ilk kez tanımladığı ve ilk olarak 1995'te ATM'lerde karakter tanımada dağıtılan evrişimsel sinir ağlarını kullanır. LeCun, bu tür ağların patentinin 2007'de sona erdiğini söyledi.
Son yıllarda en fazla değişikliğe yol açan, büyük örneklem büyüklüğüne sahip büyük veri kümelerinin yanı sıra, bilgisayar gücündeki büyük artışlar (Geoffrey Hinton'un görüntü tanıma için GPU'ların nasıl kullanılacağını bulma konusundaki çalışmalarının yardımı ile). LeCun için bile, görüntü tanıma alanındaki ilerlemeler “şaşırtıcı değil” olmuştur. Algı "gerçekten işe yarıyor" olsa da, hala eksik olan şey mantıklı.
LeCun üç farklı yaklaşımdan ve her birinin sınırlamalarından bahsetti. Güçlendirme öğrenmesi çok sayıda örnek gerektirir. Sistem milyonlarca deneme çalıştırabildiğinden ve daha iyi ve daha iyi hale gelebildiğinden, oyunlar için harikadır, ancak örneğin, 50 milyon kez uçurumdan bir araba kullanmak istemediğiniz için gerçek dünyada kullanmak zordur ve gerçek zamanlı gerçek dünyada bir faktördür.
Şu an gördüklerimizin çoğu olan denetimli öğrenme, orta düzeyde bir geri bildirim gerektiriyor ve iyi çalışıyor. Ancak, denetimli makine öğrenmenin bazı sorunları vardır. LeCun, bu tür sistemlerin verideki önyargıları yansıttığını, ancak bu sorunun üstesinden gelinebileceği konusunda iyimser olduğunu söyledi ve önyargıları makinelerden insanlarla karşılaştırmanın daha kolay olacağını düşünüyor. Ancak bu tür sistemler için güvenilirliği doğrulamak zor ve bu tür sistemlerden çıkan çıktılara dayanarak verilen kararları açıklamak zor ve LeCun bunun bir örneği olarak kredi başvurularından bahsetti.
Halen bir videoda gelecekteki kareleri öngörmek gibi şeyler için araştırılmakta olan denetlenmeyen veya öngörücü öğrenme, çok fazla geri bildirim gerektirir. Denetimsiz öğrenme, LeCun'un söylediklerimizi etkili bir şekilde sağduyum olarak adlandırdığımız boşlukları doldurma yeteneğini, ne olursa olsun mevcut olan bilgiden ya da başka bir deyişle tahmin etmeyi içerir. Bebeklerin bunu yapabildiğini ancak makinelerin bunu yapmasının çok zor olduğunu belirtti ve araştırmacıların belirsiz koşullarda yapılan tahminler için üretken ters ağlar (GAN) gibi teknikler üzerinde nasıl çalıştıklarını anlattı. Tam bir çözüme sahip olmaktan çok uzak olduğumuzu söyledi.
LeCun, üç çeşit öğrenme hakkında bir pastanın parçaları gibi konuştu: takviye öğrenme en üstte kiraz, pudra öğrenmeyi denetlemekte ve prediktif öğrenme pastanın ana kısmıdır.
LeCun, AI'nın işlerin nasıl değerlendirileceğini, daha az maliyetli robotlar tarafından üretilen malların ve otantik insan deneyimlerinin daha pahalıya mal olacağını ve bunun "caz müzisyenleri ve sanatkarlar için parlak bir gelecek" olduğu anlamına gelebileceğini öngördü.
Genel olarak, LeCun AI'nin buhar makinesi, elektrik veya bilgisayar gibi bir Genel Amaçlı Teknoloji (GPT) olduğunu söyledi. Bu nedenle, ekonominin birçok alanını etkileyecektir, ancak verimlilik üzerinde bir etki görmemiz 10 ila 20 yıl alacaktır. LeCun, AI'nın iş yerinin değişmesine yol açacağını söyledi, ancak teknoloji dağıtımının işçilerin bunun için ne kadar hızlı eğitebilecekleri ile sınırlı olduğunu belirtti.
“Gerçek AI devrimi” ile ilgili olarak LeCun, makinelerin sağduyu edininceye kadar gerçekleşmeyeceğini ve bunu inşa etmek için ilkelerin belirlenmesinin iki, beş, yirmi veya daha fazla yıl alabileceğini söyledi; Bunun ötesinde, bu ilkelere dayanan pratik AI teknolojisi geliştirmek yıllar alacaktır. Ne de olsa, evrimsel ağların önem kazanmasının yirmi yıl sürdüğünü belirtti. Ve hepsi prensiplerin basit olduğu varsayımına dayanıyor; “istihbarat bir çamursa” ise daha karmaşık bir hal alır.