Mühendisbilir'i Instagramdan takip ediyor musunuz?

Facebook, SEER İle Yapay Zeka Bilgisayar Görüşünü Geliştiriyor

Yapay zekanın birçok sürümünün görüntü tanıma için önceden belirlenmiş veri setlerine güvendiği bir zamanda, Facebook, görüntüleri derlenmiş ve etiketli veri kümelerinden bağımsız olarak İnternette kaydedebilen derin bir öğrenme çözümü olan SEER (Kendi Kendini Denetleyen) geliştirdi.

Makine çevirisi , doğal dil müdahalesi ve soru yanıtlama dahil olmak üzere doğal dil işlemede (NLP) halihazırda devam etmekte olan büyük ilerlemelerle SEER, herhangi bir çevrimiçi görüntüden öğrenebilen yenilikçi, milyar parametreli, kendi kendini denetleyen bir bilgisayar görüşü modeli kullanır.

Şimdiye kadar, Facebook AI ekibi SEER’i bir milyar işlenmemiş ve etiketlenmemiş herkese açık Instagram görüntüsü üzerinde test etti. Yeni program, düşük atış, nesne algılama, görüntü algılama ve bölümleme gibi aşağı akış görevlerinde en gelişmiş kendi kendini denetleyen sistemlerin yanı sıra kendi kendini denetleyen modellerden daha iyi performans gösterdi. Aslında, ImageNet veri setinin yalnızca yüzde 10’una maruz kalma, SEER tarafından hala yüzde 77,9’luk bir tanıma oranıyla sonuçlandı. Ek olarak, SEER, aynı veri setinin yalnızca yüzde 1’i üzerinde eğitildiğinde yüzde 60,5 doğruluk oranı elde etti.

Artık Facebook, SEER’in İnternet görüntülerini uygulamalı bir ortamda tanıma yeteneğine tanık olduğu için, AI ekibi geliştiricileri ve makine öğrenimi alanındaki diğer ilgili tarafları SEER’in yetenekleriyle ilgili iyileştirme ve bilgi için fikir paylaşmaya teşvik ediyor. Şirket, bu tartışmayı SEER’i geliştirmek için kullanılan açık kaynak kitaplığı VISSL aracılığıyla açtı.

Doğal olarak, dil için makine öğrenimi ile görsel tanıma arasındaki fark, dilbilimin bir kelime ile karşılık gelen tanımı arasındaki anlamsal bağlantıyı tanıması için bir program gerektirmesi bakımından farklılık gösterir. Öte yandan bilgisayar görüşü, tamamlanmış bir görüntüyü tek tek piksellerin nasıl oluşturacağını tanımlamalıdır. Başarılı görüntü teknolojisi, iki yöntem kullanarak bu tür bir zorluğun üstesinden gelir: 1) ek açıklamalar veya meta veriler olmadan çok sayıda rastgele çevrimiçi görüntü kullanarak eğiten bir algoritma ve 2) söz konusu veri kümesindeki her görsel bileşeni yakalayıp öğrenecek kadar büyük bir ağ .

Facebook AI, bu kadar büyük miktarda grafik için bilgi işlem kapasitesiyle ilgili zorlukları azaltmak için SwAV algoritmasını geliştirdi. Bu algoritma, daha sonra karşılaşılan benzer görsel verileri tanımlamak için görüntüleri benzer görsel kavramlarla hızlı bir şekilde gruplamak için çevrimiçi kümelemeyi kullanır. Şimdiye kadar SwAV, SEER’in 6 kat daha az eğitim süresi ile performans göstermesine yardımcı oldu.

Bilgisayarla görmeyi ve makine öğrenimini iyileştirmek için SEER ve VISSL’nin kullanımına ek olarak Facebook, grafiksel programlama birimi başına bellek gereksinimini azaltan ve böylece herhangi bir modelin eğitim hızını artıran birkaç mevcut algoritmayı uygulamaya koydu. Bu algoritmalar arasında NVIDIA Apex kitaplığından karma hassasiyet, PyTorch’tan gradyan kontrolü, FairScale kitaplığından parçalanmış iyileştirici ve çevrimiçi kendi kendini denetleyen eğitim için özel optimizasyonlar bulunur.

Alıntıdır bknz: Techxplore