Maglup
Co-Admin
Meta Fuar ekibi, AI alanından farklı arama sonuçları ve ilerleme yayınlar. Bilim adamları, ilerleme ve keşfin ön planda olduğu AI çevresinde açık bir ekosistem oluşturmak için basit bir erişim sağlamak istiyorlar. Özellikle, Meta algısının bir kodlayıcısının yanı sıra işbirlikçi bir okuyucunun ve 3D nesnelerin tanınmasıdır.
Algılama kodlayıcı, büyük ölçekli görüntülerin işlenmesi için bir çittir. Meta, bir AI sisteminin “gözleri” bir blog yazısında açıklar. Kodlayıcı ile görsel bilgiler geliştirebilir. Yeni algı kodlaması özellikle görüntüleri ve videoları sınıflandırmada iyidir. Buna ek olarak, örneğin kendini denizin dibine gömen bir stiletto kırmızısının tanınmasını içeren zor görevler yapabilir. Beceriler ayrıca aşağı akış dilsel sürecine aktarılabilir. Bu, kodlayıcının kullanıldığı, yapay bir zeka sisteminin bir görüntü hakkındaki soruları da cevaplayabileceği anlamına gelir. Meta, modeli, kodu, veri setini ve algılama kodlayıcısı için bir belgeyi yayınladı.
İşbirlikçi akılcı, insanların topluluktaki bir şey üzerinde çalıştıklarında daha iyi sonuçlar ürettikleri fikrine dayanmaktadır. Zorluk, sosyal becerilere ihtiyaç duyulmasıdır. Çerçeve şimdi bir vokal modelinin bu işbirlikçi becerilerini geliştirmeye yardımcı olmalıdır. İki ajan gerektiren bir dizi görev içerir. Bununla birlikte, bu açıkça iyi çalışmadığından, bir LLM ajanının kendisiyle çalışması beklenir, yani her iki rolü de alır. Kod GitHub'da mevcuttur.
(Resim: meta)
Görsel modeller için yeni veri seti
Meta ayrıca bir algı dili (PLM) yayınladı. Görsel dil ve görsel tanıma faaliyetleri için bir modeldir. PLM, sentetik verilerle veya yapay zeka tarafından üretilenler ve açık veri kümeleriyle eğitildi. Metas Fuarı ekibi daha sonra görüntüyü anlamak için hangi verilerin eksik olduğunu belirledi. Bu boşluklar, insanlar tarafından etiketlenen 2,5 milyon yeni video ile kapatıldı. Videoları kimin adını veren insanları bilmiyoruz. Meta, türünün en büyük veri kaydı yaratıldığını yazıyor.
Belge, modelin damıtılmasının kullanılmadığını vurgulamaktadır. Bu, büyük öğretmen modelinin eğitildiği verilerin kaydının bilinmeyeceği anlamına gelir. Ancak, tüm veri paketini serbestçe kullanılabilir hale getirmek için hedef. PLM, 1, 3 ve 8 milyar parametreleri olan varyantlarda mevcuttur, bu nedenle “tamamen şeffaf akademik araştırma” için uygundur. Yayın ayrıca Meta'nın sunduğu yeni bir referans noktasıyla el ele gidiyor: PLM Video.
Robot etkileşimi için 3D nesnelerin tanınması
Meta Locat 3D, dilden türetilen nesneleri tanımlayabilen bir modeldir. Örneğin, Meta bir robotu masanın kırmızı bir fincanını alıp alamayacağınızı sorabileceğinizi yazıyor. Robot veya arkasındaki model, kırmızı bir bardak ve masanın ne olduğunu anlamalı ve daha sonra bardağı kapmak ve getirmek için bir dizi adımda çalışmalıdır. “Yapay zeka sistemlerinin fiziksel dünyada bizi etkili bir şekilde destekleyebilmesi için, doğal dile dayalı dünyayı 3D anlamaya sahip olmak gerekir.”
(Resim: meta)
Nesneleri tanımak için, model sensörleri kullanarak noktalardan bir yapı oluşturur. Bu, diğer şeylerin yanı sıra Meta I-Jepa'ya dayanmaktadır; Nesneleri tanımak için soyut bir şekilde öğrenmesi gereken bir model. Doğru nesneyi bulmak için, bağlam bilgileri eklenir, örneğin “televizyonun yakınında vazo”, böylece robot “pencere penceresinden” çıkmasına izin vermez. Burada da GitHub'da metatik kağıt, veri ve genel modeli.
Meta, örneğin Boston Dynamics Spot ile doğrudan insanlar ve robotlar arasındaki etkileşimleri yönetir. Meta Fair ofisinde, biri zaten etrafta ve örneğin, sevimli oyuncakları bir yerden diğerine taşıyor. Robot köpeği hala bir soru arayışına bağlı. İlişkili çerçeveye Partnr denir.
Temel olarak, hedef bilim ile oldukça ilişkilidir. Çalışma genellikle kaynaklara sunulur, bu nedenle alan ve lisanslar farklıdır. Meta Fair'in amacı, günlük aktivitelerde insanlara yardımcı olabilecek Gelişmiş Makine İstihbarat Zekası (AMI) elde etmektir.
(EMW)
Algılama kodlayıcı, büyük ölçekli görüntülerin işlenmesi için bir çittir. Meta, bir AI sisteminin “gözleri” bir blog yazısında açıklar. Kodlayıcı ile görsel bilgiler geliştirebilir. Yeni algı kodlaması özellikle görüntüleri ve videoları sınıflandırmada iyidir. Buna ek olarak, örneğin kendini denizin dibine gömen bir stiletto kırmızısının tanınmasını içeren zor görevler yapabilir. Beceriler ayrıca aşağı akış dilsel sürecine aktarılabilir. Bu, kodlayıcının kullanıldığı, yapay bir zeka sisteminin bir görüntü hakkındaki soruları da cevaplayabileceği anlamına gelir. Meta, modeli, kodu, veri setini ve algılama kodlayıcısı için bir belgeyi yayınladı.
İşbirlikçi akılcı, insanların topluluktaki bir şey üzerinde çalıştıklarında daha iyi sonuçlar ürettikleri fikrine dayanmaktadır. Zorluk, sosyal becerilere ihtiyaç duyulmasıdır. Çerçeve şimdi bir vokal modelinin bu işbirlikçi becerilerini geliştirmeye yardımcı olmalıdır. İki ajan gerektiren bir dizi görev içerir. Bununla birlikte, bu açıkça iyi çalışmadığından, bir LLM ajanının kendisiyle çalışması beklenir, yani her iki rolü de alır. Kod GitHub'da mevcuttur.

(Resim: meta)
Görsel modeller için yeni veri seti
Meta ayrıca bir algı dili (PLM) yayınladı. Görsel dil ve görsel tanıma faaliyetleri için bir modeldir. PLM, sentetik verilerle veya yapay zeka tarafından üretilenler ve açık veri kümeleriyle eğitildi. Metas Fuarı ekibi daha sonra görüntüyü anlamak için hangi verilerin eksik olduğunu belirledi. Bu boşluklar, insanlar tarafından etiketlenen 2,5 milyon yeni video ile kapatıldı. Videoları kimin adını veren insanları bilmiyoruz. Meta, türünün en büyük veri kaydı yaratıldığını yazıyor.
Belge, modelin damıtılmasının kullanılmadığını vurgulamaktadır. Bu, büyük öğretmen modelinin eğitildiği verilerin kaydının bilinmeyeceği anlamına gelir. Ancak, tüm veri paketini serbestçe kullanılabilir hale getirmek için hedef. PLM, 1, 3 ve 8 milyar parametreleri olan varyantlarda mevcuttur, bu nedenle “tamamen şeffaf akademik araştırma” için uygundur. Yayın ayrıca Meta'nın sunduğu yeni bir referans noktasıyla el ele gidiyor: PLM Video.
Robot etkileşimi için 3D nesnelerin tanınması
Meta Locat 3D, dilden türetilen nesneleri tanımlayabilen bir modeldir. Örneğin, Meta bir robotu masanın kırmızı bir fincanını alıp alamayacağınızı sorabileceğinizi yazıyor. Robot veya arkasındaki model, kırmızı bir bardak ve masanın ne olduğunu anlamalı ve daha sonra bardağı kapmak ve getirmek için bir dizi adımda çalışmalıdır. “Yapay zeka sistemlerinin fiziksel dünyada bizi etkili bir şekilde destekleyebilmesi için, doğal dile dayalı dünyayı 3D anlamaya sahip olmak gerekir.”

(Resim: meta)
Nesneleri tanımak için, model sensörleri kullanarak noktalardan bir yapı oluşturur. Bu, diğer şeylerin yanı sıra Meta I-Jepa'ya dayanmaktadır; Nesneleri tanımak için soyut bir şekilde öğrenmesi gereken bir model. Doğru nesneyi bulmak için, bağlam bilgileri eklenir, örneğin “televizyonun yakınında vazo”, böylece robot “pencere penceresinden” çıkmasına izin vermez. Burada da GitHub'da metatik kağıt, veri ve genel modeli.
Meta, örneğin Boston Dynamics Spot ile doğrudan insanlar ve robotlar arasındaki etkileşimleri yönetir. Meta Fair ofisinde, biri zaten etrafta ve örneğin, sevimli oyuncakları bir yerden diğerine taşıyor. Robot köpeği hala bir soru arayışına bağlı. İlişkili çerçeveye Partnr denir.
Temel olarak, hedef bilim ile oldukça ilişkilidir. Çalışma genellikle kaynaklara sunulur, bu nedenle alan ve lisanslar farklıdır. Meta Fair'in amacı, günlük aktivitelerde insanlara yardımcı olabilecek Gelişmiş Makine İstihbarat Zekası (AMI) elde etmektir.
(EMW)