Apple bugün, bulut sunucuları yerine cihaz üzerinde çalışacak şekilde tasarlanmış çeşitli açık kaynaklı büyük dil modellerini (LLM'ler) piyasaya sürdü. OpenELM (Açık Kaynak Verimli Dil Modelleri) adı verilen LLM programlarına şu adresten ulaşabilirsiniz: Sarılma yüzünün merkezi parçasıAI kodunu paylaşmaya yönelik bir topluluk.
Teknik incelemede gösterildiği gibi [PDF]Toplamda sekiz adet OpenELM modeli bulunmaktadır; bunların dördü CoreNet kütüphanesi kullanılarak önceden eğitilmiştir ve dördü talimat ayarlı modellerdir. Apple, doğruluğu ve verimliliği artırmayı amaçlayan bir katman ölçeklendirme stratejisi kullanıyor.
Apple, yalnızca nihai eğitim modeli yerine kod, eğitim günlükleri ve birden fazla sürüm sağladı ve projenin arkasındaki araştırmacılar bunun, doğal dil yapay zekası alanında daha hızlı ilerlemeye ve “daha güvenilir sonuçlara” yol açacağını umuyor.
OpenELM, açık gelişen bir dil modeli. OpenELM, parametreleri transformatör modelinin her katmanına verimli bir şekilde tahsis etmek için bir katman ölçeklendirme stratejisi kullanır ve bu da daha iyi doğruluk sağlar. Örneğin, yaklaşık 1 milyar parametrelik bir parametre bütçesiyle OpenELM, OLMo'ya göre doğrulukta %2,36'lık bir iyileşme gösterirken, ön eğitim için 2 kat daha az token gerektirir.
Yalnızca model ağırlıkları, çıkarım kodu ve özel veri kümeleri üzerinde ön eğitim sağlayan önceki uygulamalardan ayrılan sürümümüz, eğitim günlükleri, çoklu kontrol noktaları ve ön-eğitim de dahil olmak üzere halka açık veri kümeleri üzerinde dil modelinin eğitimi ve değerlendirilmesi için eksiksiz bir çerçeve içerir. puan. Eğitim konfigürasyonları.
Apple, modern dil modelleriyle “açık araştırma topluluğunu güçlendirmek ve zenginleştirmek” için OpenELM modellerini başlattığını söylüyor. Açık kaynaklı modellerin paylaşılması, araştırmacılara riskleri, verileri ve model önyargılarını araştırma yolu sağlar. Geliştiriciler ve işletmeler şablonları olduğu gibi kullanabilir veya üzerinde değişiklik yapabilir.
Bilgilerin açık paylaşımı, Apple'ın en iyi mühendisleri, bilim adamlarını ve uzmanları işe almasında önemli bir araç haline geldi; çünkü normalde Apple'ın gizlilik politikaları uyarınca yayınlanmayacak araştırma makaleleri için fırsatlar sağlıyor.
Apple henüz bu tür yapay zeka yeteneklerini cihazlarına getirmedi ancak iOS 18'in bir dizi yeni yapay zeka özelliği içermesi bekleniyor ve söylentiler, Apple'ın gizlilik amacıyla cihazda kendi büyük dil modellerini çalıştırmayı planladığını gösteriyor.
. “Çıldırtıcı derecede alçakgönüllü bira ustası. Gururlu domuz pastırması evangelisti. Tam bir twitter bilgini. Problem çözücü. Dost düşünür.”
More Stories
Visions Of Mana, iki kat daha uzun sürebilen 30 saatlik bir RPG’dir
Sızıntılar, iddia edilen PS5 Pro cihazının adını ve tasarımını ortaya koyuyor
iPhone 17 Pro Max, iPhone 17 Pro ve diğer modellere göre daha fazla rastgele bellek ve daha iyi bir soğutma sistemiyle gelecek.