Botların web içeriğini kazımasını engelleyen insancıl yoksayma kuralı OpenAI

Business Insider’ın edindiği bilgiye göre, dünyanın en büyük iki yapay zeka girişimi, medya yayıncılarının ücretsiz örnek eğitim verileri için web içeriklerini kazımayı bırakma isteklerini görmezden geliyor.

OpenAI ve Anthropic’in, web sitelerinin otomatik olarak silinmesini önleyen robots.txt adı verilen statik bir web kuralını ya görmezden geldiği ya da bu kuralı atlattığı ortaya çıktı.

Yayıncılar ve AI şirketleri arasındaki ücretli lisans anlaşmalarına aracılık etmeyi amaçlayan bir girişim olan TollBit, birçok AI şirketinin bu şekilde davrandığını tespit etti ve büyük yayıncılardan bazılarını Cuma günü bir mektupla bilgilendirdi. Reuters bunu daha önce bildirmişti. Mektupta, kuralı ihlal etmekle suçlanan yapay zeka şirketlerinden hiçbirinin adı yer almıyordu.

OpenAI ve Anthropic, robots.txt dosyasına saygı duyduklarını ve GTBot ve ClaudeBot gibi kendi web tarayıcılarını engellediklerini kamuoyuna açıkladı.

Ancak TollBit’in bulgularına göre bu tür bloklara iddia edildiği gibi uyulmuyor. OpenAI ve Anthropic dahil olmak üzere yapay zeka şirketleri, belirli bir web sitesi veya sayfadaki tüm içeriği almak veya çıkarmak için robots.txt dosyasını basitçe “atlamayı” tercih ediyor.

OpenAI sözcüsü, BI’nın bir şirkete yönelik direktifinin ötesinde yorum yapmayı reddetti Blog yazısı Mayıs ayı itibarıyla şirket, “her yeni modeli eğittiğimizde” web tarayıcısı izinlerini dikkate aldığını açıkladı. Antropik bir sözcü yorum isteyen e-postalara yanıt vermedi.

Robots.txt, web sitelerinin robot tarayıcılara verilerinin silinmesini ve toplanmasını istemediklerini söylemesinin bir yolu olarak 1990’ların sonlarından beri kullanılan bir kod parçasıdır. Web’in resmi olmayan destekleyici kurallarından biri olarak geniş çapta kabul görmüştür.

Üretken yapay zekanın ortaya çıkışıyla birlikte startuplar ve teknoloji şirketleri en güçlü yapay zeka modellerini oluşturmak için yarışıyor. Anahtar bileşen yüksek kaliteli verilerdir. Bu tür eğitim verilerine duyulan susuzluk, robots.txt dosyasını ve bu kodun kullanımını destekleyen resmi olmayan kuralları baltaladı.

OpenAI, popüler sohbet robotu ChatGPT’nin arkasındadır. Şirketin en büyük yatırımcısı Microsoft’tur. Antropik, nispeten popüler bir başka sohbet robotu olan Claude’un arkasındadır. En büyük yatırımcısı Amazon’dur.

Her iki sohbet robotu da kullanıcı sorularına insani bir tonda yanıtlar veriyor. Bu tür cevaplar ancak üzerine inşa edildikleri yapay zeka modellerinin, çoğu telif hakkı kapsamında olan veya yaratıcılarına ait olan, web’den alınan çok miktarda yazılı metin ve veri içermesi nedeniyle mümkündür.

Geçtiğimiz yıl birçok teknoloji şirketi, ABD Telif Hakkı Bürosu önünde, konu yapay zeka eğitim verileri olduğunda web’deki hiçbir şeyin telif hakkına tabi olarak değerlendirilmemesi gerektiğini savundu.

OpenAI’nin içeriğe erişmek için yayıncılarla bazı anlaşmaları var; bunlar arasında BI’nın sahibi olan Axel Springer da var. ABD Telif Hakkı Bürosu, yapay zeka ve telif hakkıyla ilgili kılavuzunu bu yılın sonlarında güncellemeye hazırlanıyor.

Bir teknoloji çalışanı mısınız yoksa paylaşacak tavsiyesi veya içgörüsü olan başka biri misiniz? Callie Hayes ile iletişime geçin [email protected] Veya güvenli bir mesajlaşma uygulamasındaSinyal +1-949-280-0267’den. Çalışmayan bir cihaz kullanarak iletişim kurun.

Best Buy (BBY) 2025 2. Çeyrek kazançları

Foot Locker, yüksek maliyetleri azaltmak için New York’u terk edip St. Petersburg, Florida’ya taşınıyor: “verimlilik”

Nvidia Canlı Kazanç Güncellemeleri: Nvidia hisseleri bugünkü yatırımcı çağrısı öncesinde düştü

İnsan Makine Arayüzleri (HMI) Verimliliği ve İnovasyonu Nasıl Artırır?

Bilim insanları dünyadaki en büyük demir cevheri yataklarında milyar yıllık bir sırrı keşfetti

Federico Chiesa Juventus’tan Liverpool’a transferini tamamladı

Visions Of Mana, iki kat daha uzun sürebilen 30 saatlik bir RPG’dir

Bir yanıt yazın Yanıtı iptal et

More Stories