12 puan yazan GN⁺ 2023-08-08 | 3 yorum | WhatsApp'ta paylaş
  • OpenAI tarafından geliştirilen web tarayıcısı GPTBot için tanıtım yazısı
  • GPTBot adlı user-agent token'ı ve tam user-agent dizesiyle tanımlanabilir
  • GPTBot'un taradığı web sayfaları, gelecekteki yapay zeka modellerinin iyileştirilmesinde kullanılabilir
  • Tarayıcı, ücretli erişim gerektiren kaynakları, kişisel olarak tanımlanabilir bilgi (PII) topladığı bilinen yerleri ve OpenAI politikalarını ihlal eden metinleri filtreler
  • Site erişimine GPTBot için izin vermek, yapay zeka modellerinin doğruluğunu, genel yeteneklerini ve güvenliğini artırmaya yardımcı olabilir
  • Sitenin robots.txt dosyasına GPTBot eklenerek siteye erişimi engellenebilir; ayrıca sitenin belirli dizinlerine GPTBot'un erişimine izin vermek de mümkündür
  • Tarayıcının kullandığı çıkış IP aralıkları OpenAI web sitesinde ayrıca belirtilmiştir

3 yorum

 
ragingwind 2023-08-08

Gerçekten çok fazla deney yapılacak gibi görünüyor.

 
xguru 2023-08-08

Paywall erişimi gerektiren web sitelerinin yöneticileri, içeriklerini ChatGPT modeline eklemek için bot erişimini açar mı acaba?
Şu anda ücretli erişim gerektiren siteler bile bazen Google botuna önbelleğe alma için erişim veriyor.
Elbette bunu tersine kullanıp crawl yapan botlar da var :)

 
GN⁺ 2023-08-08
Hacker News görüşleri
  • OpenAI'nin web tarayıcısı GPTBot'un web siteleri üzerindeki potansiyel etkisi tartışılıyor
  • Bazı kullanıcılar, bunun yapay zeka model eğitimini nasıl etkilediğini görmek için GPTBot'a farklı içerik döndürmeyi deney olarak öneriyor
  • 429 Too Many Requests yanıt başlığını yok sayan GPTBot'a dair endişeler var; bu durum, istek sınırı olan API'lere sahip küçük projelerde sorun çıkarabilir
  • Kullanıcılar, GPTBot'un kendi sitelerine erişmesine izin vermenin faydasını sorguluyor; içerikleri, asıl içerik üreticilerine doğrudan bir fayda veya atıf sağlamadan yapay zeka modellerini geliştirmek için kullanılabilir
  • Aşırma olasılığına ilişkin endişeler dile getiriliyor; GPTBot içeriği yeniden ifade edip kaynak göstermediği için, materyalin asıl kaynağını kanıtlamak zorlaşabilir
  • Bazı kullanıcılar bu endişeler nedeniyle GPTBot'u engellemeyi düşünüyor, ancak bunun bu tür kısıtlamalara uymayan botlara rekabet avantajı sağlayıp sağlamayacağını sorguluyor
  • Tartışma ayrıca web taramanın yol açtığı telif hakkı ihlali gibi daha geniş bir soruna da değiniyor; bazı kullanıcılar, kaynak göstermeyen makine öğrenimi modellerinin hasmane ve telif hakkını ihlal edici olarak değerlendirilmesi gerektiğini savunuyor