- ChatGPT ile Coupang'dan ürün bilgilerini toplayan bir crawling botu geliştirme
- Toplanacak sütunlar: ürün adı, liste fiyatı, satış fiyatı, yıldız puanı, inceleme sayısı, kart indirimi bilgisi, puan/ödül birikimi bilgisi, teslimat bilgisi
- Token sayısı sınırını aşmamak için HTML boyutunu küçültme yöntemleri ve prompt yazarken dikkat edilmesi gerekenler
- Reklam ürünlerini atlama
- DOM yapısı farklı olduğunda istisna işleme
- Zorunlu sütunları doğrulama (ürün adı, fiyat)
- ChatGPT son derece faydalı bir araç, ancak biraz hata ayıklama ve düzeltme gerekiyor (sonuçta uzmanlar bundan daha büyük fayda sağlıyor)
- Büyük miktarda veri toplamak için engellemeden kaçınmayı dikkate almak gerekiyor
5 yorum
Buradaki yazının tamamı sanki GPT tarafından yazılmış gibi görünüyor.
Sanırım özetle böyle..
ChatGPT ile bir crawler yapıyorum ve parsing ile XPath çıkarma konusunda çok yardım alıyorum.
GPT ile crawling yapmayı anlatan bir yazı gibi görünüyor ama sonuçta bu da HashScrapper reklamı.
Teknoloji bloglarının hepsi zaten böyle değil mi.. hehe