13 puan yazan xguru 2023-11-07 | 4 yorum | WhatsApp'ta paylaş
  • Görme engelliler için gönüllülerle bağlantı kurup ekranı okuyan "Be My Eyes" hizmetinin benzeri, yapay zeka ile hayata geçirilmiş
  • Multimodal bir backend üzerinden görüntüyü izleyip bunun ne olduğunu gerçek zamanlı açıklayan bir web uygulaması
  • Açık kaynaklı multimodal model SkunkworksAI'nin BakLLaVA-1 modeli llama.cpp ile çalıştırılıyor ve ses çıktısı Web Speech API ile veriliyor

4 yorum

 
botplaysdice 2023-11-08

Vay, böyle şeyleri görünce mühendis olmakla gurur duyuyorum. Görme engelli insanlar için gerçekten çok büyük bir yardım olacak gibi görünüyor.

 
hi098123 2023-11-08

YouTuber One Shot Hansol'un kullandığı Sullivan Plus adlı bir uygulama da var.
Yalnızca metin tanıma değil, nesnelerin özelliklerini de algılıyor gibi görünüyor.
https://youtu.be/EAKGU-uW6Ek
https://www.mysullivan.org/

 
hero512 2023-11-07

Böyle haberler beni çok mutlu ediyor :) Çünkü kızım görme engelli.