- Tamamen ücretsiz ve açık kaynak. Abonelik/ücretli özellik/gizli kod yok
- Zorlu el yazmalarının yüksek kaliteli işlenmesinden basılı materyallerin büyük ölçekte tam metin tanınmasına kadar esnek biçimde uygulanabilir
- Güçlü yerleşim ve metin anotasyonu desteği
- LAREX editörünü kullanarak yerleşim ve metin öğelerine manuel olarak açıklama ekleyebilir, düzeltebilir veya karşılaştırabilirsiniz
- OCR-D ekosistemiyle tamamen uyumludur
- Kullanılabilirlik odaklı tasarım: kod/CLI kullanmadan da UI üzerinden karmaşık OCR iş akışları oluşturabilirsiniz
- Kolay çapraz platform geliştirme: işletim sistemi türünden bağımsız olarak Docker ve tek bir komutla çalıştırılabilir
1 yorum
Hacker News görüşleri
Karmaşık segmentasyon pipeline'ları birkaç yıl önce gerekliydi ama artık çok hataya açık ve modelden önemli bağlamı alıp götürüyor. El yazısına geçmek için bağlam gerekiyor
OCR4all, erken modern dönem basılı materyallerindeki dijital metni geri kazanmak ve tanımak için bir yazılım
OCR4all, teknik olmayan kullanıcıların ihtiyaçlarını açık ve sezgisel biçimde ele alıyor
Apple'ın Vision Framework'ü, Tesseract'tan daha hızlı ve daha doğru bir metin tanıma kütüphanesi sunuyor
Tesseract ile LLM'i birleştirip hataları düzeltmek ve biçimlendirmeyi iyileştirmek, şu anda hız/verimlilik/doğruluk açısından en iyi denge noktası
Yapay zeka destekli bir OCR API geliştirildi
Bu iş akışı, tarihsel basılı belgeleri dijitalleştirmeye yönelik
OCR4all, otomatik metin tanıma iş akışı sunmak için çeşitli açık kaynak çözümleri bir araya getiriyor
Bunun yeni bir SOTA OCR motoru mu, yoksa bilinen başka motorları kullanan bir araç mı olduğu merak ediliyor
OCR'nin büyük ölçüde Tesseract ile çözülmüş olduğunu sanıyordum, ancak sonuç PDF'sinde MRC sıkıştırması için bir kütüphane ya da uygulama aranıyor