-
Organize suç ve yolsuzluk odaklı araştırmacı gazetecilik konusunda uzman OCCRP tarafından geliştirilen, araştırmacı gazeteciliğe yönelik veri inceleme ve analiz aracı
-
Yapılandırılmış (DB) / yapılandırılmamış (PDF, XLS, DOC vb.) verilerde birleşik çapraz arama
-
Veri bölümlendirme ve erişim yönetimi özellikleri. Çok uluslu ekipler arasında esnek paylaşımı destekler
-
Yüzlerce kamu veri kaynağından sürekli crawling
-
Görsel araştırma analizi sunar
-
Veri içe aktarma desteği
-
HTML/XML'den PDF, RTF, Epub ve çoğu ofis belgesine (Doc, PPT) kadar
-
XLS/CSV ile DBF, SQLite, Access gibi tablo formatları
-
RFC822 MIME e-postaları, Outlook PST/OLM gibi posta kutuları, Mbox, Vcard
-
Zip, Rar, Tar, 7Zip, Gzip
-
JPEG, PNG, GIF, TIFF, SVG için Tesseract 4 veya Google Vision API ile OCR uygulanarak metin çıkarılır
1 yorum
Bunu yapan OCCRP şöyle bir yer.
"Organize suç ve yolsuzluk odaklı araştırmacı gazetecilik kuruluşu, OCCRP" https://newstapa.org/article/_DNLi
https://aleph.occrp.org/ adresinde gerçek verilerle deneyebilirsiniz.
OpenOil'in hazırladığı tanıtım videosu, Aleph'i kolay anlaşılır biçimde açıklıyor.
( OpenOil, dünya genelindeki gaz, petrol, kömür gibi doğal kaynakları yönetmek için açık veri çerçevesi geliştiren bir şirkettir. )
https://www.youtube.com/watch?v=bg96HcR_2Jc
"Yolsuzluk" konusunda uzman bir araştırma kuruluşu tarafından yapıldığı için, temel veri modeli "Follow the Money" yaklaşımıdır.
Paranın hangi şirketler / hangi kişiler arasında aktığını iyi izler.
Bu nedenle varsayılan olarak desteklediği veri kümesi varlık türleri şunlardır.