9 puan yazan mrchypark 2022-04-03 | 1 yorum | WhatsApp'ta paylaş

elbird, kişisel olarak daha önce duyurduğum kiwigo’nun nihai hedefi olan pakettir.

R tarafında çeşitli morfolojik analiz paketi bulunuyor; başlıca KoNLP (Java tabanlı, şu anda * CRAN’den kaldırılmış durumda) ve RcppMecab (mecab tabanlı, hızlı, ancak orijinal metni geri yüklemiyor) öne çıkıyor, ayrıca birkaç başka paket daha mevcut.

KoNLP’nin ana akım olduğu dönemde JDK kurulumunun zorluğu ve şu anda CRAN’de bulunmaması birleşince, kurulumu kolay ve sürekli bakımı yapılan yeni bir morfolojik analiz paketini CRAN’e yüklemek için uğraşıyordum.

Bu sırada, taşınabilirliği yüksek C++ ile geliştirilmekte olan kiwi’yi öğrendim.

Aradan uzun zaman geçtikten sonra nihayet C++ işlevlerini sarmalayan bir R paketi hazırlayabildim ve CRAN kaydını tamamladım.

Şu anda 0.1.1 sürümü kayıtlı durumda ve yakında 0.1.2’ye güncellemeyi planlıyorum.
Şu anda uygulanmış özellikler temel kullanım için yeterli seviyede; kiwi’nin tüm işlevlerini uyguladıktan sonra kiwi sürümüyle uyumlandırma çalışmasını yapmayı düşünüyorum.

README’de temel kullanım kod örnekleri bulunuyor ve R ekosisteminde ünlü bir metin analizi paketi olan tidytext ile birlikte kullanım için işlevler de düşünülmüş durumda.

İlginizi bekliyorum.

* CRAN: R’nin resmî paket deposu. Burası otomatik testlerden ve yönetici incelemesinden geçen yönetilen bir depodur; evergreen politikası uygular (test başarısız olursa kayıt iptal edilir), bu yüzden düzenli bakım gerektirir.

1 yorum

 
mrchypark 2022-04-03

C++ geliştirme ve derleme konusunda deneyimim az olduğu için bu konuda çok fazla yardıma ihtiyacım oluyor.
Eğer tavsiye verebilecek olanlar varsa, lütfen issue sekmesine göz atın.