7 puan yazan ninebow 13 일 전 | 2 yorum | WhatsApp'ta paylaş

Geçen sefer Show GN ile tanıtılmasının ardından, 1 aylık (31 günlük) legalize-kr proje güncellemelerini derleyip paylaşmak istiyorum. Birçok kişinin ilgi göstermesi ve destek vermesi sayesinde pek çok şeyi iyileştirebildik. Teşekkürler!

legalize-kr nedir?

legalize-kr, Kore Cumhuriyeti Mevzuat Bakanlığı'nın Ulusal Mevzuat Bilgisi Ortak Kullanımı tarafından sağlanan Güney Kore yasalarını ve içtihatlarını Markdown + Git geçmişi ile arşivleyen bir projedir. Tüm mevzuatı Markdown belgeleri olarak, tüm değişiklik geçmişini Git commit'leri olarak arşivledik; içtihatları da yine Markdown belgeleri ve karar tarihine dayalı Git History ile arşivledik.

Neden yaptım?

Geçen 30 Mart'ta, İspanya ve İngilizce konuşulan ülkelerin mevzuatlarını Markdown ve Git commit'leriyle yöneten legalize.dev adlı bir projeyi GitHub Trending'de keşfettim. Kore mevzuatını ele alan benzer bir yerin de mutlaka olduğunu düşündüm ama araştırınca bulamadım. Böyle bir şeyin en azından bir tane olması iyi olur diye düşündüm ve yaptım.

Güncelleme 1. İdari kurallar / yerel mevzuat depoları eklendi

Önceden yalnızca mevzuat ve içtihatlarla ilgileniyorduk; şimdi aynı Ulusal Mevzuat Bilgisi Ortak Kullanımı kaynağının sunduğu idari kurallar ve yerel mevzuatı da ayrı depolar olarak ekledik. Artık Güney Kore'nin kamuya açık başlıca hukuk belgelerini tek bir yerde Markdown + Git History ile takip edebilirsiniz:

İdari kurallar, bakanlık ve kurumların yönerge/genelge/duyuru gibi düzenlemelerini; yerel mevzuat ise yerel yönetimlerin belediye meclisi kararları ve kurallarını kapsıyor. Hacimleri yasalardan daha büyük ve değişiklikleri de daha sık olduğu için, bunları Git History ile izlemenin oldukça değerli olacağını düşündüm. Ancak özellikle idari kurallar tarafında, kurum adlarındaki değişiklikleri ya da görev paylaşımını takip etmek oldukça zor; bunu birkaç kez iyileştirmiş olsak da hâlâ gidilecek epey yol var gibi görünüyor. İlginizi ve katkınızı bekliyorum T_T

Güncelleme 2. CLI aracı, MCP ve Agent Skill eklendi

Tüm depoyu git clone ile kullanmak en rahat ve en iyi yol, ancak her seferinde onlarca GB büyüklüğündeki depoyu indirmek yorucu olabileceği için GitHub REST API tabanlı bir CLI aracı hazırladık. Ayrıca aynı kod tabanından bir MCP sunucusu da sağlıyoruz ve Claude Code / Codex gibi ortamlarda doğrudan kullanılabilecek bir Agent Skill de ekledik:

Artık tüm depoyu indirmeden belirli bir mevzuatı/içtihadı arayabilir, madde bazında görüntüleyebilir ya da değişiklik geçmişini takip edebilirsiniz; MCP üzerinden LLM/Agent da bunları doğrudan çağırabilir. AGENT SKILL içinde, hangi durumda CLI / MCP / git clone / doğrudan GitHub erişiminden hangisinin kullanılmasının uygun olduğuna dair bir rehber de bulunuyor. Ancak GitHub REST API, ek kimlik doğrulama olmadan saatte yalnızca 60 isteğe izin veriyor; ihtiyaç halinde bir GitHub token'ı oluşturup kullanmanız gerekir (saatte 5.000 isteğe kadar mümkün).

Güncelleme 3. Kullanım örnekleri / ekosistem sayfası eklendi

legalize-kr'ın sağladığı veri setlerini kullanan projeler yavaş yavaş ortaya çıkmaya başladığı için, bunları ana sitede ana sayfanın alt kısmında ve "Kullanım Yöntemi" menüsünde derlemeye başladım. Doğrudan kullanılan projelerin yanı sıra benzer amaçlara sahip başka proje ve araçları da birlikte tanıtıyorum (daha önce GN'de yer alan Beommang, Korean Law MCP gibi).

Eğer legalize-kr veri setlerinden bir veya daha fazlasını kullanıyorsanız ya da benzer bir alanda çalışan bir projeniz varsa, lütfen PR, issue ya da bu yazının yorumları aracılığıyla haber verin; birlikte derleyelim.

Güncelleme 4. Daha iyi veri kullanımı için diğer iyileştirmeler

Çeşitli depolardaki issue'ları referans alarak veri ayrıştırma kuralları ve metadata düzenlemeleri üzerinde çalışıyoruz. Başlıca değişiklikler şöyle:

  • Mevcut 'cilt/bölüm/kısım/fasıl' dışında 'paragraf/alt bölüm' gibi ek birimler için ayrıştırma kuralları geliştirildi (legalize-kr/legalize-kr#32)
  • <제M조의 N> deseninin kaybolması sorunu düzeltildi (legalize-kr/legalize-kr#31 ve legalize-kr/legalize-pipeline#2)
  • Eksik mevzuat tamamlandı - örn. Ticaret Kanunu ve Ticaret Kanunu Uygulama Kararnamesi (legalize-kr/legalize-kr#9)
  • Değişiklik öncesi uygulama kuralı dosyasının kalması nedeniyle git log'un bunu 'değişiklik' yerine 'ekleme' olarak göstermesi sorunu düzeltildi (legalize-kr/legalize-kr#24)
  • İçtihat dosya adları değiştirildi ve dizin sınıflandırması karar tarihine göre yapıldı (legalize-kr/precedent-kr#4)
  • İçtihat kaynak URL'lerindeki Korece adres biçiminin bozulması (law.go.kr 404) sorunu düzeltildi (legalize-kr/precedent-kr#3)
  • Dangi (檀紀) takvimindeki karar tarihine ait 17 Git commit'inin eksikliği giderildi (legalize-kr/precedent-kr#1)
  • Her mevzuat / içtihat / idari kural / yerel mevzuatla ilgili ek dosya bağlantıları Markdown Frontmatter içine liste biçiminde eklendi

Daha ayrıntılı bilgi için ana depolardaki kapatılmış issue'lara bakabilirsiniz:

Son olarak

Başta "öylesine yaparsam bir yerde işe yarar herhalde" düzeyindeydi, ancak geçen seferki Show GN'den sonra çok sayıda ⭐ ve issue gelince kapsam doğal olarak genişlemeye başladı. Düzenli olarak bakımını ve yönetimini sürdürüyorum; ilginiz, desteğiniz ve duyurmanız benim için çok değerli. Teşekkürler!

2 yorum

 
ptlkiki 13 일 전

Bakanlığımızda geliştirdiğimiz bir RAG var; bunu klonlayıp yalnızca bizim tarafla ilgili mevzuat vb. metinleri çıkarıp kullanmak istiyoruz.
Bunu bu şekilde yapmak mümkün mü?

 
ninebow 12 일 전

Evet, şu anda pipeline'ın nasıl yapılandırıldığını bilmiyorum ama temelde mevcut RAG yapısı için belgeleri Vector DB'ye koymadan önce ilgili işlemleri eklerseniz yeterli olacaktır.

Ancak asıl kritik nokta, "ilgili mevzuatı" nasıl çıkaracağınız gibi görünüyor; mevzuat adı veya anahtar kelimeler temelinde filtreleme yapmayı deneyebilirsiniz. ^^;

Teşekkürler!