Korece·Çince·Japonca bilgisayar bilimi terimleri karşılaştırması
(cjk-compsci-terms.netlify.app)Merhaba. GeekNews'te bir hesap açtıktan sonra şimdiye kadar sadece keyifle okuyordum; ancak Kore Alfabesi Günü gelince, bu yılın başında hazırladığım 《Korece·Çince·Japonca bilgisayar bilimi terimleri karşılaştırması》 tablosu aklıma geldi ve bunu Show GN olarak paylaşmak istedim.
Her uzmanlık alanında biraz böyledir ama günümüzde, kolaylık olsun diye bilgisayar bilimi terimlerinde eskiden beri yerleşmiş çeviri karşılıklarını kullanmak yerine İngilizceyi doğrudan ödünç kelime olarak kullanma durumu sık görülüyor. Örneğin bugünlerde “değer” için bile çoğu zaman doğrudan “value” deniyor ve yazılırken de öyle kullanılıyor.
Her neyse, Korecede de aslında onlarca yıldır yerleşmiş pek çok iyi bilgisayar bilimi çeviri terimi var. Bunların önemli bir kısmının, aynı Çin karakteri kültür çevresine ait Japonya ve Tayvan ile de paylaşıldığını fark edince, eğlencesine bu karşılaştırma tablosunu hazırlamıştım. Kore Alfabesi Günü vesilesiyle bir göz atarsanız sevinirim.
Kaynak kodu < https://github.com/dahlia/cjk-compsci-terms > adresinde bulunuyor. Her terim tables/ dizini içinde sınıflandırmaya göre YAML dosyaları halinde düzenlenmiş durumda; bu yüzden terim ekleyen veya hataları düzelten PR'ler de memnuniyetle karşılanır.
Okuduğunuz için teşekkürler!
12 yorum
Bir sorum var.
YAML içindeki Çince ve Japonca yazımlara bakınca, Kore'de kullanılan Hanja yazımlarının kullanıldığını ve alt tarafta
termolarak geleneksel, basitleştirilmiş ve Japon tarzı kısaltılmış yazımların belirtildiğini gördüm.Bunu hangi amaçla geliştirdiğinizi merak ediyorum.
Örneğin Source Code için,
Çin ana karasında (zh-CN) Korece Hanja gösterimi olarak "源代碼" ve "源程序" kullanıldığı söyleniyor.
Ama
termalanında basitleştirilmiş yazımın doğru verildiğini görünce bunun tutarlı olmadığını düşünüyorum.Bilgi olması açısından, Source Code için,
Çin ana karasında daha çok 源代码、源码、源程序 kullanılır.
Tayvan'da ise 原始碼、原始程式碼 kullanılır.
Hong Kong'da 原始碼, 源碼 kullanıldığını duydum.
Ayrıca Computer için,
Çin ana karasında resmî olarak "电子计算机" kullanılır ve birçok kitap ile belgede Computer için "计算机" yazımı kullanılır.
Ancak Tayvan ve Hong Kong'un etkisiyle insanlar "电脑" ifadesini de karışık şekilde yaygın olarak kullanıyor.
Kaynak 1: https://zh.wikipedia.org/wiki/…
Kaynak 2: 电脑吧 https://tieba.baidu.com/f?kw=%B5%E7%C4%D4&fr=ala0&tpl=5
JD.com CPU bölümü: https://pcdiy.jd.com/
JD.com dizüstü bilgisayar bölümü: https://list.jd.com/list.html?cat=670,671,672
Bu yüzden, bu kısmın devletin resmî yazımlarını esas alarak mı ilerleyeceği konusunda doğrulanması gereken çok şey var gibi görünüyor.
Çince konuşulan bölgelerde kullanılan yazımlar birbirinden farklı ve kullanan kişiye göre kullanım sıklığı da değişebildiği için dikkate alınması gereken birçok unsur var gibi görünüyor.
Değerli görüşünüz için teşekkür ederim.
Öncelikle, önce web’de yayımlanmış sayfayı kontrol ederseniz, Kıta Çincesi terimler arasında basitleştirilmiş karakterler yerine Kore usulü Hanja yazımıyla gösterilen bir madde olmadığını görebilirsiniz. Çünkü YAML verisinde ekranda gerçekten gösterilen içerik yalnızca
termalanıdır; bu yüzden, belirttiğiniz gibi yalnızcatermiçinde her bölgede kullanılan yazım biçimini kullandım (yalnızca Korece için Hangul yerine Kore usulü Hanja ile gösterildi).O hâlde onun üst kısmında yazılı olan Kangxi Zidian biçimindeki karakter dizisinin ne olduğuna gelirsek, bu sadece verinin içinde farklı diller (veya lehçeler) arasındaki eş kökenli sözcükleri gruplamak için kullanılan keyfi bir grup tanımlayıcısıdır. Keyfi olduğu için ille de Çince karakterlerden oluşması gerekmez; sayı ya da hash de kullanılabilir. Ancak örneğin Japonca 「科学」 ile Tayvan Çincesi 「科學」 tek bir eş kökenli sözcük olarak bağlantılı biçimde gösterilmelidir; dolayısıyla aynı grup tanımlayıcısını paylaşmaları gerekir. Benzer şekilde Korece 「keompyuteo」 ile Japonca 「コンピュータ」 da yine aynı grup tanımlayıcısı altında toplanmalıdır.
Tanımlayıcıyı sadece 「foobar」 gibi keyfi ve anlamsız bir dizge olarak da yapabilirdim; ancak kolaylık açısından, içeriği belli eden ve tutarlı bir kurala göre adlandırılmış olmasının yönetimi daha kolay olacağını düşündüm. Bu nedenle İngilizce kökenli sözcükleri Latin harfleriyle, Sino-Xenic sözcükleri ise Han karakterleriyle yazmak akla gelen en kolay kuraldı. Ancak Han karakterleriyle yazımın da çeşitli biçimleri olabileceğinden, farklı varyantları ve biçimleri normalize etmem gerekiyordu (sonuçta bu bir grup tanımlayıcısı, tek bir biçimde toplanması gerekir). Bu süreçte Çin’in basitleştirilmiş karakterleri ile Japonya’nın shinjitai biçimleri doğal olarak elendi. Çünkü bölgesel okunuş ölçütüne göre farklı karakterlerin birleştirildiği epey çok örnek var; bu yüzden normalizasyona uygun değiller (sınıflandırma bilgisinde kayıp yaratıyorlar). Dolayısıyla seçenek olarak Hong Kong’un geleneksel karakterleri, Tayvan’ın standart geleneksel karakterleri ya da Kore usulü Hanja gibi biçimlerden birini seçmek gerekiyordu; ben de mevcut herhangi bir siyasi yazı standardıyla bağlantılı çağrışımı olmadığı söylenebilecek Kangxi Zidian biçimini ölçüt olarak aldım.
Yukarıdaki hususlar depodaki
CONTRIBUTING.mddosyasında zaten açıklanmış durumda. Bunun dışındaki bölümler de yazılı, isterseniz onlara da bakabilirsiniz.Bir dil topluluğunda aynı anlama gelen birden çok sözcükten hangisinin en yaygın kullanıldığını, yani sözcük dağılımını geniş kapsamlı biçimde saptamak, uzman bir araştırmacı olmayan tek bir kişinin araştırması için hem maliyet hem de zaman açısından fazlasıyla külfetlidir. Bilgisayar bilimi araştırmalarıyla uğraşan ya da yazılım geliştiren kişiler arasında terim kullanımının dağılımını inceleyen önceki çalışmalar varsa ben de bunları memnuniyetle kullanmak isterim; ancak böyle bir şey özellikle yoksa, benim açımdan çeşitli katılımcıların yardımı, özellikle de her dilin ana dili konuşurlarının önerileri çok gereklidir. Elbette bugüne kadar araştırmayı tek başıma yaptığım için, Çince Vikipedi ya da Baidu Baike gibi kaynakları merkeze almak zorunda kaldım.
Sözünü ettiğiniz somut örnekler için pull request gönderirseniz daha hızlı yansıtabilirim.
Uzun yorumumu okuduğunuz için teşekkür ederim.
Harika :D
Güzel derleme için teşekkürler.
İleride fırsat olursa Kuzey Kore’nin bilişim terimlerine ilişkin kaynakları da görmek isterim. Birleşme Bakanlığı Kuzey Kore Bilgi Merkezi’nde uygun bir kaynak olup olmadığını bilmiyorum.
Zaten Birleşme Bakanlığı sitesinde mevcut.
Kuzey ve Güney Kore BT terimleri karşılaştırması: https://nkinfo.unikorea.go.kr/nkp/term/skNkItTerm.do
Kuzey Kore'nin Linux dağıtımı olan Red Star gibi bir şeyi didik didik incelersek belki bazı materyaller çıkabilir gibi görünüyor. Sanırım içinde 《Joseonmal Daesajeon》 de vardı… Bir ara vakit bulduğumda Kuzey Kore dilini de eklemeye çalışırım!
Kuzey ve Güney Kore IT terimlerinin karşılaştırması: https://nkinfo.unikorea.go.kr/nkp/term/skNkItTerm.do
Bunu scrape edersek hızlıca ekleyebiliriz gibi görünüyor.
Dikkatlice bakınca, scraping yapmaya bile gerek kalmadan ilgili içeriğin tamamını xls formatındaki bir dosya olarak sunduklarını görüyorum.
kodiliniko-krveko-kpolarak ayırıp Kuzey Kore bilişim terimlerini de eklemek iyi olurdu.Markdown'da
<>ile sarınca URL sınırlarının algılanacağını sanmıştım, ama öyle değilmiş. 😅 Depo bağlantısı burada: https://github.com/dahlia/cjk-compsci-termsMarkdown desteği çalışması yapmam gerekiyor ama hâlâ yapamadım TT
URL tıklanabilir olsun diye sadece önüne ve arkasına boşluk ekleyerek düzenledim.
Ama gerçekten Kore Alfabesi Günü'ne çok yakışan bir Show. Keyifle izleyeceğim!
Metni de düzelttiğiniz için teşekkür ederim!