Odia Dilinde Crowdsourced Wiktionary Projesi için Yeni Bir Ses Yükleme Aracı

3 ay önce Teknoloji
Bu yazıyı 3 dakikada okuyabilirsiniz

Wiktionary için Kathabhidhana projesi için bir ev kayıt düzeneği. Wikimedia Commons’dan Subhashish Panigrahi üzerinden görüntü. CC BY-SA 4.0

Wiktionary, Wikipedia’nın çok dilli kardeş projesi, büyük vaat ediyor. Şu anda, duyabileceğiniz veya indirebileceğiniz pek çok açık lisanslı ses kaydı bulunmamaktadır – özellikle ana diliniz ana dillerden biri değilse. Wiktionary zaten birden çok dilde mevcuttur ve kelimelerin tanımlarına ek olarak, en azından Uluslararası Fonetik Alfabe (IPA) açısından birçok fonetik gösterim mevcuttur. Odia dili topluluğu projesi, Odia Wiktionary projesine gönüllü katkıların sürecini basitleştirmeye yardımcı oluyor.

Global Voices katılımcısı ve Odia Wikipedian Subhashish Panigrahi’nin liderliğindeki bir topluluk projesi olan Kathabhidhana, büyük kelime parçalarını kaydetmek için açık kaynaklı bir çözümdür. Daha sonra açık lisanslar altında yükler, böylece Wiktionary gibi projeler için yararlı olabilirler.

Hindistan’da devlet dillerinden biri olan Odia, yaklaşık 40 milyon anadili tarafından çoğunlukla Doğu Hindistan’da konuşulan Hint-Aryan dilidir. 5.000 yılı aşkın edebiyat mirası ile, en eski Güney Asya dillerinden biri olarak kabul edilmiştir ve Hint hükümeti tarafından klasik bir dil statüsü verilmiştir.

Ancak Unicode tabanlı olmayan yazım sistemlerinin kullanımı sayesinde, dilin çevrimiçi varlığı hala geride kalıyor. Bu sorunları gidermek için, çeşitli Unicode olmayan kodlama sistemlerini kullanarak yazılan metni Unicode’a dönüştüren bir dizi karakter kodlama dönüştürücüler Odia Wikipedia’da yer almaktadır; şimdi 12.000’den fazla girişi vardır. Öte yandan Odia Wiktionary, Odia dilinde ücretsiz, çevrimiçi tabanlı ve tamamen kalabalık kaynaklı bir sözlük olarak boşluğu kapatmaya çalışıyor.

Proje, büyük ölçüde süreci otomatikleştirmek ve basitleştirmek için Python programlama dilini kullanan Shrinivasan T tarafından yaratılan diğer açık kaynak yazılımlardan ilham alıyor. Bu öğretici YouTube’da yayınladı:

[wpcc-iframe” data-options=]

Panigrahi, Kathabhidhana projesini yapmak için ilham aldı, çünkü mevcut yöntem hantal bir süreçti: Bir kelimeyi telaffuz edip kaydetmeniz, ardından Ogg Vorbis formatında Wikimedia Commons hesabınıza aktarmanız gerekiyor, bu da tüm Wikimedia projeleri için medya dosyalarının merkezi bir deposu. Yüklendikten sonra, giriş Wiktionary projesine eklenir. Manuel olarak telaffuz kaydetmenin yanı sıra, çoğu Hint dili için çalışan Dhvani adlı açık kaynaklı bir metin okuma projesi de vardır.

Buna karşılık, Wiktionary kelimelerin ses kayıtlarına sahip olmak, anadili olmayanların yanı sıra görme engelli kişilerin farklı kelimelerin telaffuzlarını dinlemelerine yardımcı olur. Kelime kütüphanesi, metin okuma ve konuşma konuşma motorları oluşturma gibi çeşitli Doğal Dil İşleme projeleri için de kullanılabilir.

Kathabhidhana’nın bir kopyasını indirebilir ve bu yazılımı kullanarak yapılan tüm ses kayıtlarını bulabilirsiniz.

Kaynak https://globalvoices.org/2017/02/12/a-new-audio-uploading-tool-for-crowdsourced-wiktionary-project-in-odia-language/

Benzer Yazılar
Все анонсы Google на конференции I/O 2021
18 мая Google провела конференцию I/O 2021, ...
Teknoloji
1 gün önce
Netflix выпустил трейлер мультсериала по Resident Evil
Видеостриминговый сервис Netflix опубликовал трейлер мультипликационного сериала ...
Teknoloji
1 gün önce
Lamborghini выпустит электромобиль после 2025 года
Итальянский производитель суперкаров — компания Lamborghini анонсировала ...
Teknoloji
3 hafta önce
В Google Photos появились поисковые фильтры
В сервисе Google Photos появилась кнопка, предназначенная ...
Teknoloji
3 hafta önce