Google ve Microsoft çeviri hizmetlerine Hindistan’ın Odia dili eklendi

6 ay önce Teknoloji
Bu yazıyı 7 dakikada okuyabilirsiniz
Odia Kitap Kapakları Kolajı. Erin Mclaughlin tarafından Flickr üzerinden görüntü. Flickr setinden Odia Kitap Kapakları. CC X 2.0.
Collage of Odia Book Covers. Image via Flickr by Erin Mclaughlin. From the Flickr set Odia Book Covers. CC BY 2.0.

Odia Kitap Kapakları Kolajı. Erin Mclaughlin tarafından Flickr üzerinden görüntü. Flickr setinden Odia Kitap Kapakları. CC-BY 2.0.

Açık kaynak girişimleri devam ederken Google ve Microsoft, bu yıl ilgili makine çevirisi motorlarına Hindistan’ın Odia dilini ekledi – Şubat ayında Google Translate ve 13 Ağustos’ta daha yakın bir zamanda Microsoft.

Odia, Hint Odisha eyaletinin resmi dilidir ve Jharkhand eyaletindeki ikinci resmi dildir. Yaklaşık 35 milyon anadili ve ikinci bir dil olarak yaklaşık 4 milyon kişi tarafından konuşulur. Ayrıca Hint hükümeti tarafından 1.500 yılı aşkın bir edebi geleneği içeren bir dizi gereksinime dayalı ülkenin klasik dillerinden biri olarak sınıflandırılır.

Ancak, Odia’nın dijital varlığı sınırlıdır. Örneğin, metinsel içeriğin en büyük depolarından biri olan Odia Wikipedia, dokuz yıllık bir aradan sonra 2011 yılında yeniden canlandırıldıktan sonra yalnızca 15.858 makaleye sahiptir. Buna karşılık, Odia ile neredeyse aynı sayıda konuşmacı tarafından konuşulan Malayalm, Vikipedi’de yaklaşık 70K makalesine sahiptir. Odia’daki içerik, çok uzun bir süre için görüntü ve PDF şeklinde çevrimiçi olarak mevcuttu. Odisha devlet hükümeti tarafından işletilen dergi Utkal Prasanga da dahil olmak üzere bazıları görüntü ve PDF kombinasyonuyla yayınlamaya devam ediyor. Unicode’un geç kabulü içeriği daha az aranabilir hale getirdi.

Makine çevirisi, içeriği daha aranabilir ve hoparlörler tarafından daha erişilebilir hale getirerek dillerin dijital varlığının artırılmasına önemli ölçüde katkıda bulunur.

Microsoft Translator uygulaması, Office, Bing için Translator ve Azure Bilişsel Hizmetler Çevirmeni aracılığıyla da dahil olmak üzere Microsoft tarafından işletilen bulut hizmetleri artık tüm Odia’dan gelen çevirileri destekleyecek. Hem Microsoft Translator hem de Google Translate (hem web’de hem de uygulama olarak kullanılabilir), doğrudan giriş alanına kopyalanan metnin çevrilmesine izin verir.

Ayrıca, bu platformlar metin belgelerinin, web sitelerinin ve canlı sohbetlerin çevirisini de desteklemektedir. Google Translate mobil uygulaması çevrimdışı çeviri, el yazısı tanıma, tarama, çevirme ve görüntülerden metin okuma ve yabancı dil konuşmacıyla konuşmak için sesli komutu kullanma gibi ek özelliklere sahiptir. “Çevirmek için dokunun” adı verilen bir özellik, kullanıcının herhangi bir uygulamanın içinde yazılan metni doğrudan çevirmesine olanak tanır. Ayrıca, desteklenen bir dildeki bir metnin Google’ın konuşma sentezini kullanarak nasıl telaffuz edildiğini de duyabilirsiniz.

Odia’nın eklenmesi, Odisha devlet hükümeti tarafından çok iyi karşılandı. Odisha Başbakanı Ofisi tweet attı:

Odisha Hükümeti Elektronik ve Bilgi Teknolojileri Bölümü de tepki gösterdi:

Makine Çevirisi
Makine çevirisi, kaynak dilin metnini veya konuşmasını hedef dile çevirmek için kullanılır. Google’ın kullandığı çeviri, yapay sinir ağı adı verilen bir tekniği kullanan bir hesaplama sistemi olan Neural Machine Translation (kaynaktan hedef dile) ifadelerin çevirisinden oluşan büyük veri kümelerinin eğitim için kullanıldığı bir sistemdir.

Odia dahil edilmesiyle, Google Translate ve Microsoft Translator artık her biri 11 Hint dilini destekliyor. Toplamda, Google 109 dünya dilini desteklerken, Microsoft 73’ü destekliyor.

Bu arada açık kaynaklı girişimler Odia’da başarılı makine çevirisi projeleri oluşturmaya henüz başlamıyor.

En az bir açık kaynaklı topluluk öncülüğünde proje geliştirme aşamasındadır — MTEnglish2Odia, Odia dili Vikipedi gibi mevcut kaynaklardan çeviri çiftleri ve Twitter’daki kullanıcı katkılarından crowdsourcing ile makine çevirisi motorunu eğitiyor.

Buna ek olarak, diğer kuruluşlar tarafından makine çeviri motorları inşa etmek için kullanılabilecek bazı araştırma ve kaynaklar bulunmaktadır.

Makine çevirisi politikaları

Google Translate veya Microsoft Translator tarafından kullanılan teknoloji sosyal, yasal, etik ve haklar açısından karmaşıktır.

Bir makine çevirisi platformu, gazetecilerin birden çok dilden gelen haberlere hızlı bir şekilde erişmesi veya çok dilli kaynaklardan öğrenmek isteyen öğrenciler de dahil olmak üzere birçok kişi için harika bir şekilde kullanılabilir.

Benzer şekilde, ses sentezi desteği, engelli kişilerin, özellikle körlüğe, bilgiye daha kolay erişmelerine ve paylaşmalarına yardımcı olur.

Eğitim, medya ve eğlence endüstrisi, Google Translate’in büyük miktarda içeriği kısa bir süre içinde çevirme potansiyelinden de yararlanır.

Öte yandan, makine çevirisi yanlış bilgilerin yayılmasına katkıda bulunurken, ses sentezi, insanlarla kendi dillerinde iletişim kurarak avlayan dolandırıcıları kolaylaştırır.

Dünyada 6.000’den fazla belgelenmiş dil var ve bunların sadece bir azınlık yazı sistemleri kurmuş. Bunlar Google Translate ve Microsoft Translator gibi makine çevirisi projelerine dahil edilecek dillerdir.

Çevrimiçi içeriğin kullanılabilirliği ve belirli bir dili konuşan internet kullanıcılarının sayısı, kar amacı gütmeyen kurumların sistemlerine hangi dillerin dahil edileceğine karar verirken göz önünde bulundurduğu önemli faktörlerdir. Bir şirket ne kadar çok dil destekliyorsa, kullanıcılara o kadar hedefli içerik sunabilir ve reklamlardan daha fazla gelir elde eder.

Buna ek olarak, mevcut çevirileri gözden geçirmek için katkıda bulunan topluluk yapısına sahip Google Translate gibi projelerde etik atıf ve ücret soruları vardır (mühendislerin aracı düzenli olarak iyileştirmesine yardımcı olur).

Google, bulut çeviri hizmeti de dahil olmak üzere çok sayıda ücretli ürüne sahip kar amacı gütmeyen bir şirkettir. Ne bireysel gönüllüler ne de makinenin öğrendiği çok sayıda kamu kaynaklarına atfedilmekte veya ücretlendirilmektedir.

Makine öğrenimini ve yapay zekayı geliştirmek için özel iletişimlerin kullanılması da gizlilik açısından tartışmalıdır. Ancak Google bu tür verileri anonimleştirmek için çalışıyor.

Çok dilli içeriğin oluşturulmasının maliyetler nedeniyle şişelere karşı karşıya olduğu Hindistan gibi bir ülkede, Google Translate ve Microsoft Translator gibi ürünler Hint içerik ekonomisinde devrim yaratabilir. Şu anda 23 Hint dilinde bulunan Wikipedia veya gönüllü çalışmalara büyük ölçüde dayanan çok dilli çevrimiçi çocuk edebiyatı platformu StoryWeaver gibi projeler için fark yaratabilir.

Birçok Hint dilinin hızla ortadan kaybolması ve cahillik ve dijital erişilebilirlik ile iletişim yolu, ses ve görsel teknolojide daha fazla yeniliğe ihtiyaç duyar. Makine çevirisi, dilin yok oluşunu durdurmak için uygun bir araç olabilir — ancak Hindistan’da hala uzun bir yol var.

Feragat: Yazar, 2011 yılından bu yana gönüllü olarak Odia Wikipedia ve MTEnglish2Odia ile ilk aşamalarından beri çalışmaktadır.

Kaynak https://globalvoices.org/2020/08/28/indias-odia-language-added-to-google-and-microsoft-translation-services/

Benzer Yazılar
Все анонсы Google на конференции I/O 2021
18 мая Google провела конференцию I/O 2021, ...
Teknoloji
3 ay önce
Netflix выпустил трейлер мультсериала по Resident Evil
Видеостриминговый сервис Netflix опубликовал трейлер мультипликационного сериала ...
Teknoloji
3 ay önce
Lamborghini выпустит электромобиль после 2025 года
Итальянский производитель суперкаров — компания Lamborghini анонсировала ...
Teknoloji
4 ay önce
В Google Photos появились поисковые фильтры
В сервисе Google Photos появилась кнопка, предназначенная ...
Teknoloji
4 ay önce