Bu Teknisyenler Telefonunuzun Swahili’de Sizinle Konuşmasını İstiyor

3 ay önce Teknoloji
Bu yazıyı 4 dakikada okuyabilirsiniz

Fotoğraf: Eli Duke via Flickr (CC BY-SA 2.0)

Tahmini 100 milyon konuşmacı ile Swahili, Arapça sonra Afrika kıtasında en çok kullanılan ikinci dildir. Ancak otomatik konuşma tanıma (ASR) gibi hizmetler bu dilde ticari olarak mevcut değildir, engelli birçok kullanıcıyı ve günlük yaşamlarında umutsuzca ihtiyaç duydukları bilgileri okur yazmayan kullanıcıları inkar eder. Akademik araştırma ve teknoloji girişimlerinin Swahili konuşmacılarına yerelleştirilmiş teknolojiler sağlamak için birleştiği için bu durum çok yakında değişebilir.

Basit bir cep telefonunda internet araması

Bu çok umut verici yeniliklerden biri Kenya’da sergilenmek üzere. Uliza (Swahili’de “sor” anlamına gelir), kullanıcıların temel bir cep telefonu kullanarak internetten bilgilere erişmelerini sağlayan bir ses arayüzüdür.

Kullanıcıların tek yapması gereken Swahili dilinde bir soru sormak. 15 ila 90 dakika içinde, bir “cevap ajanı” (perde arkasında çalışan gerçek bir kişi) sesli cevapla yanıt verir. Şu anda, yaklaşık 50 ajandan oluşan bir “kalabalık”, ses kayıtlarını transkribe ederek, çevrimiçi olarak birden çok dilde cevaplar arayarak, bilgiyi çevirerek ve Swahili’deki arayana geri göndererek sorguları tedavi ediyor.

Kenya’nın başkenti Nairobi ve Batı Kenya’da gerçekleştirilen pilot sırasında, yaklaşık 600 beta kullanıcısı yerel temsilcileri hakkında sorular gönderdi, Swahili ödev konusunda yardım istedi ve şahsen yetiştirilemeyecek kadar hassas tıbbi bilgi istedi.

Uliza’nın pilot projesi sırasında, kullanıcılar tarafından sorulan en sık sorulan sorulara (Swahili’den İngilizce’ye çevrilmiş) dahil edilen kelimeler bunlar idi.

Uliza gelecekteki kullanıcıları için başka bir sorunu çözecektir: İnternet’te barındırılan bilgilere erişim eksikliği. Bu durumun birçok örtüşen nedeni vardır: ucuz olmayan mobil veri demetleri, en yakın siber kafeye uzaklık, daha geniş iletişim dillerinde okuma yazma bilmezlik, yerel dillerde mevcut içeriğin bir kıyafetiyle birleşir.

Teknik bir sorun değil.

Uliza’nın crowdsourcing modeli kuşkusuz emek yoğun ama büyük bir avantajı vardır: insanların transkripsiyonu ve çeviriyi ele alarak, genellikle Afrika dillerinde ASR çabalarını kısıtlayan büyük ses veri kümelerinin eksikliğini geçici olarak atlar, aynı anda veri toplarken aksan ve lehçelerin çeşitli gerçek hoparlörler. Uliza kurucusu Grant Bridgman, makine öğrenimi yeteneği oluşturmak ve gelecekte sistemi tamamen otomatikleştirmek için bu kısa kayıt ve transkripsiyon veritabanını kullanmayı planlıyor. Tufts Üniversitesi’ndeki bu konuşmada Bridgman projenin arkasındaki konsepti tanıttı:

İyi bir araştırma, Swahili ve diğer yaygın olarak konuşulan Afrika dilleri için otomatik konuşma tanıma yazılımı oluşturmaya başladı, ancak teknolojinin insanların eline geçmesi biraz zaman alıyor. Bridgman, Global Voices ile yaptığı bir röportajda şunları söyledi:

Teknoloji var ve bunların hepsi birinci dünya dilleri için zaten mevcut, şimdi düşük kaynak diller için geçerli hale getirmek için ticari bir model bulmamız gerekiyor.

Kırsal bir müşteri tabanı için daha düşük maliyetle yardım hatları kurmak isteyen şirketler, Uliza’nın büyümesinin ilk aşaması için potansiyel müşterilerdir. Sonunda, İnternet’e erişimi olmayan cep telefonu kullanıcılarının sorularına cevap bulmalarını ve kendi ses içeriklerini yüklemelerini sağlayan tam bir hizmet uygulanacaktır. Kullanıcı maliyeti minimum olacaktır — bir SMS fiyatına yakın.

Uliza’nın modeli, yeterince sayıda hoparlöre sahip diğer diller için uygulanabilir olabilir. Ama Afrika kıtasında konuşulan 2000 dilin büyük çoğunluğu için durum böyle değil. Ancak çözümler Beckman Enstitüsü’nde Preethi Jyothi tarafından yönetilen bir araştırma projesinden geliyor olabilir, burada araştırmacı ekibi anadili olmayan konuşmacılardan kitlesel kaynak transkripsiyonları için olasılıksal bir yöntem kullandı. Bir kez ince ayarlı, olasılıksal transkripsiyon, daha az temsil edilen diller için ASR olasılığını, umarım makul bir maliyetle açabilir.

Kaynak https://globalvoices.org/2017/03/23/swahili-africas-second-top-language-gets-some-much-needed-recognition/

Benzer Yazılar
Все анонсы Google на конференции I/O 2021
18 мая Google провела конференцию I/O 2021, ...
Teknoloji
1 gün önce
Netflix выпустил трейлер мультсериала по Resident Evil
Видеостриминговый сервис Netflix опубликовал трейлер мультипликационного сериала ...
Teknoloji
1 gün önce
Lamborghini выпустит электромобиль после 2025 года
Итальянский производитель суперкаров — компания Lamborghini анонсировала ...
Teknoloji
3 hafta önce
В Google Photos появились поисковые фильтры
В сервисе Google Photos появилась кнопка, предназначенная ...
Teknoloji
3 hafta önce