Giriş: Evrensel İletişim Araçlarının Kullanılabilirliği ve Sağlık Hizmetlerine Etkisi
Herkesin kendi dilinde anlamasına ve anlaşılmasına izin vermek, insanlık için en önemli zorluklardan biridir. Bunu başarmak, insanlar arasında benzeri görülmemiş bir işbirliğini kolaylaştıracaktır. Örneğin, bilimsel araştırmaların yayınlandığı anda her araştırmacının dilinde mevcut olduğunu hayal edin. Global bir dil hizmetleri sağlayıcısı ve yapay zeka destekli çeviri hizmetlerinin öncüsü olan Translated’te yürüttüğümüz araştırmaların kanıtladığı gibi, bundan çok uzak değiliz. Bu çığır açan araştırma, Amerika’da Makine Çevirisi Derneği’nin (AMTA) Orlando’daki son yıllık konferansında sunuldu.
Dünyanın en iyi profesyonel çevirmenlerinden 136.000 ‘inin otomatik çeviri yazılımı (makine çevirisi) tarafından işlenen 2 milyar cümleye yaptığı düzenlemeleri analiz ederek, tarihte ilk kez çevirideki tekilliğe yaklaşma hızımızı ölçebildik. En iyi performans gösteren profesyonel çevirmenler, makine çevirisi (MT) tarafından üretilen bir çeviriyi akranları tarafından tamamlanan bir çeviriyi düzeltirken aynı zamanı harcadıklarında tekilliğe ulaşılır.
Tıp alanında, dil engellerini aşmak diğer alanlardan daha etkilidir. Bu engeller, hastaların klinik durumlarını net bir şekilde anlamalarını engeller, böylece gerekli tedaviye doğru bir şekilde uymalarını zorlaştırır. Buna ek olarak, bu engeller, imkansız olmasa da, doktorların tanı ve araştırma için gereken veri ve bilgileri korumak ve sınırlamak için gerekli rızayı almalarını zorlaştırmaktadır. Bugün, birçok büyük sağlık kurumu tercüman hizmetleri sunmaktadır, ancak bunlar önemli maliyetlere sahiptir. Bu nedenle, tıp sektöründeki çoğu kuruluş hala akıllı telefon uygulamaları gibi kültürel arabulucuları veya DIY çözümlerini yeniden yapılandırıyor. Covid19 pandemisi bu sorunu ele alma ihtiyacını her zamankinden daha önemli hale getirmiştir. Avrupa Komisyonu’na göre1, pandemi sağlık sektöründe çeviri talebini % 49 artırdı. Neyse ki, teknolojik gelişmeler sağlık topluluğunu dil engellerini aşmanın bir yolu olarak makine çevirisine bakmaya zorluyor ve evrensel iletişim araçları reklam eşitliği desteği sağlayacak kadar yakın.
Makine çevirisinin sağlık sektörü üzerinde radikal bir olumlu etkisi olacağını umuyoruz. Potansiyel uygulamalar üç ana alandadır:
– General için bilgi çevirisi
– Bilimsel makaleler, patentler ve hastalık raporları gibi uzman yayınların çevirisi. Bu, küresel araştırma çalışmalarına ve gerçek dünya verilerine (örneğin klinik araştırmalar ve ilaç keşfi) erişim sağlayacaktır.
– Sorunsuz doktor hasta iletişimi ve hasta geri bildirimlerinin toplanması, sosyal medyada gerçekleşen tartışmalardan bile burada, MT’yi otomatik konuşma tanıma (ASR) ve konuşma (TTS) teknolojilerini konuşulan dili desteklemek için birleştirebiliriz.
Bununla birlikte, makine çevirisi, yalnızca çeviri uzmanları tarafından yapılan çeviriler kadar iyi çeviri sağladığında sağlık hizmetlerinde iyi performans gösterecektir. Translated olarak, 2011 ‘den beri MT kalitesini izliyoruz ve son zamanlarda, insan kalitesinde makine çevirisi sunmaktan ne kadar uzak olduğumuzu ölçmek için topladığımız büyük miktarda veriyi kullanmaya karar verdik. Çevirideki tekilliğe ulaştığımızda, gerçek zamanlı otomatik çeviriyi hemen hemen her yardımcıya çok erişilebilir bir maliyetle entegre edebiliriz.
Makine Çevirisinin Kısa Tarihi
Otomatik çeviri kavramı ilk kez 9. yüzyılda bir Arap kriptografın, inanılmaz derecede hala alakalı olan sistematik dil çevirisi tekniklerini tanıtmasıyla ortaya çıktı2. Bununla birlikte, makine çevirisinin ilk halka açık gösterimi 1954 ‘te Amerika Birleşik Devletleri’nde3yapıldı. Küçük bir deneydi, ancak araştırmacıları ilerlemeye teşvik etti. İlk sistemler, iki dilli sözlüklere ve kelimelerin veya cümlelerin bir kaynak dilden bir hedef dile nasıl çevrileceğini belirten kurallara dayanıyordu. Daha sonra istatistiksel bir yaklaşım geliştirildi: büyük hacimli insan çevirilerini analiz ederek, makineler hedef dildeki bir ifadenin eşdeğerliğini tahmin etmeye başladı. Odaklanmış örüntü öğrenme ve örüntü tahmin yaklaşımı, 2000 ‘lerin başında Google Translate’in ilk sürümünü yönlendirdi.
Bugün, Google Translate ve en gelişmiş makine çevirisi motorları, nihai çıktıları öğrenmek ve tahmin etmek için derin öğrenme tabanlı sinir ağı modellerine güveniyor. Bu, örüntü algılama ve tahminlemenin daha derin ve daha güvenilir bir şeklidir. Bu tür bir sistemde, çeviri, tüm kaynak cümleyi ve daha önce sağlanan çeviriyi göz önünde bulundurarak, bir kerede bir kelimeyi tahmin etmek için eğitilmiş tek bir dizi modeli tarafından üretilir.
2017 yılında Translated, Fondazione Bruno Kessler, Edinburgh Üniversitesi ve TAUS’tan oluşan bir konsorsiyum, ilk uyarlanabilir makine çevirisi ModernMT4’ütanıttı. Başlangıçta Avrupa Birliği tarafından desteklenen bir araştırma projesiydi daha sonra5 açık kaynaklı yazılım ve Translated tarafından desteklenen ticari bir hizmet haline geldi. Bu yeni modelde MT, çeviri modelini yeniden eğitmeden çevirmenin düzeltici geri bildirimlerinden gerçek zamanlı olarak öğrenir. Uyarlanabilir makine çevirisi fikri, Translated, Fondazione Bruno Kessler, Edinburgh Üniversitesi ve Le Mans Üniversitesi tarafından yürütülen ve yine Avrupa Birliği tarafından desteklenen önceki bir araştırma projesine kadar6uzanıyor. İlk fikir, makine çevirisi sonuçlarını düzenlemek ve yerelleştirme iş akışlarını yönetmek için bir araç oluşturmaktı. Araştırmanın amacı, çevirmenlerin düzeltmelerinden öğrenebilen ve zaman içinde otomatik olarak gelişebilen bir MT sistemiydi. Çözümün MT bileşeni daha sonra 2014 yılında açık kaynaklı yazılım olarak piyasaya sürülen düzenleme aracına odaklanmak için ayrıldı. Avrupa Komisyonu, projeyi Yedinci Çerçeve Programı tarafından finanse edilen en yüksek inovasyon potansiyeline sahip olanlar arasında yer aldı. Translated, araştırma prototipini daha da geliştirdi ve şirketin özel üretim aracı olarak benimsediği bilgisayar destekli çeviri aracı ve MT düzenleme yazılımını kullanmak için ücretsiz bir ticari sürüm olan Matecat 7′ yiyarattı. Matecat ve ModernMT ile Translated, insan yaratıcılığı ve makine zekası arasında mükemmel bir simbiyoz için çok zorluyor: Yedekli görevleri kaldırarak, AI profesyonellerin dilin nüanslarına odaklanmasına ve çevirinin kalitesini artırmasına izin veriyor. Bu sinerji, MT öğrenmeye devam ederken dilbilimcilere daha iyi öneriler sunar. Birlikte, her gün daha verimli, uyum sağlayabilen ve uygun maliyetli hale gelirler.
Süreç ve Toplanan Veriler Hakkında
2011 yılında Translated, MT kalitesini doğru bir şekilde değerlendirmek için son derece güvenilir bir metrik üzerine standartlaştırılmış ve yerleşmiştir. Buna Düzenleme Zamanı (TTE) diyoruz: Bu, MT tarafından önerilen çevirileri kontrol etmek ve düzeltmek için en iyi performans gösteren profesyonel çevirmenlerin ihtiyaç duyduğu kelime başına ortalama süredir. Bu, endüstride hala kullanılmakta olan otomatik tahminlerden insan bilişsel çabasının ölçümlerine geçmeyi mümkün kılar ve kalite değerlendirmesini görevden geleneksel olarak sorumlu kişilere yeniden atar: profesyonel çevirmenler. Neredeyse on yıldır Time to Edit’i takip ediyor, literatürden teknik çeviriye ve konuşma transkripsiyonu gibi MT’nin hala mücadele ettiği alanları içeren birden fazla konu alanında çalışan dünya çapında 136.000 profesyonel çevirmen tarafından etkili bir şekilde çevrilen cümleler üzerinde 2 milyardan fazla düzenleme topluyoruz. Dilbilimciler, son yirmi yılda şirketle çalışan 300.000 ‘ 8 denfazla serbest çalışan üzerinde çalışma performansı ve yeterlilik verilerini toplayan TRank adlı tescilli AI kullanarak tamamladıkları belirli işler için seçildi. AI, özgeçmiş eşleşmesi, kalite performansı, zamanında teslimat kaydı, kullanılabilirlik ve alana özgü konu alanlarındaki uzmanlık dahil olmak üzere 30 ‘dan fazla faktörü dikkate alır.
Matecat’ta çalışan çevirmenler, seçtikleri MT motoru tarafından sağlanan çeviri önerilerini kontrol eder ve doğrular. Veriler başlangıçta Google’ın istatistiksel MT’si (2015 -2016), ardından Google’ın sinirsel MT’si ve en son olarak 2018 ‘de tanıtılan Modern MT’nin uyarlanabilir sinirsel MT’si kullanılarak toplandı ve bu da hemen hemen tüm çevirmenlerimiz arasında tercih edilen seçenek haline geldi. Translated, yedi yıldan uzun bir süredir bir kelimeyi sürekli olarak düzenlemek için ortalama süreyi topluyor.
Numuneyi hassaslaştırmak için yalnızca aşağıdakileri dikkate aldık:
– Yüksek kalitede teslim edilen tamamlanmış işler.
– Metnin daha önce çevrilmiş bölümlerinin veritabanlarından eşleşmeyen MT önerileri içeren cümleler.
Hedef dilin kanıtlanmış MT verimliliği ile birlikte çok miktarda veriye sahip olduğu işler (İngilizce, Fransızca, Almanca, İspanyolca, İtalyanca ve Portekizce).
Ortaya çıkan cümle havuzundan şunları çıkardık:
– TTE hakkında bilgi vermedikleri için herhangi bir düzenleme almayan cümleler ve kesintiler ve/veya alışılmadık derecede yüksek karmaşıklık önerdikleri için kelime başına 10 saniyeden fazla süren cümlelerin düzenlenmesi. Bu iyileştirme, TTE karşılaştırmasını birden fazla üründe mümkün kılmak için gerekliydi.
– Tek bir dilin varyantları arasındaki çeviriler (örneğin, İngiliz İngilizcesi’nden Amerikan İngilizcesine) gibi yerel ayarlara uyarlama üzerinde çalışın, çünkü bunlar sorunu temsil etmemektedir.
– Büyük müşteri işleri, çünkü TTE performansının ortalamadan çok daha iyi olduğu son derece özelleştirilmiş dil modelleri ve çeviri bellekleri kullanıyorlar.
Düzenleme Süresi, MT kalitesi dışındaki iki ana değişkenden etkilenir: düzenleme aracının gelişimi ve çevirmen tarafından sağlanan kalite. Bu iki faktörün etkisi, gözlemlediğimiz uzun vadeli iyileşme eğilimi göz önüne alındığında ihmal edilebilir olarak kabul edilebilir.
Çeviride Tekilliğe Yaklaşan Şaşırtıcı Bir Doğrusal Eğilim
Grafik olarak çizildiğinde, TTE verileri şaşırtıcı derecede doğrusal bir eğilim gösterir. Bunu açıklamak için ilk hipotezimiz, kalite açığını kapatan koğuşlara giden her ilerleme biriminin önceki birimden katlanarak daha fazla kaynak gerektirdiği ve buna göre bu kaynakları dağıttığımızdır: hesaplama gücü (her iki yılda bir ikiye katlama), veri kullanılabilirliği (Nimdzi Insights’a göre yıllık % 6.2 ‘lik bir bileşik büyüme hızında kırışıklıklara çevrilen kelime sayısı) ve makine öğrenimi algoritmalarının verimliliği (eğitim için gerekli hesaplama, OpenAI’ye göre 2012 -2019’ dan 44 kat iyileştirme)9).
Şekil 1.
Sonuç: Dil Engellerini Aşmaya Ne Kadar Yakınız?
Makine çevirisi kalitesindeki ilerleme mevcut eğilimle devam ederse, yaklaşık altı yıl içinde en iyi performans gösteren profesyonel çevirmenler, makine çevirisi tarafından üretilen bir çeviriyi akranları tarafından tamamlanan bir çeviriyi düzeltirken aynı zamanı harcayacaklardır. Çeviride tekilliğe ulaşacağımız kesin tarih biraz değişebilir, ancak eğilim açıktır. Bu nedenle, dil engellerini kıracak, müşterilerin sağlık sonuçlarını iyileştirmemize ve ölüm riskini azaltmamıza olanak tanıyan gerçek zamanlı, evrensel, erişilebilir çeviri araçları sağlamaya yakınız.
Bir araştırma açısından bakıldığında, Translated’in MT kalitesindeki ilerleme hakkında sağladığı kanıtlar, genel olarak hem MT hem de AI topluluklarında görülen ölçekteki başarının en zorlayıcı kanıtıdır. Gerçekten de, birçok yapay zeka araştırmacısı, dil çeviri problemini çözmenin yapay genel zeka (AGI) üretmeye eşdeğer olduğunu düşünmektedir. Translated’in keşfi, tarihte ilk kez, yapay zekadaki tekilliğe yaklaşma hızımızı, yapay zekanın insan zekasını aştığı varsayımsal gelecek noktasını nicelleştirdi.