Kekemelik Forum

Tam Versiyon: Apple, kekeleyen kullanıcıları tespit etmek ve uyum sağlamak için Siri'yi eğitiyor
Şu anda tam olmayan bir versiyonun içeriğine bakıyorsunuz. Tam versiyon'a bakınız.
Apple, araştırma ve podcast kataloğunu kullanarak kekeleyen kullanıcıları tespit etmek ve bunlara uyum sağlamak için Siri'yi eğitiyor

Apple, alışılmadık konuşma kalıplarına sahip kullanıcılar için Siri ses asistanını geliştirmenin yollarını araştırıyor, şirket Wall Street Journal'a doğruladı . Rapora göre Apple, Siri'yi kekemelikle konuşan kullanıcılara uyum sağlaması için eğitebilecek konuşma örnekleri için podcast kitaplığından yararlanıyor.

Wall Street Journal raporundan haberler :
Alıntı: Apple çalışanları tarafından bu hafta yayımlanacak bir araştırma makalesine göre, şirket şimdi birisinin kekemelikle konuşup konuşmadığını otomatik olarak nasıl tespit edeceğini araştırıyor ve bunu yapmaya yardımcı olması için kekemeli podcast'lerden 28.000 ses klibi oluşturdu. Wall Street Journal tarafından görüldü.
Şimdilik Apple, Siri ile etkileşimde bulunmak için bir yöntem olarak Hold to Talk özelliğine güveniyor, ancak ses asistanı ayarlandığından daha yavaş konuşma düzenleriyle kullanıcıları kesmeden, ancak bir cihazla fiziksel olarak etkileşim her zaman uygun değil.
Siri, iPhone'larda, iPad'lerde ve Mac'lerde ve özellikle HomePod ve HomePod mini'de “Hey Siri” sesli komutunu takiben bir istek kullanılarak sesle etkinleştirilebilir. Ancak kekeleyen kullanıcılar için, Siri'nin şu anki sürümü, konuşmadaki duraklamaları genellikle bir sesli komutun sonu olarak yorumlar. Bu da, sesli asistanın bir müşteri koleksiyonu için tam potansiyeline ulaşmasını engeller.
Sitenin arkadaşı Steve Aquino, WSJ raporunda atıfta bulunulan Apple araştırma makalesine işaret etti .


İşte Apple'ın araştırmasının özeti:
Alıntı: Konuşmadaki kekemelik olaylarını otomatik olarak algılama yeteneği, konuşma patologlarının bir bireyin zaman içindeki akıcılığını izlemesine veya atipik konuşma kalıplarına sahip kişiler için konuşma tanıma sistemlerini iyileştirmeye yardımcı olabilir. Bu alana artan ilgiye rağmen, mevcut kamuya açık veri kümeleri genelleştirilebilir akıcılık algılama sistemleri oluşturmak için çok küçüktür ve yeterli ek açıklamalardan yoksundur. Bu çalışmada, bloklar, uzatmalar, ses tekrarları, kelime tekrarları ve araya girmeler dahil olmak üzere beş olay türü ile etiketlenmiş 28 binden fazla klibi içeren bir veri kümesi olan Podcastlerdeki Kekemelik Olaylarını (SEP-28k) tanıtıyoruz. Ses, büyük ölçüde kekeme olan diğer insanlarla röportaj yapan kekeme insanlardan oluşan halka açık podcast'lerden gelir. SEP-28k ve genel FluencyBank veri kümesinde bir dizi akustik modeli kıyaslıyoruz ve eğitim verisi miktarını artırmanın göreceli algılama performansını her birinde% 28 ve% 24 F1 oranında nasıl iyileştirdiğini vurguluyoruz. Her iki veri kümesindeki 32 binden fazla klipten ek açıklamalar herkese açık olarak yayınlanacaktır.
Araştırma makalesi, Siri'yi akıcılık için ayarlamaya yönelik mevcut yaklaşımın bir yaklaşım olduğunu, dil modellerini ve diğer yöntemleri kullanarak çabayı geliştirme fırsatı olduğunu kabul etti.
Son olarak Apple, şu anki araştırması kekeleyen kullanıcılara odaklanırken, gelecekteki araştırmaların dizartri gibi farklı özelliklere sahip diğer kategorileri keşfetmesi gerektiği sonucuna varıyor.


https://www.wsj.com/articles/tech-firms-...1614186019
https://9to5mac.com/2021/02/25/apple-sir...detection/