YTÜ DSpace Kurumsal Arşivi

Gizli Markov modeli ile geniş sözlüklü sürekli konuşma tanıma

Basit öğe kaydını göster

dc.contributor.advisor Yrd. Doç. Dr. M. Elif Karslıgil
dc.contributor.author Uslu, Erkan
dc.date.accessioned 2018-07-24T10:56:03Z
dc.date.available 2018-07-24T10:56:03Z
dc.date.issued 2007
dc.identifier.uri http://localhost:6060/xmlui/handle/1/7297
dc.description Tez (Yüksek Lisans) - Yıldız Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2007
dc.description.abstract Bilgisayar bilimlerinde ses ile ilgili çalısmalar genel olarak üç ana baslık altında toplanabilir:bunlar konusma tanıma, konusmacı tanıma-doğrulama ve konusma sentezlemedir. Anabaslıklardan konusma tanıma ile makine-bilgisayar tarafından insan konusmasının anlasılmasıveya bundan bilgi çıkarımı hedeflenmektedir.Bu tez çalısmasında çok boyutlu bir tanım uzayına sahip olan konusma tanıma probleminingenis sözlüklü sürekli konusma tanıma gereksinimlerini karsılayacak sekilde çözümüneyönelik bir uygulama gerçeklestirilmistir. Mel Frekans Kepstral Katsayı (MFKK) özellikçıkarımı ve Gizli Markov Modeli (GMM) ile özellik sınıflandırılması bu çalısmanın temeladımlarını olusturmaktadır.MFKK özellikleri konusmacı bağımsız olarak ses verisine iliskin özelliklerin ortayakonmasında etkili bir yöntemdir. GMM de ardısıl özelliklerin gelis sırası dikkate alınaraksınıflandırılmasını sağlayan bir yöntemdir.MFKK özellik çıkarım adımlarının ses verisine uygulanması ile reel değerlikli özellikvektörleri elde edilir. MFKK katsayılarına K-ortalama yönteminin uygulanması ile tekboyutlu ayrık değerlikli bir özellik uzayına geçilir.Herbir fon için dört durumlu, soldan sağa, ayrık çıkıs olasılıklarına sahip GMM temelmodelleri uygun ilk durumları verilerek olusturulur. Eğitimde kullanılan ses verisine iliskinçözümleme doğrultusunda temel GMM'ler bir araya getirilerek sesler arası geçis sayılarınagöre olasılıklandırılırlar. Tüm eğitim seti üzerinde Baum-Welch algoritması çoklu gözlemdurumu dikkate alınarak uygulanır ve tüm temel GMM'ler için model parametrelerigüncellenir. Kullanılan yaklasım ile GMM modelinin eğitim asamasında ses üzerindeetiketleme, bölümleme, kelime baslangıcı ve bitisi isaretleme gereği olmadan ses verisineiliskin istatistiki yapı elde edilebilmektedir.Sistem basarısı iki farklı kelimeyi ayrık olarak tanıma, çok sayıda kelimeyi ayrık olaraktanıma, kısıtlı sayıda tekrarlı kelimeleri sürekli konusma yapısında tanıma, sürekli konusmayapısında cümle tanıma deneysel kurguları üzerinde incelenmistir.Anahtar Kelimeler: Genis sözlüklü sürekli konusma tanıma, Gizli Markov Modeli, MelFrekans Kepstral Katsayıları.
dc.subject KONUŞMA TANIMADA KULLANILAN YÖNTEMLERE GENEL BAKIŞ
dc.subject FONETİK
dc.title Gizli Markov modeli ile geniş sözlüklü sürekli konuşma tanıma
dc.type Tez


Bu öğenin dosyaları

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster