Konuyu görüntüle
IUCODERS FORUM > Programlama > .NET > sesi yazıya çevirme
Yazar
blackout


avatar

Kayıt: 11.12.2008
26.05.2009-13:00 #60384
Sesi sayısal değere dönüştüren sistem donanımsaldır. Yani ses bilgisayara aktarıldığında zaten bu dönüşüm gerçekleşmiş olmalı. thinking
http://en.wikipedia.org/wiki/Analog-to-digital_converter

Matlab'de sanırım değerlerin analiz edilebilmesi söz konusu. Quantization ve özellikle dijital sinyal işleme konularını yalayıp yutman gerekebilir :/

http://www.dspguide.com/
Burada da digital signal processing ile ilgili bir e-book var.


Elindeki iş aslında çok zevkli fakat kolay bir iş değil... Zor olsa da sen umudunu yitirme :)





Yazar
akgulozkan


avatar
istanbul
Kayıt: 12.12.2006
26.05.2009-14:54 #60386
sesi sayısal olarak analiz edebilirsin tabiki.. Mikrofona konuştuğumuzda mikrofon anolog bir işaret üretir. Analog işaret ses kartında örneklenir ve sonrada kuantalanır. Örnekleme frekansı genellikle CD kalitesi için 44 kHz civarındadır. Kuantalama işlemi sesin hangi kalitede sayısal değere çevrilmesi ile ilgilidir. Yani netice de ses kartından alınan değerler sayısaldır. Matlab yardımı ile ses kartından örnek alabilirsin. Benim fikrim önce heceleri bir bir okuyup (işin hamallığı ) bunlardan bir veri havuzu oluşturman gerekiyor. (iş aslında baya bi zor) bu veri havuzundaki veriler ile (ki matrislerin boyutları - örnekleme frekanslarının ve ses kalitesinin her hece için aynı olduğu düşünülürse- eşit olmalıdır, ki bu da hecenin süresine bağlıdır.. Dolayısı ile öncelikle ses içerisinde heceleri tesbit edecek bir sistem geliştirmelisin ki bence baya zor, bundan sonra heceleri veri havuzundaki süresi aynı olan (boyutu) hecelerle karşılaştırmalısın. ) yapılacakları sıralarsak (benim yorumum)

1. Önce temel heceleri kaydet ve bir veri havuzu oluştur. (matrislerden oluşan sayısal bir veri havuzu- bunu matlab ile yapabilirsin)
2. Dönüştürülmesi istenen ses verisinde hecelerin tesbiti için bi yöntem geliştir. biggrin (ki en zoru belki de imkansızı bu. biggrin belki bu sebeple çözüm patlayacak biggrin )
3. Ondan sonra iki matris (söylenen hece ile veri havuzundaki hece) arasındaki ilişkiyi bul.. Birden fazla eleman arasındaki korelasyonları hesapla ve bi minimum değerden büyük korelasyonları seç. (korelasyonu matlab da bulabilirsin diye düşünüyorum) Ve böylelikle birbirine en çok benzeyen heceyi seç.
4. Her matrise (heceye) bir karakter dizisi (yazı parçası) önceden ver.
5. Böylelikle yazmış olursun..

Kabaca (hatta en kaba ) yöntem bu.. Öğrenme yok, gelişme yok. Yapay zekaydı falandı filandı, benzeri şeyleri de ekleyebilirsin. Ama işin tamamı matrislerde geçicek ondan eminim wink
Kolay gelsin (tam anlamıyla kolay gelsin biggrin )





Yazar
blackout


avatar

Kayıt: 11.12.2008
26.05.2009-15:47 #60388
Dilimizde heceler sessiz harfler ile bir birinden ayrılır ve sessiz harflerin de (adı üstünde) sesi yoktur. Buradan yola çıkarak heceleri şiddet/zaman grafiğini belirli dB altında kalan bölümlerden keserek ayırt edebilmek mümkün. Fakat bu işin sadece kabası. Tahmin ediyorum ki %50 civarında doğru sonuç verebilir. Bunun dışında; hangi harfin yaygın olarak ağızdan hangi şiddet ve frekanslarda çıktığını araştırmak lazım. Bu araştırmadan elde edilecek bir veri bankası hece ayırt etmede çok işine yarayabilir.

Tabi bunları analog ses analizi açısından söylüyorum. Bunu dijitale uyarlamak gerekir.





Yazar
akgulozkan


avatar
istanbul
Kayıt: 12.12.2006
26.05.2009-16:25 #60390
blackout yazdi
 
Dilimizde heceler sessiz harfler ile bir birinden ayrılır ve sessiz harflerin de (adı üstünde) sesi yoktur. Buradan yola çıkarak heceleri şiddet/zaman grafiğini belirli dB altında kalan bölümlerden keserek ayırt edebilmek mümkün. Fakat bu işin sadece kabası. Tahmin ediyorum ki %50 civarında doğru sonuç verebilir. Bunun dışında; hangi harfin yaygın olarak ağızdan hangi şiddet ve frekanslarda çıktığını araştırmak lazım. Bu araştırmadan elde edilecek bir veri bankası hece ayırt etmede çok işine yarayabilir.
Tabi bunları analog ses analizi açısından söylüyorum. Bunu dijitale uyarlamak gerekir.


peaceaynen dostum.. sayısal olarak da matlab iyi bir araç..





Yazar
extreme


avatar
Kahramanmaras
admin
Kayıt: 24.10.2006
26.05.2009-16:36 #60392
orhan yazdi
 
bu söylediğin şeyin ne kadar zor olduğu hakkında bir fikrin yok sanırım : )
<br>


Bitirme olacaksa böyle olmalıdancing. Bu gelecek seneye dimihypnotized





The Man Who Loved Algorithm&Ubuntu.
www.burakamasyali.com





Yazar
insomniac


avatar

Kayıt: 12.03.2006
26.05.2009-17:09 #60393
evet proje iki dönemlik. bu dönem arastırma seneye sonuç bekliyorlar. araya yaz tatilinin girmesi güzel .





Yazar
extreme


avatar
Kahramanmaras
admin
Kayıt: 24.10.2006
26.05.2009-17:13 #60394
Bende başlasam iyi olacak araştırmalarad oh





The Man Who Loved Algorithm&Ubuntu.
www.burakamasyali.com





Yazar
smmm


avatar

Kayıt: 21.12.2012
21.12.2012-18:25 #78655
benimde böyle bir projem var matlab ile gerçekleştircem.sesi texte çeviren program siz yapabildinz mi???





1 2
Del.icio.us
Digg
Facebook
Furl
Google
Blink
Simpy
Spurl
Y! MyWeb