Sesi yazıya, yazıyı sese çeviren program

Sesi yazıya, yazıyı sese çeviren program

Üniversite ve sanayi işbirliğinin başarılı örneği şirket, tamamen yerli mühendisler tarafından hazırlanan yazılımıyla bilgisayarlarda klavye kullanımını son verebilir.

Türkiye’de ve dünya çapında ilkleriyle, üniversite ve sanayi işbirliğinin başarılı örneklerinden ve tamamen yerli mühendislerden oluşan Sestek, GVZ FreeTalk ile kalemi rafa kaldırıp, klavyeleri çöpe attırmaya hazırlanıyor..

İnovatif ve farklı çözümleriyle geleceğin teknolojisi üzerine çalışan şirket “sesi yazıya, yazılı metni sese çeviren ve bilgisayarı sesle kumanda etmeye yarayan yazılımı” ile alışkanlıkları değiştireceği iddiasında.

GVZ FREETALK NEDİR?

Yazılım bilgisayar ve mikrofonla çalışıyor. Dışarıdan yüklenen ses dosyalarını, ses kayıtlarını tanıyıp, yazıya çeviriyor. Konuşmaları yazıya döküyor, elektronik ortamdaki metinlerin anlaşılabilir bir biçimde ve ‘insan sesi’ doğallığında seslendirilmesini sağlıyor.

Yazılım sayesinde, bilgisayarda ‘yazı yazılabilen, tüm office uygulamalarının yanı sıra, ‘internet explorer’da, hesap makinesinde ve Dos uygulaması gibi yazı yazılabilen alanlarda kullanılıyor.

Bununla da kalmıyor, ‘facebook’, ‘twitter’ gibi sosyal ağların yanı sıra ‘msn messenger’ ve ‘Skype’ gibi uygulamalarda da kullanılıyor. Kısacası bilgisayarda yazı yazılabilen her alanda çalışıyor. Yazılım bazı faks cihazlarıyla da uyumlu sesle faksı kontrole imkân sağlıyor.

Speech to Text Ailesi adı verilen bu yazılım doktorlardan hukukçulara, öğrencilerden işadamlarına, öğretmenlerden, yazarlara ve gazetecilere kadar geniş bir kesime hitap ediyor.

Yazılımın FreeTalk çeşidi normal kullanıcılara yönelik iken MediTalk doktorlara, JustTalk da avukat, hakim kullanve savcılara hitap ediyor. Patoloji, radyoloji ve kardiyoloji gibi uzmanlık alanlarındaki doktorlar için sadece o alanda eğitilen yazılım yalnız doktorların dilini konuşuyor. Hukukçulara yönelik olarak hâkim, savcı ve avukatlar için hazırlanan JustTalk adı verilen yazılım hukuki terimlerle zenginleştirilmiş!

Haber 7 Ekonomi Editörü Hakan Göksel; Sestek Direktörü Serdar Karadayı ile sesi yazıya çeviren GVZ Free Talk hakkında konuştu. Karadayı ‘konuşmayı yazıya dökme’nin çok geniş bir kavram olduğundan bahsetti.

Karadayı, Sistemin ABD de yıllardır kullanıldığı bilgisini verdi. İngilizce’nin yaklaşık 65 bin kelimeyle konuşulan kolay bir dil olduğunu, sondan eklemeli ve cümle yapılarının Türkçe’deki kadar devrik olmadığını hatırlattı.

Türkçenin zor bir dil olduğunu söyleyen Karadayı, Türkçe’de sadece “gözüm” kelimesinden 4 bin kelime türetilebildiğini söyleyerek yazılımın mantığını şöyle özetledi “Örneğin ‘gözüm’ dediğinizde ve bilgisayar ‘gözün’ yazdığında, bizce yüzde 80 doğru yazıyor sizce yüzde 0, çünkü sonuç anlam beklentilerinizi karşılamıyor.”

Kim konuşursa konuşsun sesi algılıyor yazıyor”

Yazılım, konuşmacıdan bağımsız çalışıyor. Kim konuşursa konuşsun sesi algılıyor ve yazıya çeviriyor. Karadayı, yazılımın 400 kelimelik ve en fazla bir saat süren ses alıştırılmasıyla başarı şansının çok daha yükseleceğini söylüyor.

kullanKaradayı sistemle ilgili olarak şunları aktardı“ Aslında bu bir akıllı sistem. Konuşmacıdan bağımsız çalışıyor ve kim konuşursa konuşsun sesleri algılıyor ve yazıya çeviriyor. Yapılacak ses alıştırmalarıyla yazılımın başarı yüzdesini arttırmak da mümkün.

Arkada bir sözlüğü olduğunu düşünün, kök-ek tanıma mimarisine sahip… MediTalk’ta sözlük biraz kısıtlı, onların zaten diyecekleri sınırlı. Doktorlar arasında ürünün ihtiyaç boyutu çok yüksek özellikle Patoloji, Radyoloji ve Kardiyoloji gibi uzman doktorlar zamanlarının çoğunu rapor yazmaya ayırıyor ama bu yazılım sayesinde artık zamandan tasarruf edebiliyorlar.

Ama FreeTalk’ta da güncel yaşam kelimeleri var. Eğer söylediğiniz kelimeleri yazmıyorsa bunu sözlüğe ekleme şansız var. FreeTalk’ın ayrıca şöyle bir özelliği var, örneğin gitmek fiili sözlükte yok mesela; bunun yerine git var. Önce git kelimesini alıyor sonra ona gelebilecek ekleri sıralıyor morfolojik olarak.”

Sesi yazıya dökerken başarıya etki eden faktörler

Karadayı yazılımın başarısından bahsederken “insanlarda aslında şöyle bir algı var. Neden yüzde 90 da yüzde 100 değil? Aslında bu imkânsız! Telefonla konuşulurken bile insan karşıdaki sesi yüzde 100 duyamaz. Örneğin ben Sestek’ten arıyorum diyorum, karşımdaki destek anlıyor. Yüzde 100 olamaz. Yüzde 90 bile büyük bir başarı. İnsan kulağı bile %95 duyar” diyor.

Karadayı ürünün başarısını etkileyen unsurları da şöyle anlatıyor: Kayıt alınan mikrofon kalitesi,kullan ortamdaki birden fazla sesin olması başarıyı etkiliyor. Anlaşılır ve tane tane konuşulduğu sürece ürünün başarısı artıyor.

Bunun yanı sıra ürünü bir de sesinizle eğittiğinizde başarı yüzdesi 5-6 puan artabiliyor. Çok hızlı konuşulduğu durumlarda yazılım zaman zaman karıştırabiliyor.

Konuşurken zaman zaman sesiniz yüksek ya da alçak çıkabiliyor, bu gibi durumlarda, önceden yapılan ses eğitimi, sesin içerisindeki frekansları algılayarak, ne kadar farklı ses tonuna sahipsiniz bu yönde eğitebiliyorsunuz.

En fazla birkaç saniye gecikmeyle yazıya döküyor

Normal günlük konuşmadaki hıza göre, en fazla birkaç saniye gecikmeli ve çoğu zaman anında yazabiliyor.

Windows uyumlu olan yazılım, bilgisayar işlemcisini biraz fazla kullanmasından dolayı özellikleri yetersiz bir bilgisayarda yavaş çalışabiliyor. Fakat bu yavaşlık üründen değil, işlemciden kaynaklanıyor. Bilgisayar ne kadar iyi ise sistem de o kadar hızlı çalışıyor.

Kullanamama alanların bunlarla da sınırlı değil, Twitter, Facebook, Google gibi uygulamalarda açma kapama ve yazı yazma işlemini gerçekleştirebiliyorsunuz.

Sadece sesi yazıya değil yazıyı sese de çeviriyor

Karadayı, programda sadece sesi yazıya dökme özelliğinin olmadığını, yazılı metinleri sese çevirme özelliğinin de olduğu belirtiyor. Örneğin herhangi bir makalenin sese çevrilip iPod gibi cihazlarla istenilen yerde dinlenebileceği bilgisini veriyor.

Bu anlatılan özelliklerin yalnızca ‘deşifre modu’na ait olduğunu, bunun yanı sıra ‘komut modu’ özelliğiyle bilgisayarı sesle yönetmeye imkân tanındığını aktarıyor. Üstelik sisteme “interneti aç, word’ü aç” gibi komutlar eklemek de mümkün!

kullanYazılım 1 yılda çok yok kat etti

Bu yazılımın yaklaşık 1-1,5 senedir piyasada olduğunu söyleyen Karadayı, ürünün ilk çıktığı döneme göre çok geliştiğini anlattı.

Karadayı “Ürünü ilk doktorlarla çıkartmıştık. Şu andaki durumu için ilk hali demek doğru olmaz. Ürün bir hayli gelişti. İlk çıkışı da başarılıydı. Ama biz şimdi daha hızlı yapabilir miyiz diye üzerinde uğraşıyoruz.

Örneğin kelime doğruluğu yüzde 70, harf doğruluğu yüzde 90, tüm çalışmalarımız, bunu nasıl artırabiliriz üzerine yoğunlaşıyor.

Zaman zaman da kullanıcı ara yüzünde değişiklikler yapıyoruz. Bunun yanı sıra başka hangi meslek gruplarını ekleyebiliriz diye çalışıyoruz. Aslında bu süreçte sadece arka plandaki sözcükler değişiyor. Terimler ekleniyor ” dedi.

“Biz arkada yapay zeka kuruyoruz”

Yazılma her türlü kelime veya terimler yüklenebiliyor olmasına rağmen neden farklı meslekler için ayrı ürünler ürettiklerini sorduğumuz Karadayı bu soruya şöyle cevap verdi:

Günlük konuşma için hazırladığımız yazılımımızı alıp terimler ekleyebilirsiniz fakat örneğin MediTalk gibi başarılı olmaz. İş sadece kelime eklemekle de bitmiyor. Biz aynı zamanda arkada akustik bir model kuruyoruz. Yani yapay zeka kuruyoruz, örneğin bu kelime buraya gelebilir, gelemez gibi…

Dilbilgisi kurallarını da uygulayabiliyor

Yazılımın, ‘kelime mi, harf mi yoksa cümle mi?’ analiz ettiğini sorduğumuz Karadayı, “Ar-Ge çalışmasında 2 temel metodu kullanabiliyorsunuz, bir kelime tanıma, bir de kök-ek mekanizması var. (Ama meslek grupları için daha doğru değil) bu mekanizma daha çok son kullanıcılar için ve bu sayede sözlükte bulunmayan kelimeyi çıkartabiliyoruz” diye cevap verdi.

Türkçe’de ğ, ç, ş gibi harflerin olduğunu bunlarla ilgili sorun yaşanıp yaşanmadığını sorduğumuzda Karadayı, “bunların tamamının sistemde tanımlanmamış olduğunu ve kök ek yöntekullanmi sayesinde sorun çıkmadan kullanılabiliyor” dedi.

Karadayı yazılımın, Türkçe’deki dilbilgisi kurallarıyla da uyumlu olduğunu, harf yumuşaması, harf ya da hece düşmesi gibi özelliklere rahatlıkla uyum sağladığını anlattı.

GVZ FreeTalk’ın fiyatı

Pazar alanının çok geniş olduğunu belirttiğiniz GVZ Free Talk’ın pazarlama stratejisiyle ilgili sorularımızı cevaplayan Karadayı, ürünü nihai kullanıcıya ulaştırmak için herhangi bir pazarlama stratejisine başvurmadıklarını söyledi.

Hastanelerle çalıştıklarını, Yargıtay ve Adalet Bakanlığı ile yoğun temaslarının olduğunu ve yazılımın 500-600 kadar hakim tarafından bireysel olarak kullanıldığı bilgisini verdi.

Ürünün fiyatının 150 lira ile 3000 lira arasında değiştiğini aktara Karadayı, bilgisayar şirketleri aracılığıyla nihai kullanıcılara ulaşmak istedikleri belirtti.

Basit olan yazılımda da profesyonel olanda da fiyatların uygun olduğunu söyleyen Karadayı, ürünle birlikte bir de profesyonel kulaklık da verdiklerini söyledi.

Ürün pazarı ile ilgili finansman sorunu olmadığını fakat perakende satışta ilgili fizibilite çalışması yapmadıklarını ifade etti. Reklam maliyetlerinin pahalı olması nedeniyle bireyselden çok kurumsal tarafa yatırım yaptıklarını aktaran Karadayı, daha önce Netokur programıyla ilgili bir bilgisayar üreticisi ile anlaşarak başarılı sonuçlar aldıklarını anlattı. Fakat bu ürün için henüz bir anlaşma sağlamadıklarını söyledi.

‘Sestek’te Amiral Gemisi Olacak Ürün Çok’

Ürün için agresif bir pazarlama politikası belirlemediklerini, Sestek bünyesinde amiral gemisi olabilecek daha başka ürünlerin de olduğunu, ağırlıklarını daha çok kurumsal tarafa verdiklerini anlattı. Fakat ilerde bir distribütör bulup onun agresif bir pazarlama stratejisi benimsemesini sağlayabileceklerini aktardı.

Çağrı merkezlerine yönelik çözümlerinden bahseden Karadayı, örneğin çağrı merkezine yapılan aramayı yazıya dökebilen, müşterinin o anki ruh halini analiz edebilen ürünler geliştirdiklerini anlattı.

Text To Speech adını verdiğimiz uygulama ile yazılı metni, insan sesine çok yakın bir şekilde çevirebiliyoruz. “

Ürünün cep telefonlarına yönelik versiyonları üzerinde de çalıştıklarını belirtilen Karadayı cep telefonundaki kayıtların da aktarılabileceğini fakat sesteki kalite kaybından dolayı çok büyük başırı beklenmemesi gerektiğinin altını çizdi.

SES TEKNOLOJİLERİ HOLLYWOOD’A DA GİRDİ

kullanSes alanında rakiplerinin bir elin parmaklarını geçmeyecek kadar az olduğunu, bu bağlamda daha çok -Amerikalı ve İsrailli şirketlerin faaliyet gösterdiği bildirdi. Yapılan iş yoğun bir know how gerektiriyor.

Sestek’in dünyada rakipsiz olduğu alanlardan biri Voice Conversion. Müzik ve film endüstrisinde kullanılıyor. Yazılımı Amerika için yapılıyor. Karşıdaki insanın sesini kendi dilinize çeviriyor. Lisans hakları Amerika’da olan ürünün patent hakkı ve yazılımı Türk bilimadamlarını ait. Kısaca yerli ses teknolojisi Hollywood’a da girmiş durumda. Bu yazılımda sinemalarda kullanılan alt yazılar yakında tamamen kalkacak. Altyazılar seslendirilecek ve seslendirilmiş hali oyuncunun bizzat kendi sesinden Türkçe bilmediği halde konuşuyormuş gibi verilebilecek. Bu yazılım dünyadaki ilk ticari patente sahip. Sestek’in yazılımını geliştirdiği ürünün pazarlanması milyonlarca dolar yatırım gerektirdiğinden Amerika tarafından yapılıyor. Gelecek yıllarda yurtdışına daha fazla açılmayı amaçlayan Sestek, Text To Speech adını verdikleri üründe, İngilizce ve Azerice versiyonlarından sonra Almanca, Rusça, İspanyolca, Farsça gibi dillerde de çıkartılacak.

Karadayı, bireysel anlamda hiçbir sıkıntılarının olmadığını, kurumsal müşterilerde 2000 yılından bu yana ‘yabancı iyidir’ algısıyla savaştıklarını ve bunu yıkmayı başarabildiklerini anlattı.

SESTEK ŞİRKETİ

Ses ve iletişim teknolojileri, çağrı merkezi uygulamaları ve müşteri hizmetleri otomasyonu alanlarında faaliyet gösteren Türkiye’nin en büyük ses teknolojileri şirketi Sestek, 2000 yılında kuruldu.

Tüm faaliyetlerini yoğun bir ar ge çalışması etrafında şekillendiren ileri teknoloji şirketi Sestek, silikon vadisinin Ar-Ge anlayışını türkiyede uygulayabilen ve üniversite ve sanayi işbirliğini sağlayan ender ve başarılı örneklerden …

Tamamı türk mühendislerden oluşan 35 kişilik uzman ekibiyle her yıl en hızlı büyüyen teknoloji şirketleri arasında yer alıyor.

2009 yılında 2,5 milyon TL ciro elde eden Sestek, 2010 yılında bu rakamı 4,5 milyon TL’ye taşıdı. Şirket 2011 yılında ise %50 büyüme hedefliyor.

Şirket, ses ve iletişim teknolojileri alanında bireyselden kurumsala geniş bir kullanıcı kitlesine en yeni ve en farklı çözümler sunuyor. Ürettiği çözümlerle hayatın kolaylaşmasına, yaşam standardının yükselmesine, iş verimliliğinin ve hizmet kalitesinin artmasına katkıda bulunuyor.Kalite, istikrar ve satış sonrası desteğiyle müşterinin beklentilerine en iyi şekilde cevap vermeyi amaçlayan şirket inovatif çözümleriyle geleceğin teknolojilerini müşterileriyle buluşturuyor.

Ses teknolojileri alanında uzman Prof. Dr. Levent Arslan ve Yrd.Doç.Dr. Murat Saraçlar önderliğindeki Sestek firması,bankacılıktan sağlığı çok farklı sektörlerde kurumsal ve bireysel çözümler sunuyor .

Şirket, kurulduğu 2000 yılından bu yana, alanında yeniliği hayata geçirdi. Bünyesinde dilbilim uzmanı görevlendiren şirket alanında çok daha nitelikli ve kesin sonuçlar alabilmek için seslendirme çalışmalarını özel ses stüdyosunda gerçekleştiriliyor.

Sestek, farklı alanlara yönelik geliştirdiği çözümlerin yanı sıra görme engellilerin hayatını kolaylaştıran çözümleriyle de dikkat çekiyor. Şirket görme engellilere yönelik ürün gamının yöneticiliğini de eski Altınokta Körler Derneği Başkanı Çağrı Bey’e yaptırıyor. Şirketinin geliştirdiği özel yazılımlar, 80000 görme engelli vatandaşın bilgisayarlarında kullanılıyor.

Sestek Kilometre Taşları

2001 Türkiye’nin ilk konuşma tanınma uygulanması

2001 Görme engellilere yönelik dünyanın ilk Türkçe konuşan yazılımı (Netokur)

2001 Türkiye’nin ilk sesli bankacılık uygulaması (koçbank-fonobank hisse döviz )kullan

2002 Dünyanın ilk konuşmacı dönüştürme uygulaması

2002 Türkiye’nin ilk bütünleşik mesaj sistemi (THY-Unified Messaging)

2002 Dünyanın ilk Türkçe bilgisayar kumanda yazılımı (Komutanlar )

2003 Türkiye’nin ilk sesle kumanda edilebilen beyaz eşya entegrasyonu (Arçelik )

2004 Türkiye’nin ilk Türkçe uyumlu, Cisco IP santral ile entegre otomatik operatör- Voice Mail entegrasyonu

2005 Türkiye’nin ilk TTS (text to speech) ile seslendirilen internet gazetesi (Sabah)

2006 Türkiye’nin ilk TTS (text to speech) ile müşterilerin otomatik aranması ve işlem yaptırılması projesi

2007 Sestek-GVZ birleşmesi

2007 Türkiye’nin ilk SR+TTS teknolojileriyle entegre VAS Servisi (Turkcell 8080 finans hattı )

2008 Dünyanın ilk Türkçe Speech Analytics yazılımı

2009 Karel santrallere entegre voice mail yazılımı

2010 Konuşma tanıma yazılımı ve müşteri temsilcisinin güçlerini birleştirerek sağladığı müşteri memnuniyeti ve maliyet avantajı ile çağrı merkezlerinde çığır açan Seamless Agent yazımı

*****

EDİTÖR NOTU: BU METNİN TAMAMI SESLE GVZ FREETALK ARACILIYLA YAZILMIŞTIR!!! Haber7.com