İçeriğe atla

Ses analizi

Ses analizi ya da Konuşma analizi, iletişimi ve gelecekteki etkileşimi iyileştirmek için müşteri bilgilerini toplamak üzere kaydedilen çağrıları analiz etme sürecidir. Süreç, öncelikle müşteri iletişim merkezleri tarafından bir işletmeyle müşteri etkileşimlerinde ihtiyaçları çıkarmak için kullanılır.[1]

Konuşma analitiği, otomatik konuşma ve tanıma unsurlarının varlığına rağmen, konuşmanın duygusal tonu ve etkileşim sırasında konuşma ile konuşmama miktarına bağlı konumlarına göre tartılan konuyu analiz ettiği bilinmektedir. İletişim merkezlerindeki konuşma analitiği, etkin maliyet sınırlaması ve müşteri hizmetleri stratejileri oluşturmak için gerekli olan zekayı ortaya çıkarmak ve kaydedilen müşteri etkileşimlerini araştırmak için kullanılabilir. Teknoloji, maliyet etkenlerini belirleyebilir ve trend analizi yapabilir, süreçler ile birlikte ürünlerinde güçlü ve zayıf yönleri belirleyebilir bunun sonucunda pazarın teklifleri nasıl algıladığını anlamaya yardımcı olmayı sağlamaktadır.[2]

Tanım

Konuşma analizi, bir şirket ile müşterileri arasındaki kayıtlı telefon görüşmelerinin kategorik analizini oluşturur.[3] Müşteri aramalarından gelişmiş işlevsellik ve değerli istihbarat sağlar. Bu bilgileri strateji, ürün, süreç, operasyonel sorunlar ve iletişim merkezi temsilcisi performansıyla ilgili bilgileri keşfetmek için kullanılabilir.[4] Ek olarak, konuşma analizi, iletişim merkezi temsilcilerinin ek eğitime veya eğitime ihtiyaç duyabileceği alanları otomatik olarak belirleyebilir[5] ve aramalarda sağlanan müşteri hizmetini otomatik olarak izleyebilir.[6]

Süreç, belirli bir süre içinde en sık kullanılan kelimeleri sıralar ve cümleleri teker teker algılayarak kullanımın yükselişte ya da düşüş eğiliminde olduğunu gösterebilir. Bu bilgiler, bir kuruluştaki denetçiler, analistler ve diğer kişiler için tüketici davranışındaki değişiklikleri tespit etmek ve çağrı hacimlerini azaltmak ve müşteri memnuniyetini artırmak için harekete geçmek için kullanışlıdır. Müşterinin düşünce sürecine ilişkin bir fikir sağlar ve bu da şirketlerin ayarlamalar yapması için bir fırsat yaratır.[7]

Kullanım

Konuşma analizi uygulamaları, günlük hayattaki sesle gerçek zamanlı uyarılar alarak veya kaydedilen konuşma üzerinde bir işlem sonrası adım olarak sözlü anahtar kelimeleri veya cümleleri tespit edebilir. Bu teknik aynı zamanda ses madenciliği olarak da bilinir. Diğer kullanımlar, memnun olmayan müşterilerden gelen çağrıları belirlemek için iletişim merkezi ortamında konuşmanın sınıflandırılmasını içerir.[8]

Bilgi alma alanında yaygın olarak kullanılan Kesinlik ve geri çağırma gibi önlemler, bir konuşma analitiği arama sisteminin yanıtını ölçmenin tipik yollarıdır.[9] Kesinlik, sorguyla alakalı arama sonuçlarının oranını ölçer. Geri çağırma, arama sonuçları tarafından döndürülen toplam ilgili öğe sayısının oranını ölçer. Standartlaştırılmış bir test setinin kullanıldığı durumlarda, farklı konuşma analizi sistemlerinin arama performansını doğrudan karşılaştırmak için hassasiyet ve geri çağırma gibi ölçümler kullanılabilir.

Farklı konuşma analizi sistemlerinin doğruluğunun anlamlı bir karşılaştırmasını yapmak zor olabilir. LVCSR sistemlerinin çıktısı, kelime hata oranı (WER) için bir değer üretmek için referans kelime düzeyinde transkripsiyonlara göre puanlanabilir, ancak fonetik sistemler, kelimeleri değil, temel tanıma birimi olarak telefonları kullandığından, bu ölçüyü kullanarak karşılaştırmalar yapılamaz. . Konuşma analizi sistemleri, söylenen kelimeleri veya cümleleri aramak için kullanıldığında, kullanıcı için önemli olan, döndürülen arama sonuçlarının doğruluğudur. Bireysel tanıma hatalarının bu arama sonuçları üzerindeki etkisi büyük ölçüde değişebileceğinden, kelime hata oranı gibi ölçüler, kullanıcı perspektifinden genel arama doğruluğunu belirlemede her zaman yardımcı olmaz.

ABD Hükûmeti Sorumluluk Bürosuna göre,[10] "veri güvenilirliği, amaçlandıkları kullanımlar göz önüne alındığında, bilgisayarda işlenen verilerin doğruluğu ve eksiksizliği anlamına gelir." Konuşma Tanıma ve Analitik alanında, "tamlık" "algılama oranı" ile ölçülür ve genellikle doğruluk arttıkça algılama oranı düşer.

Teknoloji

Konuşma analizi satıcıları bir 3. tarafın "motorunu" kullanır ve diğerleri özel motorlar geliştirir. Teknoloji esas olarak üç yaklaşım kullanır. Fonetik yaklaşım, işlem için en hızlı olanıdır, çünkü çoğunlukla gramerin boyutu çok küçüktür ve temel tanıma birimi bir fonemdir. Çoğu dilde onlarca benzersiz ses birimi vardır ve bu tanımanın çıktısı, daha sonra aranabilen bir ses birimi akışıdır. Geniş kelime dağarcığı sürekli konuşma tanıma (LVCSR), daha yaygın olarak konuşmadan metne, tam transkripsiyon veya ASR (otomatik konuşma tanıma olarak bilinir), temel birim olarak bir dizi kelime (bir-gram, iki-gram vb.) Kullanır. Bu yaklaşım, sese karşı eşleşmesi için yüz binlerce kelime gerektirir. Yeni iş sorunlarını ortaya çıkarabilir, sorgular çok daha hızlıdır ve doğruluğu ses bilgisi yaklaşımdan daha yüksektir.

Genişletilmiş konuşma duygu tanıma ve tahmini, üç ana sınıflandırıcıya dayanır: kNN, C4.5 ve SVM RBF Kernel. Bu set, ayrı ayrı alınan her bir temel sınıflandırıcıdan daha iyi performans sağlar. Diğer iki sınıflandırıcı grubuyla karşılaştırılır: Karma çekirdekli bire karşı (OAA) çok sınıflı SVM ve aşağıdaki iki temel sınıflandırıcıdan oluşan sınıflandırıcılar kümesi: C5.0 ve Sinir Ağı. Önerilen varyant, diğer iki grup sınıflandırıcıdan daha iyi performans elde eder.[11]

Gelişim

Pazar araştırması, konuşma analizinin 2020 yılına kadar milyar dolarlık bir endüstri haline geleceğinin ve Kuzey Amerika'nın en büyük pazar payına sahip olacağının tahmin edildiğini gösteriyor.[12] Büyüme oranı, uyumluluk ve risk yönetimi için artan gereksinimlerin yanı sıra piyasa istihbaratı yoluyla endüstri rekabetindeki artışa bağlanıyor.[13] Endüstrinin telekomünikasyon, BT ve dış kaynak kullanımı segmentlerinin seyahat ve konaklama segmentlerinden beklenen büyüme ile en büyük pazar payına sahip olduğu düşünülmektedir.[12]

Ayrıca bakınız

Kaynakça

  1. ^ "Arşivlenmiş kopya". 21 Mayıs 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Mayıs 2021. 
  2. ^ January 8, Mary Shacklett in Big Data on; 2016; Pst, 7:55 Am. "Speech analytics: Why the big data source isn't music to your competitors' ears". TechRepublic (İngilizce). 12 Ocak 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Mayıs 2021. 
  3. ^ "Top five benefits of speech analytics tools for contact centers". SearchCustomerExperience (İngilizce). 27 Eylül 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Mayıs 2021. 
  4. ^ "Workforce Engagement Management Capabilities". Genesys (İngilizce). 14 Ağustos 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Mayıs 2021. 
  5. ^ "Why reduction of silence periods is a goal". Xdroid Voice Analytics (İngilizce). 2 Ağustos 2019. 7 Kasım 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Mayıs 2021. 
  6. ^ "Do Speech Analytics Tools Change Agent Behavior?". www.icmi.com (İngilizce). 19 Eylül 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Mayıs 2021. 
  7. ^ Fotta, Jeffrey (13 Ocak 2015). "Reverse a Pattern of Poor Sales With Speech Analytics". Entrepreneur (İngilizce). 30 Ocak 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Mayıs 2021. 
  8. ^ "The Age of Speech Analytics Is Close at Hand". www.destinationcrm.com. 8 Ekim 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  9. ^ editor., Pennington, Diane Rasmussen, (2012). Indexing and retrieval of non-text information. De Gruyter. ISBN 3-11-026057-3. OCLC 994403879. 
  10. ^ Office., United States. Government Accountability (2009). Assessing the reliability of computer-processed data. U.S. Govt. Accountability Office. OCLC 427865420. 
  11. ^ Theodoros, Anagnostopoulos; Khoruzhnikov, Sergey E.; A, Grudinin Vladimir; Christos, Skourlas (11 Aralık 2014). "EXTENDED SPEECH EMOTION RECOGNITION AND PREDICTION". Journal Scientific and Technical Of Information Technologies, Mechanics and Optics. 94 (6): 137-145. 23 Mayıs 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  12. ^ a b MarketsandMarkets. "Speech Analytics Market Worth 1.60 Billion USD by 2020". www.prnewswire.com (İngilizce). 17 Nisan 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  13. ^ MENAFN. "Speech-Analytics-Industry-Market-Share-Size-Growth--Forecast-2025". www.menafn.com. 23 Mayıs 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Dil</span> insanlar arasında iletişim kurmayı sağlayan doğal bir iletişim aracı

Dil, insanlar arasında anlaşmayı ve iletişimi sağlayan doğal bir araç, kendisine özgü kuralları olan ve ancak bu kurallar içerisinde gelişen canlı bir varlık, çok boyutlu kavramlar bütünü; temeli tarihin bilinmeyen dönemlerinde atılmış bir gizli anlaşmalar düzeni, seslerden örülmüş toplumsal bir kurum ve yapıdır.

<span class="mw-page-title-main">Dilbilim</span> insan dilinin araştırılması

Dilbilim, dil bilimi, lengüistik ya da lisaniyat; dilleri dilbilgisi, söz dizimi (sentaks), ses bilgisi (fonetik), ses bilimi (fonoloji), biçimbilim (morfoloji) ve edimbilim (pragmatik) gibi çeşitli yönlerden yapısal, anlamsal ve bildirişimin çıkış bağlamını temel alarak sözlerin gönderimlerini ve iletişimde dilin yaptırım gücünü inceleyen bilim dalıdır.

<span class="mw-page-title-main">Telefon</span> Birbirinden uzak yerlerde bulunan kişiler ve düzenekler arasında bilgi alışverişini sağlayan elektrikli ses alıp verme aygıtı

Telefon, birbirinden uzak yerlerde bulunan kişiler ve düzenekler arasında bilgi alışverişini sağlayan elektrikli ses alıp verme aygıtıdır. Telefonun çalışmasında ana ilke ağızdan çıkan ses dalgalarının önce elektrik sinyallerine çevrilmesi ve bu sinyallerin çeşitli gönderme yöntemleriyle uzağa iletilmesinden sonra, bu defa da elektrik sinyallerinin yeniden kulakla duyulabilecek ses dalgalarına çevrilmesidir.

<span class="mw-page-title-main">Biyometri</span>

Biyometri, yaşayan organizmaların ölçümlerine verilen genel isimdir. Kimlik doğrulama ve erişim kontrolü için insan vücudunun biyolojik özelliklerini kullanan sistemlerdir. Bu sistemler, parmak izi, yüz, göz, ses ve damar örüntüsü gibi çeşitli biyolojik veri türlerini tarayarak ve analiz ederek çalışır. Biyometri, gelişmekte olan bir teknolojidir ve gelecekte daha da yaygın olarak kullanılması muhtemeldir. Biyometrik sistemler daha ucuz ve daha güvenilir hale geldikçe, kimlik doğrulama ve erişim kontrolü için tercih edilen yöntem haline gelebilir.

<span class="mw-page-title-main">Doğal dil işleme</span> bilgisayar bilimi ve dil bilimi alanı

Doğal Dil İşleme, yaygın olarak NLP olarak bilinen yapay zekâ ve dilbilim alt kategorisidir. Türkçe, İngilizce, Almanca, Fransızca gibi doğal dillerin işlenmesi ve kullanılması amacı ile araştırma yapan bilim dalıdır.

<span class="mw-page-title-main">Toplam kalite yönetimi</span>

Toplam kalite yönetimi ya da kısaca TKY; müşteri ihtiyaçlarını karşılayabilmek için kullanılan insan, iş, ürün ve/veya hizmet kalite gereksinimlerinin, sistematik bir yaklaşımla ve tüm çalışanların katkıları ile sağlanmasıdır. Bu yönetim şeklinde uygulanan her süreçte tüm çalışanların fikir ve hedefleri kullanılmakta ve tüm çalışanlar kaliteye dahil edilmektedir. Toplam kalite yönetimi; uzun dönemde müşterilerin tatmin olmasını başarmayı, kendi personeli ve toplum için yararlar elde etmeyi amaçlar ve kalite üzerine yoğunlaşır. Tüm personelin katılıma dayalı bir yönetim modelidir.

<span class="mw-page-title-main">Altı sigma</span> süreç geliştirmek için yöntem stratejisi

Altı Sigma, operasyonlarda mükemmelliğin sağlanması amacıyla işletmelerde süreçlerin tanımlanması, ölçülmesi, analiz edilmesi, iyileştirilmesi ve kontrolü için kolay ve etkili istatistik araçlarının kullanıldığı bir yönetim stratejisi.

<span class="mw-page-title-main">Simülasyon</span> gerçek bir dünya süreci veya sisteminin işletilmesinin zaman üzerinden taklit edilmesi

Simülasyon veya benzetim, teknik olmayan anlamda bir şeyin benzeri veya sahtesi anlamında kullanılır. Teknik anlamda gerçek bir dünya süreci veya sisteminin işletilmesinin zaman üzerinden taklit edilmesidir. Sistem nesneleri arasında tanımlanmış ilişkileri içeren sistem veya süreçlerin bir modelidir.

Yüz tanıma, Biyometri kişilerin fiziksel ve davranışsal özelliklerini göz önüne alarak yürütülen kimlik belirleme çalışmaları olarak tanımlanır. Bu kişi özelliklerine örnek olarak, retina ve iris görüntüleri, el geometrisi, Ayak izileri ve parmak izleri, elin damar görüntüsü, konuşma sesi, yüz özellikleri, kulak memesi, yürüyüş, klavye kullanım şekli, konuşma devinimleri örüntüleri verilebilir. Daha genel anlamda, biyometri bilişim teknolojilerinin bir parçası olup, insanların fiziksel özelliklerini ve davranış biçimlerini irdeleyip kişiyi tanıma amaçlı ipuçları çıkaran bir bilim dalıdır. Bizim içinde çalıştığımız bu biyometriğin içinde yüz özelliklerine bağlı insan tanıma, diğer bir deyiş ile “yüz bulma ve yüz tanıma”dır. Yüz tanımadaki üç temel unsur şöyle tanımlanır:

Konuşma sentezleyici, İnsan seslerinin bilgisayar yapay zekası tarafından üretimidir. Genellikle Metin okuma sistemlerinde kullanılan Konuşma sentezleyicisi bu sistemlerde bir dilin tüm ses bilgisi ve benzeri kurallarına göre çevri yapacak şekilde programlanırlar. Bu sentezleyicinin metni doğru telaffuz etmesini sağlar.

<span class="mw-page-title-main">Ses konuşma tanımlayıcı yazılımlar</span>

Sesli konuşmayı yazıya çeviren bilgisayar yazılımları veya daha yaygın ve bilinen İngilizce adıyla "Speech recognition"

Psikodilbilim veya ruhdilbilim, psikolojik süreçlerle dilsel etkenler arasındaki iletişimi çalışan disiplindir. Bu disiplin başat olarak dilin nasıl işlendiği, zihin ve beyinde nasıl temsillendiği ile ilgilenir; yani, insanların dili edinmesini, kullanmasını, anlamasını ve üretmesini sağlayan psikolojik ve nörobiyolojik faktörlerle...

<span class="mw-page-title-main">Yazılım yaşam döngüsü</span>

Yazılım yaşam döngüsü, bilgisayar yazılımlarının ilk geliştirme aşamalarından başlayarak; yayındaki mevcut sürümün hatalarının giderilmesi, iyileştirme odaklı yeni ara sürümlerin yayınlarak yazılımın güncellenmesi de dâhil olmak üzere nihai (kararlı) sürüme ulaşana dek geçen geliştirme ve olgunlaştırma aşamalarının tamamını ifade etmek için kullanılan terimdir.

<span class="mw-page-title-main">Microsoft Agent</span>

Microsoft Agent Microsoft tarafından geliştirilen ve hareketli karakterler, konuşma motorları ve bilgisayar kullanıcılarıyla etkileşimi artırmak için konuşma tanıma yazılımı kullanılan bir teknolojidir. Windows Vista üzerinden Microsoft Windows 2000'in bir parçası olarak önceden kurulmuş olarak gelir. Microsoft Agent işlevselliği, web sayfaları tarafından kullanılabilen bir ActiveX denetimi olarak sunulmaktadır. Bu yazılımın arkasındaki teori, Stanford'un Dil ve Enformasyon Araştırmaları Merkezi'ndeki Clifford Nass ve Byron Reeves'in sosyal ara yüzler üzerindeki çalışmasından geldi.

Müşteri ilişkileri yönetimi (CRM), bir şirketin mevcut ve potansiyel müşterilerle etkileşimini yönetmek için bir yaklaşımdır. Müşterilerle olan iş ilişkilerini geliştirmek, özellikle müşteriyi elde tutmaya ve sonuçta satış büyümesini artırmaya odaklanarak, bir şirket ile müşterilerin geçmişi hakkındaki veri analizini kullanır. Salesforce ve Microsoft Dynamics CRM gibi müşteri ilişkileri yönetimi hizmetleri var.

Sanal asistanlar, daha önce insanlar tarafından yapılan işleri veya hizmetleri, kullanıcılarından soru ve talepleri ile gerçekleştiren yazılımlardır. Genellikler chatbot kavramı ile aynı anlamda kullanılırlar ancak sanal asistanlar daha geniş bir alanda hizmet verirler. Sanal asistanlar kullanıcı ile yazı veya konuşma yoluyla etkileşim kurabilirler. Kullanıcılar sanal asistanlara soru sorabilirler, müziğin sesini açmak veya ısıtıcıyı kısmak gibi basit direktifler verebilirler, takvimlerini düzenlemesini veya uçak bileti almasını isteyebilirler.

<span class="mw-page-title-main">Veri bilimi</span> verilerden bilgi ve içgörü elde etmeye odaklanan disiplinler arası çalışma alanı

Veri bilimi, yapılandırılmış ve yapılandırılmamış verilerden bilgi ve öngörü elde etmek için bilimsel yöntemleri, süreçleri, algoritmaları ve sistemleri kullanan çok disiplinli bir alandır. Veri bilimi veri madenciliği ve büyük verilerle ilişkilidir.

Mantıksal analiz, veri veya istatistiğin sistematik hesaplamalı analizidir. Verilerdeki anlamlı kalıpların keşfi, yorumlanması ve iletişimi için kullanılır. Ayrıca, etkili karar vermeye yönelik veri modellerinin uygulanmasını da gerektirir. Kayıtlı bilgilerle zengin alanlarda değerli olabilir. Analitik, performansı ölçmek için istatistik, bilgisayar programlama ve yöneylem araştırmasının eşzamanlı uygulanmasına dayanır.

<span class="mw-page-title-main">Reseptif afazi</span>

Reseptif afazi, duyusal afazi veya arka afazi olarak da bilinen Wernicke afazisi, bireylerin yazılı ve sözlü dili anlamakta zorlandıkları bir afazi türüdür. Wernicke afazisi olan hastalar, tipik konuşma hızında, düzgün bir söz dizilimi olan ve zahmetsiz bir akıcı konuşma gösterirler. Yazma da tıpkı konuşma gibi içerik veya anlamdan yoksun olma eğilimindedir. Çoğu durumda, Wernicke afazisi olan bireylerde motor kusurlar (hemiparezi) oluşmaz. Bu nedenle, çok fazla anlamı olmayan büyük miktarda konuşma üretebilirler. Wernicke afazisi olan kişiler genel olarak konuşmalarındaki hatalarını ve anlamsızlığın farkında değildirler. Genellikle en belirgin dil eksikliklerinin bile farkına varmazlar.

Doğrudan ses girişi (DSG),, bazen ses girişi denetimi olarak da adlandırılır, kullanıcının makineye konuşma tanıma yoluyla talimatlar vermek için sesli komutlar ilettiği bir insan-makine etkileşimi biçimidir.