İçeriğe atla

U-kanunu algoritması

Bir giriş sinyalinde (yeşil) A-yasası (mavi) ve μ-yasası (kırmızı) sıkıştırmasının karşılaştırılması. Her iki eksen de desibel cinsinden logaritmik ölçeği kullanır.

μ-kanunu algoritması (bazen mu -kanunu olarak yazılır, genellikle u-kanunu olarak yaklaşılır ), öncelikle Kuzey Amerika ve Japonya'daki 8 bitlik PCM dijital telekomünikasyon sistemlerinde kullanılan bir sıkıştırma algoritmasıdır. ITU-T'nin G.711 standardında yer alan iki sıkıştırma algoritmasından biridir, zaten diğeri ise benzer A kanunudur . A-kanunu, Avrupa gibi dijital telekomünikasyon sinyallerinin E-1 devreleri üzerinde taşındığı bölgelerde kullanılmaktadır.

G711 μ-yasası için PCMU, G711u veya G711MU terimleri kullanılmaktadır.[1]

Sıkıştırma algoritmaları bir ses sinyalinin dinamik aralığını azaltır. Analog sistemlerde bu, iletim sırasında elde edilen sinyal-gürültü oranını (SNR) artırabilir; dijital alanda niceleme hatasını azaltabilir (böylece sinyal-niceleme-gürültü oranını artırabilir). Bu SNR artışları, eşdeğer SNR için azaltılmış bant genişliği ile takas edilebilir.

Azaltılmış tepe SNR pahasına, μ-yasasının doğrusal olmayan kuantizasyonunun dinamik aralığı 33 dB kadar etkili bir şekilde arttırdığı matematiksel olarak gösterilebilir. İşte bu yüzden 8bit ulaw şuna karşılık gelir: 14bit doğrusal pcm.[2]

Algoritma türleri

μ-kanunu algoritması analog formda ve nicelenmiş dijital formda tanımlanabilir.

Sürekli

μ-kanunu fonksiyonu
Ters μ-kanunu fonksiyonu

Belirli bir x girişi için μ-kanunu kodlama denklemi [3]burada Kuzey Amerika ve Japon standartlarında μ = 255 olup, sgn(x) işaret fonksiyonudur . Bu fonksiyonun aralığının -1 ile 1 arasında olduğuna dikkat etmek önemlidir.

μ-yasası açılımı daha sonra ters denklemle verilir:[3]

Ayrık

G.711, bir aralığın sınırındaki değerlerin nasıl kodlanacağı konusunda net değildir (örneğin +31'in 0xEF'ye mi yoksa 0xF0'a mı kodlanacağı).[] Ancak G.191, μ-yasası kodlayıcı için C dilinde örnek kod sağlar.[4] Pozitif ve negatif aralıklar arasındaki fark, örneğin +30 ila +1'e karşılık gelen negatif aralık, −31 ila −2'dir. Bu, kodlama sırasında negatif bir değeri pozitif bir değere dönüştürmek için 2'nin tamamlayıcısı yerine 1'lerin tamamlayıcısının (basit bit ters çevirme) kullanılmasıyla açıklanır.

Nicelenmiş μ-yasası algoritması
14 bit ikili doğrusal giriş kodu 8 bitlik sıkıştırılmış kod
256'lık 16 aralıkta +8158'den +4063'e 0x80 + aralık numarası
128'lik 16 aralıkta +4062'den +2015'e 0x90 + aralık numarası
64'lük 16 aralıkta +2014'ten +991'e 0xA0 + aralık numarası
32'lik 16 aralıkta +990'dan +479'a 0xB0 + aralık numarası
16'lık 16 aralıklarla +478'den +223'e 0xC0 + aralık numarası
8'lik 16 aralıkta +222'den +95'e 0xD0 + aralık numarası
4'erli 16 aralıklarla +94'ten +31'e 0xE0 + aralık numarası
15'er 2 aralıklarla +30'dan +1'e 0xF0 + aralık numarası
0 0xFF
−1 0x7F
−31'den −2'ye, 2'lik 15 aralıkta 0x70 + aralık numarası
−95 ila −32, 16 4'lük aralıklarla 0x60 + aralık numarası
−223 ila −96, 8'lik 16 aralıkta 0x50 + aralık numarası
−479'dan −224'e, 16'lık 16 aralıkta 0x40 + aralık numarası
−991 ila −480, 32'lik 16 aralıkta 0x30 + aralık numarası
−2015'ten −992'ye, 64'lük 16 aralıkta 0x20 + aralık numarası
−4063 ila −2016, 128'lik 16 aralıkta 0x10 + aralık numarası
−8159'dan −4064'e, 256'lık 16 aralıkta 0x00 + aralık numarası

Uygulama

μ-yasası algoritması çeşitli şekillerde uygulanabilir:

Analog
Tamamen analog alanda sıkıştırma elde etmek için doğrusal olmayan kazançlı bir amplifikatör kullanarak.
Doğrusal olmayan ADC
μ-yasası algoritmasına uyacak şekilde eşit olmayan aralıklara sahip nicemleme düzeylerine sahip bir analogdan dijitale dönüştürücü kullanarak.
Dijital
Verileri dijital alana girdikten sonra dönüştürmek için μ-yasası algoritmasının nicelenmiş dijital versiyonunu kullanarak.
Yazılım/DSP
Sıkıştırılmış değerleri hesaplamak için μ-yasası algoritmasının sürekli versiyonunu kullanarak.

Kullanım gerekçesi

Konuşmanın geniş bir dinamik aralığa sahip olması nedeniyle μ-yasası kodlaması kullanılır. Analog sinyal iletiminde, nispeten sabit arka plan gürültüsünün varlığında, daha ince ayrıntılar kaybolur. Detayın kesinliğinin zaten tehlikeye atıldığı göz önüne alındığında ve sinyalin bir insan tarafından algılanacağı varsayıldığında, sinyali logaritmik bir sıkıştırma yöntemi kullanarak sıkıştırarak algılanan akustik yoğunluk seviyesinin veya ses yüksekliğinin logaritmik olması gerçeğinden yararlanılabilir. Telekomünikasyon devrelerinde gürültünün büyük bir kısmı hatlara enjekte edilir, dolayısıyla kompresörden sonra amaçlanan sinyal, sıkıştırılmamış bir kaynağa kıyasla statik sinyalden önemli ölçüde daha yüksek olarak algılanır. Bu ortak bir çözüm haline geldi ve böylece ortak dijital kullanımdan önce, birlikte çalışabilir bir standardı tanımlamak için μ-yasası spesifikasyonu geliştirildi.

Bu önceden var olan algoritma, dijital sistemlerde tanınabilir bir insan sesini kodlamak için gereken bit miktarını önemli ölçüde azaltma etkisine sahipti. Bir örnek, yaygın bilgisayarların çoğunun sembol boyutuna uygun bir şekilde eşleşen 8 bit kadar küçük bir μ-yasası kullanılarak etkili bir şekilde kodlanabiliyordu.

μ-yasası kodlaması, sinyalin dinamik aralığını etkili bir şekilde azalttı, böylece kodlama verimliliğini arttırırken sinyali, belirli sayıda bit için doğrusal kodlamayla elde edilenden daha büyük bir sinyal- bozulma oranıyla sonuçlanacak şekilde yönlendirir.

μ-law algoritması, Unix'te ses için fiili bir standart olarak yaygın olarak kullanılan /dev/audio arayüzü tarafından kullanılan yerel yöntem olarak en azından Sun Microsystems'in SPARCstation 1'ine kadar uzanan .au formatında da kullanılır. sistemler. Au formatı ayrıca Java 1.1'deki sun.audio Java paketindeki sınıflar ve bazı C# yöntemleri gibi çeşitli yaygın ses API'lerinde de kullanılır.

Bu çizim μ-yasasının örneklemeyi daha küçük (daha yumuşak) değerlerde nasıl yoğunlaştırdığını gösterir. Yatay eksen 0-255 bayt değerlerini temsil eder ve dikey eksen μ-yasa kodlamasının 16 bitlik doğrusal kodu çözülmüş değeridir.

A kanunu ile karşılaştırma

μ-yasası algoritması, küçük sinyaller için daha kötü orantısal bozulmalar pahasına A-yasası'ndan biraz daha geniş bir dinamik aralık sağlar. Sözleşmeye göre, en az bir ülkenin kullanması durumunda uluslararası bağlantı için A kanunu kullanılır.

Ayrıca bakınız

  • Ses seviyesi sıkıştırma
  • Sinyal sıkıştırma (belirsizliği giderme)
  • G.711, A-yasası veya μ-yasası kodlamasını kullanan bir dalga biçimi konuşma kodlayıcısı
  • Taperlenmiş kayan nokta

Kaynaklar

  1. ^ "Video/Voice/Speech Codecs". Grandstream=. 20 Eylül 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 19 Temmuz 2020. 
  2. ^ Ess, David Van (29 Aralık 2014). "Cypress Semiconductor AN2095: Algorithm - Logarithmic Signal Companding - Not Just a Good Idea - It Is μ-Law" (PDF). Infineon Technologies. 6 Ekim 2022 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 28 Haziran 2023. 
  3. ^ a b "Waveform Coding Techniques - Cisco". 2 Şubat 2006. 28 Şubat 2014 tarihinde kaynağından arşivlendi. Erişim tarihi: 7 Aralık 2020. 
  4. ^ "G.191 : Software tools for speech and audio coding standardization". www.itu.int. 1 Haziran 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 24 Kasım 2023. 

Dış bağlantılar

Şablon:Compression Methods

İlgili Araştırma Makaleleri

JPEG, Joint Photographic Experts Group tarafından standartlaştırılmış bir sayısal görüntü kodlama biçimidir. Bu biçim, 1994 yılında ISO 10918-1 adıyla standartlaşmıştır.

Korelasyon, olasılık kuramı ve istatistikte iki rassal değişken arasındaki doğrusal ilişkinin yönünü ve gücünü belirtir. Genel istatistiksel kullanımda korelasyon, bağımsızlık durumundan ne kadar uzaklaşıldığını gösterir.

<span class="mw-page-title-main">Normal dağılım</span> sürekli olasılık dağılım ailesi

Normal dağılım, aynı zamanda Gauss dağılımı veya Gauss tipi dağılım olarak isimlendirilen, birçok alanda pratik uygulaması olan, çok önemli bir sürekli olasılık dağılım ailesidir.

Ayrık Fourier Dönüşümü, Fourier analizinde kullanılan özel bir Fourier dönüşümüdür.

<span class="mw-page-title-main">Tekdüze dağılım (sürekli)</span> Özel olasılık dağılımı

Sürekli tekdüze dağılım (İngilizce: continuous uniform distribution) olasılık kuramı ve istatistik bilim dallarında, her elemanı, olasılığın desteklendiği aynı büyüklükteki aralık içinde bulunabilir, her sürekli değer için aynı sabit olasılık gösteren bir olasılık dağılımları ailesidir. Desteklenen aralık iki parametre ile, yani minimum değer a ve maksimum değer b ile, tanımlanmaktadır. Bu dağılım kısa olarak U(a,b) olarak anılır.

Matematik biliminde, özellikle yöneylem araştırması uygulamalı dalında, doğrusal programlama problemleri bir doğrusal amaç fonksiyonunun doğrusal eşitlik ve/veya eşitsizlik kısıtlamalarını sağlayacak şekilde optimizasyon yapılmasıdır. Bir optimizasyon modeli eğer sürekli değişkenlere ve tek bir doğrusal amaç fonksiyonuna sahipse ve tüm kısıtlamaları doğrusal eşitlik veya eşitsizliklerden oluşuyorsa, doğrusal (lineer) program olarak adlandırılır. Başka bir deyişle, modelin tek-amaçlı fonksiyonu ve tüm kısıtlamaları, süreklilik gösteren karar değişkenlerinin ağırlıklı toplamlarından oluşmalıdır.

<span class="mw-page-title-main">Laplace dağılımı</span>

Olasılık kuramı ve istatistik bilim dallarında Laplace dağılımı Pierre-Simon Laplace anısına isimlendirilmiş bir sürekli olasılık dağılımıdır. Arka arkaya birbiriyle yapıştırılmış şekilde ve bir de konum parametresi dahil edilerek birleştirilmiş iki üstel dağılımdan oluştuğu için, çift üstel dağılımı adı ile de anılmaktadır. İki bağımsız ve tıpatıp aynı şekilde üstel dağılım gösteren bir rassal değişken bir Laplace dağılımı ile işlev görürler. Bu, aynen üstel dağılım gösteren rassal zamanda değerlendirilen Brown devinimine benzer.

<span class="mw-page-title-main">Büyük sayılar yasası</span>

Büyük Sayılar Kanunu ya da Büyük Sayılar Yasası, bir rassal değişkenin uzun vadeli kararlılığını tanımlayan bir olasılık teoremidir. Sonlu bir beklenen değere sahip birbirinden bağımsız ve eşit dağılıma sahip bir rassal değişkenler örneklemi verildiğinde, bu gözlemlerin ortalaması sonuçta bu beklenen değere yakınsayacak ve bu değere yakın bir seyir izleyecektir.

<span class="mw-page-title-main">Log-normal dağılım</span>

Olasılık kuramı ve istatistik bilim dallarında log-normal dağılım logaritması normal dağılım gösteren herhangi bir rassal değişken için tek-kuyruklu bir olasılık dağılımdır. Eğer Y normal dağılım gösteren bir rassal değişken ise, bu halde X= exp(Y) için olasılık dağılımı bir log-normal dağılımdır; aynı şekilde eğer X log-normal dağılım gösterirse o halde log(X) normal dağılım gösterir. Logaritma fonksiyonu için bazın ne olduğu önemli değildir: Herhangi iki pozitif sayı olan ab ≠ 1 için eğer loga(X) normal dağılım gösterirse, logb(X) fonksiyonu da normaldir.

<span class="mw-page-title-main">Doğrusal olmayan regresyon</span>

Doğrusal olmayan regresyon, istatistik bilimde gözlemi yapılan verilerin bir veya birden fazla bağımsız değişkenin model parametrelerinin doğrusal olmayan bileşiği olan ve bir veya daha çok sayıda bağımsız değişken ihtiva eden bir fonksiyonla modelleştirilmesini içeren bir regresyon (bağlanım) analizi türüdür. Veriler arka-arkaya yapılan yaklaşımlarla kurulan modele uydurularak çözümleme yapılır.

<span class="mw-page-title-main">Dijital İmza Algoritması</span>

Dijital İmza Algoritması dijital imza için bir FIPS standardıdır. Ağustos 1991'de National Institute of Standards and Technology (NIST) tarafından tasarlanmıştır. Dijital imza algoritması, ElGamal İmza Algoritması'nın bir varyantıdır.

<span class="mw-page-title-main">Kare dalga</span>

Kare dalga, genliğin sabit bir frekansla, iki değer, maksimum ve minumum, arasında eşit süreler kalarak değiştiği, sinüsoidal olmayan periyodik dalgadır. İdeal kare dalgada genliğin iki seviye arasında geçişi anlıktır; bu sırada herhangi bir gecikme yaşanmaz. Ancak bu durum fiziksel sistemlerde gerçeklenebilir değildir. Kare dalgalar elektronikte ve sinyal işlemede sıkça kullanılır. Kare dalga, genlik seviyelerinde kalma süresi farklı olabilen dikdörtgen dalganın özel halidir.

Doğrusal filtreler, işleme sokulan verilerin doğrusal değişkenler ile işlendiği sinyal işleme yapılarıdır. Bir başka deyişle, elde edilen sinyal çıktısı, girdinin doğrusal katsayılar ile işleme sokulması ile oluşturulur. Bu özellikte filtreler ile oluşturulan sistemler, dolayısıyla doğrusal sinyal tepkisi yaratırlar.

Medyan bir anakütle ya da örneklem veri serisini küçükten büyüğe doğru sıraladığımızda, seriyi ortadan ikiye ayıran değere denir. İstatistiğin bir alt dalı olan betimsel istatistikde medyan bir merkezsel konum ölçüsü kabul edilir.

<span class="mw-page-title-main">Enkoder</span>

Enkoder, standardizasyon, hız ya da sıkıştırma amacıyla bilgileri bir biçimden veya koddan diğerine dönüştüren bir cihaz, devre, dönüştürücü, yazılım programı, algoritmadır.

Sinyal-gürültü oranı bilim ve mühendislikte kullanılan, istenen bir sinyalin seviyesini arka plandaki gürültü seviyesiyle karşılaştıran bir ölçüdür. SNR, sinyal gücünün gürültü gücüne oranı olarak tanımlanır, genellikle desibel cinsinden ifade edilir. 1: 1'den yüksek bir oran gürültüden daha fazla sinyal olduğunu gösterir.

<span class="mw-page-title-main">Kodlama teorisi</span> bilgisayar programlarındaki kodların incelendiği bilimsel alan

Kodlama teorisi, kodların özelliklerinin ve bunların belirli uygulamalar için uygunluğunun incelenmesini sağlayan bir teoridir. Kodlar, veri sıkıştırma, kriptografi, hata algılama ve düzeltme, veri iletimi ve veri depolama için kullanılabilir. Kodlar, verimli ve güvenilir veri aktarım yöntemlerinin tasarlanması amacıyla bilgi teorisi, elektrik mühendisliği, matematik, dilbilim ve bilgisayar bilimi gibi çeşitli bilimsel disiplinler tarafından incelenir. Bu genellikle fazlalığın kaldırılmasını ve iletilen verilerdeki hataların düzeltilmesini veya tespit edilmesini içerir.

<span class="mw-page-title-main">Toplanmış alan tablosu</span>

Toplanmış alan tablosu, bir ızgaranın dikdörtgen bir alt kümesindeki değerlerin toplamını hızlı ve verimli bir şekilde oluşturmak için bir veri yapısı ve algoritmadır. Görüntü işleme alanında, bütünleşik görüntü olarak da bilinir. 1984 yılında Frank Painter tarafından mipmap'lerle kullanılmak üzere bilgisayar grafiklerine tanıtıldı. Bilgisayarla görmede Lewis tarafından popüler hale getirildi ve ardından "bütünleşik görüntü" adı verildi. 2001'de Viola-Jones nesne algılama çerçevesinde belirgin bir şekilde kullanıldı. Tarihsel olarak, bu ilke, çok boyutlu olasılık dağılım fonksiyonları çalışmasında, yani ilgili kümülatif dağılım fonksiyonlarından 2D olasılıkların hesaplanmasında çok iyi bilinmektedir.

Perceptron (Algılayıcı), tek katmanlı bir yapay sinir ağının temel birimidir. Eğitilebilecek tek bir yapay sinir hücresinden oluşmaktadır. Denetimli bir öğrenme algoritmasıdır. Bir perceptron giriş değerleri, ağırlıklar ve sapma, ağırlıklı toplam ve aktivasyon işlevi olmak üzere dört bölümden oluşmaktadır. Hem giriş hem de çıkış değerleri verilir ve sinir ağının öğrenmesi beklenir.

<span class="mw-page-title-main">A-kanunu algoritması</span>

A-kanunu algoritması, Avrupa 8-bit PCM dijital iletişim sistemlerinde, dijitalleştirme için bir analog sinyalin dinamik aralığını optimize etmek, yani modifiye etmek için kullanılan standart bir sıkıştırma algoritmasıdır. ITU-T'nin G.711 standardındaki iki daraltıcı algoritmadan biridir.