İçeriğe atla

Müzik bilgi işleme

Müzik bilgi işleme (MBİ), müzikten bilgi çıkarma işini inceleyen disiplinler arası bir bilim dalıdır. MBİ ile ilgilenen kişiler, akademik müzikoloji, psikoakustik, psikoloji, sinyal işleme, bilişim, makine öğrenimi, optik müzik tanıma, hesaplamalı zeka veya bunların bir kombinasyonu gibi alanlarda arka plana sahip olabilirler.

Uygulamalar

Müzik Bilgi İşleme (MBİ), işletmeler ve akademisyenler tarafından müziği kategorize etmek, manipüle etmek ve hatta müzik yaratmak için kullanılmaktadır.

Müzik sınıflandırma

Klasik Müzik Bilgi İşleme (MBİ) konularından biri tür sınıflandırmasıdır. Bu, müzik öğelerini klasik, caz, rock vb. önceden tanımlanmış türlere göre kategorilere ayırmaktır. Ruhsal durum sınıflandırması, sanatçı sınıflandırması, enstrüman tanıma ve müzik etiketleme de popüler konulardır.

Öneri sistemleri

Müzik için birkaç öneri sistemi mevcuttur, ancak şaşırtıcı bir şekilde çok azı Müzik Bilgi İşleme (MBİ) tekniklerine dayanmaktadır, bunun yerine kullanıcılar arası benzerlik veya yoğun veri derleme kullanılmaktadır. Örneğin, Pandora, müziği "kadın şarkıcı" veya "güçlü bas çizgisi" gibi belirli niteliklerle etiketlemek için uzmanları kullanır. Birçok diğer sistem, dinleme geçmişi benzer olan kullanıcıları bulur ve kendi koleksiyonlarından kullanıcıların daha önce dinlemediği müzikleri önerir. Şimdiye kadar, müzikteki benzerlik için MBİ teknikleri bu tür sistemlerin bir parçası olmaya başlamıştır.

Müzik kaynak ayırma ve enstrüman tanıma

Müzik kaynak ayırma, karışık bir ses sinyalinden orijinal sinyalleri ayırmakla ilgilidir. Enstrüman tanıma, müzikte yer alan enstrümanları tanımlamakla ilgilidir. Ana kopyaya erişim olmaksızın müziği bileşen parçalarına ayırabilen çeşitli MBİ sistemleri geliştirilmiştir. Bu şekilde örneğin, normal müzik parçalarından karaoke parçaları oluşturulabilir, ancak süreç vokallerin diğer enstrümanlarla aynı frekans alanını işgal etmesi nedeniyle henüz mükemmel değildir.

Otomatik müzik transkripsiyonu

Otomatik müzik transkripsiyonu, bir ses kaydını skor veya MIDI (Müzik Enstrümanları Dijital Arabirimi) dosyası gibi sembolik bir notasyona dönüştürme işlemidir. Bu işlem, çoklu ses algılama, başlangıç algılama, süre tahmini, enstrüman tanıma ve harmonik, ritmik veya melodik bilgilerin çıkarılması gibi birkaç ses analizi görevini içerir. Bu görev, enstrüman sayısı ve polifoni seviyesi arttıkça daha zorlaşır.

Müzik üretimi

Müziğin otomatik üretimi, birçok MBİ araştırmacısının hedefidir. İnsan takdiri açısından sınırlı başarıyla denemeler yapılmıştır.

Kullanılan yöntemler

Veri kaynağı

Notalar, çalışılacak müziğin açık ve mantıklı bir açıklamasını verir, ancak dijital ya da başka türlü notalara erişim genellikle pratik değildir. Benzer nedenlerle MIDI müziği de kullanılmıştır, ancak müzik MIDI standartları göz önünde bulundurularak yazılmadıkça, herhangi bir formattan MIDI'ye dönüştürülürken bazı veriler kaybolur ki bu nadirdir. Sesin kendisi analizin bir parçası olduğunda WAV, mp3 ve ogg gibi dijital ses formatları kullanılır .Lossy formatlar MP3 ve OGG insan kulağı ile iyi çalışır ancak çalışma için kritik olabilecek önemli veriler eksik olabilir. Ayrıca bazı kodlamalar, herhangi bir otomatik analizör için yanıltıcı olabilecek artefaktlar yaratabilir. Buna rağmen MP3'ün yaygınlığı, alanındaki çok sayıda araştırmanın bu materyalleri kaynak malzeme olarak kullanmasına neden olmuştur. Son zamanlarda, müziğin kültürel bağlamı içindeki daha yuvarlak bir anlayış için MIR'a, webden madenciliği yapılan meta veriler dahil edilmekte ve bu, son zamanlarda müzik için sosyal etiketlerin analizinden oluşmaktadır.

Özellik temsili

Analiz çoğu zaman bir özetleme gerektirebilir ve müzik (diğer birçok veri formu gibi) için bu, özellikle ses içeriği analiz edildiğinde ve makine öğrenimi uygulanacaksa, özellik çıkarma yoluyla başarılır. Amaç, öğrenmenin makul bir zaman çerçevesi içinde gerçekleştirilebilmesi için veri miktarını yönetilebilir bir değerler setine indirgemektir. Çıkarılan yaygın bir özellik, bir müzik parçasının tınısının bir ölçüsü olan Mel-Frekans Kepstral Katsayısıdır (MFCC). Parçadaki anahtar, akorlar, harmoniler, melodi, ana perde, dakikadaki vuruş sayısı veya ritim gibi diğer özellikler temsil edilmek için kullanılabilir. Bir dizi mevcut ses özellik çıkarma araçları bulunmaktadır.

İstatistik ve makine öğrenimi

  • Sınıflandırma, kümeleme ve modelleme için hesaplamalı yöntemler — mono ve polifonik müzik için müziksel özellik çıkarma, benzerlik ve desen eşleştirme, geri alma.
  • Biçimsel yöntemler ve veritabanları — otomatik müzik tanıma ve tanımlama uygulamaları, skor takibi, otomatik eşlik, müzik ve müzik sorguları için yönlendirme ve filtreleme, sorgu dilleri, müzik bilgi işleme ve geri alımı için standartlar ve diğer meta veriler veya protokoller, çoklu ajan sistemleri, dağıtık arama gibi.
  • Müzik Bilgi İşleme Yazılımı — Semantik Web ve müziksel dijital nesneler, akıllı ajanlar, işbirlikçi yazılım, web tabanlı arama ve semantik geri alma, mırıldanarak sorgulama / Sese göre arama, akustik parmak izi.
  • Müzik analizi ve bilgi temsili — otomatik özetleme, alıntılama, alıntı yapma, düşürme, dönüştürme, müziğin biçimsel modelleri, dijital skorlar ve temsiller, müzik indeksleme ve meta verileri.

Diğer konular

  • İnsan-bilgisayar etkileşimi ve arayüzler — çok modlu arayüzler, kullanıcı arayüzleri ve kullanılabilirlik, mobil uygulamalar, kullanıcı davranışı
  • Müzik algısı, biliş, etki ve duygular — müzik benzerliği metrikleri, sözdizimsel parametreler, semantik parametreler, müziksel formlar, yapılar, stiller ve müzik açıklama metodolojileri
  • Müzik arşivleri, kütüphaneler ve dijital koleksiyonlar — müzik dijital kütüphaneleri, müziksel arşivlere kamu erişimi, referans noktaları ve araştırma veritabanları.
  • Müzik ve fikri mülkiyet hakları — ulusal ve uluslararası telif hakkı sorunları, dijital hak yönetimi, tanımlama ve izlenebilirlik.
  • Müzik Sosyolojisi ve Ekonomisi — müzik endüstrisi ve MBİ'nin üretim, dağıtım, tüketim zincirindeki kullanımı, kullanıcı profillemesi, doğrulama, kullanıcı ihtiyaçları ve beklentileri, müzik IR sistemlerinin değerlendirilmesi, test koleksiyonlarının oluşturulması, deneysel tasarım ve metrikler.

Akademik faaliyet

  • Uluslararası Müzik Bilgisi Alma Derneği (ISMIR) konferansı, müzik bilgisi alma araştırmaları için en üst düzey mekandır.
  • Uluslararası Akustik, Konuşma ve Sinyal İşleme Konferansı (ICASSP) da oldukça alakalı bir etkinliktir.

Ayrıca Bakınız

  • Ses arama motoru
  • Ses madenciliği
  • Müzikal temalar sözlüğü
  • Dijital haklar yönetimi
  • Dijital sinyal işleme
  • Etnomüzikoloji
  • Müzik yazılımlarının listesi
  • Multimedya bilgi erişim
  • Otomatik içerik tanıma
  • Müzikoloji
  • Optik müzik tanıma
  • Parsons kodu
  • Ses ve müzik bilişimi

Kaynakça

  1. ^A. Klapuri and M. Davy, editors. Signal Processing Methods for Music Transcription. Springer-Verlag, New York, 2006.
  2. ^Eidenberger, Horst (2011). “Fundamental Media Understanding”, atpress. ISBN 978-3-8423-7917-6.
  3. ^David Moffat, David Ronan, and Joshua D Reiss. "An Evaluation of Audio Feature Extraction Toolboxes". In Proceedings of the International Conference on Digital Audio Effects (DAFx), 2016.

Dış Bağlantılar

Örnek MIR Uyulamaları

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Piyano</span> müzik aleti

Piyano, İtalya'da Bartolomeo Cristofori tarafından 1700 yılı civarında icat edilmiş akustik, tuşlu bir müzik aletidir. Piyanoda ses, teller vasıtasıyla elde edilir. Piyanonun tuşlarına basıldığında içindeki tahta çekiç tellere vurarak sesi oluşturur. Tahta çekicin tellere vurmasından dolayı piyano bazen vurmalı telli çalgı olarak da sınıflandırılır. Piyano klasik ve caz müzikte yaygın olarak kullanılır. Solo performanslar, ansambl, oda müziği, eşlik, bestecilik ve prova için oldukça uygun bir enstrümandır. Piyano taşınabilir bir enstrüman olmamasına ve genelde pahalı olmasına rağmen çok yönlülüğü ve aynı anda birçok yerde bulunma özelliği ile dünyada en yaygın olarak kullanılan enstrümanlardan biri olmayı başarmıştır

Sinyaller ve sistemler kavram ve teorisi diğer birçok mühendislik ve bilim dallarıyla birlikte, elektrik ve elektronik mühendisliğinin hemen her alanında ve Biyomedikal mühendisliğinin tıbbi cihazlar ve biyoelektrik gibi elektrikle ilgilenen alt disiplinlerinde gerekli olup, haberleşme, EKG, EEG gibi tıbbi cihazlar, devreler ve sistemler ve kontrol sistemleri gibi alanlardaki ileri düzeyde çalışmaların matematiksel temelini oluşturur.

<span class="mw-page-title-main">Pro Tools</span>

Pro Tools, başlangıcında Digidesign, şu anda ise Avid Technology tarafından üretilen olan bir hard disk ses kayıt, miks ve prodüksiyon sistemidir. Çeşitli ses arabirimleri, DSP işlemcileri, kontrol arabirimleri ve Pro Tools yazılımından oluşmaktadır. MacOS ve Windows platformlarıyla uyumludur. Günümüzde birçok ses stüdyosunda ve film stüdyosunda ses ve müzik üretimi amacıyla kullanılmaktadır.

<span class="mw-page-title-main">K3b</span>

K3b, Linux sistemler için tasarlanmış, KDE projesi kapsamında gelişitirilen özgür ve ücretsiz bir CD/DVD/Blu-ray yazma uygulaması. K3b kullanılarak; Veri CD'leri oluşturma, Ses CD'si hazırlama, kalıp dosyası yazdırma gibi temel yazdırma işlemlerinin yanı sıra Video CD/DVD'lerini ya da Ses CD'lerini bilgisayara kopyalama gibi daha pek çok işlem gerçekleştirilebilir.

iTunes Apple yazılımı

iTunes, Apple şirketinin ürettiği, Mac OS X, Windows 2000, Windows XP, Windows Vista ve Windows 8 altında çalışabilen ücretsiz bir film ve müzik oynatıcı, ortam oynatıcısı, internet radyosudur. 9 Ocak 2001 yılında sunulmuştur. C++ dilinde yaratılmıştır. Müzik oynatmaktan, arşiv organize etmeye, hatta film ve müzik satın almaya kadar pek çok özelliği vardır. MacOS ve Microsoft Windows işletim sistemlerini çalıştıran kişisel bilgisayarlarda dijital müzik ve video indirme işlemlerini yürütmek, müzik indirmek ve düzenlemek için kullanılır.sayar Mac OS 9 için 2.0.4 sürümünden itibaren geliştirilmesi durdurulmuştur. iTunes Store, iPhone, iPad ve iPod Touch'da da mevcuttur.

<span class="mw-page-title-main">Müzik Enstrümanları Dijital Arabirimi</span>

Müzik Enstrümanları Dijital Arabirimi ya da kısaca MIDI, elektronik müzik aletleri ve bilgisayarlar arasında gerçek zamanlı veri alışverişini sağlayan, endüstri standardı haline gelmiş yaygın bir iletişim protokolü.

Virtual Studio Technology, ses sentezleyici ve ses efekt eklentilerinin editör yazılımları ve sabit disk kayıt sistemleri ile kullanılabilmesini sağlayan, gerçek zamanlı işlem yapabilen bir arayüz standardı. Müzik sektöründe önemli bir yer tutan teknoloji Steinberg tarafından geliştirilmiştir.

<span class="mw-page-title-main">Synthesizer</span>

Synthesizer farklı türde bir müzik yaratmak ve elektriksel sinyaller üretmek için kullanılan bir müzik aletidir. Üretilen sinyaller bir enstrüman amfisi, hoparlör ya da kulaklık aracılığıyla sese dönüştürülüp duyulur hale gelir. Synthesizer ile var olan çalgı ve doğadaki sesleri yeniden üretmek mümkün olduğu gibi, tamamen özgün yeni sesler yaratmak da mümkündür.

<span class="mw-page-title-main">GarageBand</span>

GarageBand Apple Inc. tarafından geliştirilen, kullanıcılara müzik veya podcast oluşturmalarını sağlayan, OS X ve iOS için bir dizi dijital ses işleme istasyonudur. iTunes, iMovie, iDVD, iWeb ve iPhoto ile birlikte iLife yazılım paketinin parçasıdır.

<span class="mw-page-title-main">Nokia N73</span>

Nokia N73 Nokia'nın 2006 yılının 2. çeyreğinde piyasaya sürdüğü, işletim sistemi Symbian OS 9.1, S60 3. edisyon olan telefon. N73-1 ve N73-2 olmak üzere iki farklı çeşidi vardır. 2. çeşidinde birinci sürümünden farklı olarak müzik kısayol tuşu atanmıştır.

<span class="mw-page-title-main">Mus2</span>

Mus2, Türk makam müziği ve mikrotonal müzik eserlerinin notaya alımı ve seslendirilmesi için geliştirilmiş bir müzik yazılımıdır. Diğer nota düzenleyici yazılımlardan farklı olarak, Mus2'de kullanıcı herhangi bir akort sisteminde nota yazabilir ve bu notaları doğru entonasyonla dinleyebilir. Mus2 ayrıca sade arayüzü ve kolay kullanımı ile de beğeni toplamış bir yazılımdır.

SoundCloud, İsveç'te kurulan ve Berlin'den yönetilen çevrimiçi ses dağıtım platformu ve müzik paylaşım sitesi. Kullanıcıların ses dosyalarını yükleyip tanıtmasına ve paylaşmasına, dinleyicilerin bu dosyaları web üzerinden dinlemesine olanak sağlar. 2007'de Alexander Ljung ve Eric Wahlforss tarafından kurulan SoundCloud zaman içinde dünyanın en büyük müzik akış servislerinden biri oldu. Ücretsiz ve ücretli üyelik seçenekleri bulunmakta, bilgisayar ve mobil cihazlarda kullanılabilmektedir. 200 milyon şarkı ve 20 milyondan fazla sanatçıdan oluşan küresel bir topluluktur.

Shazam Macintosh, kişisel bilgisayarlar, akıllı telefonlar ve tabletler için mobil bir uygulamadır. Cihazdaki mikrofonu oynayan ve kullanan kısa bir örneğe dayalı olarak müzik, film, reklam ve televizyon şovlarını tanımlayabilir. Shazam Entertainment Limited, 1999 yılında Chris Barton, Philip Inghelbrecht, Avery Wang ve Dhiraj Mukherjee tarafından kuruldu. 12 Aralık 2017 itibarıyla hizmet Apple şirketi tarafından 400 milyon dolara satın alındı. Yazılım, macOS, iOS, watchOS ve tvOS için, ayrıca başka platformlar için de kullanılabilir.

<span class="mw-page-title-main">Nokia 6233</span>

Nokia 6233 Nokia tarafından 2005 yılının dördüncü çeyreğinde piyasaya sunulan ve Nokia 6000 serisi'ne ait cep telefonu idi. Seri 40 sisteminde çalıştı. Nokia 6230 modelinin devamı, Nokia 6120 classic ve Nokia 6500 classic modelinin öncülüdür.

<span class="mw-page-title-main">Nokia 5300</span>

Nokia 5300 XpressMusic, Nokia'nın XpressMusic serisinin bir parçası olan kaydırmalı bir cep telefonudur. 26 Eylül 2006'da tanıtıldı ve o yılın sonunda piyasaya sürüldü. Seri 40 3. Versiyon Özellik Paketi 2 ile çalışır.

<span class="mw-page-title-main">Ses analizi</span>

Ses analizi ya da Konuşma analizi, iletişimi ve gelecekteki etkileşimi iyileştirmek için müşteri bilgilerini toplamak üzere kaydedilen çağrıları analiz etme sürecidir. Süreç, öncelikle müşteri iletişim merkezleri tarafından bir işletmeyle müşteri etkileşimlerinde ihtiyaçları çıkarmak için kullanılır.

<span class="mw-page-title-main">Bilgisayarlı görü</span> görsellerden veri bilgisi çıkartmak

Bilgisayarlı görü, bilgisayarların dijital görüntülerden veya videolardan nasıl bir anlam kazanabileceğiyle ilgilenen disiplinler arası bilimsel bir alandır. Mühendislik yöntemleriyle, insan görsel sisteminin yapabileceği görevleri anlamaya ve otomatikleştirmeye çalışmaktadır.

<span class="mw-page-title-main">CD ripper</span>

CD Ripper, CD kopyalayıcı, CD yakalayıcı veya CD çıkarıcı, bir kompakt diskteki Compact Disc Digital Audio (CD-DA) biçimindeki ham dijital sesi WAV veya MP3 gibi standart bilgisayar ses dosyalarına dönüştürerek kopyalayan bir yazılımdır.

<span class="mw-page-title-main">Dijital piyano</span> Akustik piyanonun ve diğer enstrümanların sesini kopyalamak için örnekler ve sentezleyiciler kullanan müzik aleti

Dijital piyano, hem çalma hissi hem de çıkardığı ses bakımından öncelikle geleneksel akustik piyanoya alternatif olması için tasarlanmış bir tür elektronik klavyeli enstrüman'dır. Dijital piyanolar, bir veya daha çok dahili hoparlör aracılığıyla çalınan, akustik piyanonun kaydedilmiş ses örneklerini kullanır. Ayrıca akustik piyano hissini yeniden yaratan ağırlıklı tuşları, dokunma hassasiyetine göre değişen ses seviyeleri vardır. Bazı dijital piyanolar aynı zamanda dik veya kuyruklu piyanoya benzeyecek şekilde tasarlanır.

<span class="mw-page-title-main">Ableton Live</span>

Ableton Live; Live olarak da veya bazen halk dilinde Ableton olarak da bilinmesiyle birlikte, Alman Ableton şirketi tarafından macOS ve Windows için geliştirilen bir dijital ses iş istasyonudur.