İçeriğe atla

Video İzleme

Video izleme/ Nesne Takip, bir kamera kullanarak zaman içinde hareket eden bir veya birden çok nesneyi bulma işlemidir. İnsan-bilgisayar etkileşimi, güvenlik ve gözetim, video iletişimi ve sıkıştırma, artırılmış gerçeklik, trafik kontrolü, tıbbi görüntüleme[1] ve video düzenleme gibi çeşitli kullanımları vardır.[2][3] Video izleme, videonun içerdiği veri miktarı nedeniyle zaman alıcı ve yavaş çalışabilen bir süreç olabilmektedir. Tek başına kullanımda bile zor bir problem olan bu metot, nesne tanıma teknikleriyle birlikte de kullanılarak daha işlevsel hale getirilmektedir.

Amaç

Video izlemenin amacı, hedef nesneleri ardışık video karelerinde ilişkilendirmektedir. Yani amaç, ilk karede bulanan görselin art arda gelen karelerin hepsinde bulunarak işaretlenmesidir. Bu ilişkilendirme durumu, nesneler kare hızına göre daha hızlı hareket ettiğinde zorlaşmaktadır. Sorunun karmaşıklığını artıran diğer bir durum, izlenen nesnenin zaman içinde yönünü değiştirmesidir. Bu sebepten ötürü video izleme sistemleri nesnenin olası hareketleri için hedef görüntüsünün nasıl değişebileceğini açıklayan bir hareket modeli kullanmaktadır.[4]

Hareket modellerine örnekler:

Robot elin nesne takibiyle bir topu yakalamasına yönelik çalışma[5]
  1. Düzlemsel bir nesne izlenirken, nesnenin görüntüsü 2 boyuta çevrilebilir.
  2. Nesne 3 boyutlu olduğunda, nesnenin 3 boyutlu konumu ve yönüne bağlı olarak açısı tanımlanabilir.
  3. Video sıkıştırma için anahtar kareleri makro bloklara bölme. Bu model, her bir makro bloğun hareket parametreleri tarafından verilen bir hareket vektörünün çevrelediği bir anahtar karenin bozulması üzerine çalışır.
  4. Deforme olabilen nesnelerin görüntüsü bir ağ ile kaplanabilir. Nesnenin hareketi, ağın düğümlerinin konumu ile tanımlanır.

Algoritmalar

Video izleme gerçekleştirmek için bir algoritma, sıralı video karelerini analiz ederek çerçeveler arasındaki hedeflerin hareketini çıkarmaktadır. Her biri güçlü ve zayıf yönlere sahip çeşitli algoritmalar vardır. Hangi algoritmanın kullanılacağını seçerken amaçlanan kullanımı dikkate almak önemlidir. Görsel izleme sisteminin iki ana bileşeni vardır. Bunlar hedef gösterimi ve yerelleştirme ile filtreleme ve veri ilişkilendirmesidir.

Hedef temsili ve yerelleştirme çoğunlukla aşağıdan yukarıya bir süreçtir. Bu yöntemler, hareketli nesneyi tanımlamak için çeşitli araçlar sağlamaktadır. Hedef nesneyi başarıyla bulmak ve izlemek, algoritmaya bağlıdır. Örneğin, blob izleme kullanmak insan hareketini tanımlamak için kullanışlıdır çünkü bir kişinin profili dinamik olarak değişmektedir. Tipik olarak bu algoritmalar için hesaplama karmaşıklığı düşüktür. Aşağıda bazı yaygın hedef gösterimi ve yerelleştirme algoritmaları verilmiştir:

Çekirdek Tabanlı Takip (Mean-Shift)

Çekirdek Tabanlı (Kernel-Based / MeanShift) izleme, benzerlik ölçüsünün maksimize edilmesine dayanan yinelemeli bir yerelleştirme algoritmasıdır.

Kontur Takibi

Kontur izleme, nesne sınırının tespit edilmesidir. Kontur izleme yöntemi, önceki çerçeveden başlatılan bir ilk konturu geçerli çerçevedeki yeni konumuna yinelemeli olarak geliştirme işlemidir. Bu yaklaşım, gradyan inişini kullanıp kontur enerjisini en aza indirerek konturu doğrudan geliştirimektedir. Bu yöntemler, karmaşık nesnelerin izlenmesine ve engellerin arkasında hareket eden nesneleri izleme gibi daha karmaşık nesne etkileşimine izin vermektedir.

Filtreler

Filtreleme ve veri ilişkilendirme yukarıdan aşağıya bir izlenim şeklinde ilerlemektedir. Ayrıca nesne hakkında önceki bilgileri birleştirmeyi, nesne dinamikleriyle ilgilenmeyi ve farklı hipotezlerin değerlendirilmesini içermektedir.[6]

Ek olarak, izleyici hareket halinde ise karmaşıklık artmaktadır. Burada tipik olarak, kamera sisteminin gerekli dinamiklerini ve bant genişliğini azaltmak için ve izleyiciyi önceden stabilize etmek için bir eylemsizlik ölçüm sistemi kullanılmaktadır. Ancak bu algoritmalar için hesaplama karmaşıklığı genellikle çok daha yüksektir.[7]

Kalman Filtresi

Kalman filtresi, Gauss gürültüsüne maruz kalan doğrusal fonksiyonlar için en uygun özyinelemeli Bayessian filtresidir. Zaman içinde gözlemlenen, gürültü vediğer yanlışlıkları içeren bir dizi ölçümü kullanmaktadır. Ayrıca tek başına bir ölçüme dayalı olanlardan daha kesin olma eğiliminde olan bilinmeyen değişkenlerin tahminlerini üreten bir algoritmadır.[8]

Partikül Filtresi

Parçacık filtresi, doğrusal ve Gauss olmayan süreçlerin temelindeki durum uzayı dağılımını örneklemek için kullanılmaktadır.[9]

Kaynakça

  1. ^ Mountney, Peter; Stoyanov, Danail; Yang, Guang-Zhong (Temmuz 2010). "Three-Dimensional Tissue Deformation Recovery and Tracking". IEEE Signal Processing Magazine. 27 (4): 14-24. doi:10.1109/MSP.2010.936728. ISSN 1558-0792. 25 Şubat 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  2. ^ Mihaylova, Lyudmila; Brasnett, Paul; Canagarajah, Nishan; Bull, David. Object Tracking by Particle Filtering Techniques in Video Sequences. 4 Mart 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  3. ^ Kato, H.; Billinghurst, M. (Ekim 1999). "Marker tracking and HMD calibration for a video-based augmented reality conferencing system". Proceedings 2nd IEEE and ACM International Workshop on Augmented Reality (IWAR'99): 85-94. doi:10.1109/IWAR.1999.803809. 8 Mart 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  4. ^ "Ishikawa Group Laboratory - Basic Concept and Technical Terms". ishikawa-vision.org. 7 Aralık 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  5. ^ "Sensor Fusion: High Speed Robots". ishikawa-vision.org. 15 Ocak 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  6. ^ Black, James; Ellis, Tim; Rosin, Paul (2003). "A Novel Method for Video Tracking Performance Evaluation". In Joint IEEE Int. Workshop on Visual Surveillance and Performance Evaluation of Tracking and Surveillance (VS-PETS: 125-132. 4 Mart 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  7. ^ "iIPSC-TR: Complete Target Tracking Range System Delivery". www.imar-navigation.de. 23 Mayıs 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  8. ^ Arulampalam, M.S.; Maskell, S.; Gordon, N.; Clapp, T. (Şubat 2002). "A tutorial on particle filters for online nonlinear/non-Gaussian Bayesian tracking". IEEE Transactions on Signal Processing. 50 (2): 174-188. doi:10.1109/78.978374. ISSN 1941-0476. 15 Mayıs 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  9. ^ Knuth, Donald E. (25 Eylül 2013). Art of Computer Programming, Volume 4, Fascicle 4,The: Generating All Trees--History of Combinatorial Generation (İngilizce). Addison-Wesley Professional. ISBN 978-0-13-270234-8. 23 Mayıs 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Animasyon</span> animasyon filmleri ve dizileri oluşturma süreci

Animasyon (canlandırma), birden çok resmin arka arkaya hızlı bir şekilde gösterilmesiyle elde edilen hareketli görüntüdür. İlk animasyonlar birkaç kâğıda istenen resimlerin çizilmesi, kâğıtların hızlıca geçirilmesi veya bir çemberin içine konup döndürülmesi ile yapılıyordu. Animasyon yapan kişilere animatör denir.

<span class="mw-page-title-main">Hızlı Fourier dönüşümü</span>

Hızlı Fourier dönüşümü bir dizinin ayrık Fourier dönüşümünü (DFT) ya da ters ayrık dönüşümünü hesaplayan bir algoritmadır. Fourier analizinde bir sinyal bulunduğu uzaydaki gösteriminden frekans uzayıki gösterimine ya da tersine dönüştürülür. DFT'de ise ayrık veri dizileri farklı frekans öğelerine ayrılır. Bu operasyon her ne kadar birçok alanda kullanışlı olsa da, doğrudan formüllerle hesabı hızlı ve pratik değildir; bu nedenle DFT hesabı için FFT algoritmaları kullanılmaktadır.

<span class="mw-page-title-main">Nielsen reytingleri</span>

Nielsen Reytingleri veya Nielsen İzleyici Oranları, ABD'de televizyon yayınları izleyici kitlesinin büyüklüğü ve bileşimini belirlemek amacıyla Nielsen Media Research tarafından geliştirilmiş izleyici ölçüm sistemleridir. Nielsen Media Research Arthur Nielsen tarafından kurulmuştur.

<span class="mw-page-title-main">Makine öğrenimi</span> algoritmaların ve istatistiksel modellerin kullanımıyla bilgisayarların yapacakları işleri kendileri çözebilmeleri

Makine öğrenimi (ML), veriden öğrenebilen ve görünmeyen verilere genelleştirebilen ve dolayısıyla açık talimatlar olmadan görevleri yerine getirebilen istatistiksel algoritmaların geliştirilmesi ve incelenmesiyle ilgilenen, yapay zekâda akademik bir disiplindir. Makine öğrenimi, bilgisayarların deneyimlerinden öğrenerek karmaşık görevleri otomatikleştirmeyi sağlayan bir yapay zeka alanıdır. Bu, veri analizi yaparak örüntüler tespit etme ve tahminlerde bulunma yeteneğine dayanır. Son zamanlarda yapay sinir ağları, performans açısından önceki birçok yaklaşımı geride bırakmayı başardı.

Görüntü birleştirme, fotoğraf birleştirme ya da resim birleştirme, parçalar halinde bulunan veya bölümler halinde görüntülenmiş resimlerin, görünüm alanlarının birleştirilerek panoramik veya yüksek çözünürlükte görüntüler üretebilmeyi sağlayan, fotoğrafların çoklu şekilde birleştirilmesine verilen isimdir. Görüntü birleştirme yaygın şekilde bilgisayar yazılımlarının kullanılması ile üretilir. Birleştirme esnasında sorunsuz sonuçların elde edilebilmesi için görüntülerin yaklaşma ve kesişme (birleşme) noktalarının hemen hemen tam olarak birleştirilmesi gerekir. Bazı birleştirme algoritmaları aslında faydalı olmasına rağmen, çakışma bölgelerinde HDR görüntüleme yaparak daha farklı görüntüler elde edilmesine neden olurlar. Bunların yanı sıra bazı dijital kameralar ile dahili görüntü birleştirme yapılabilir. Görüntü birleştirme günümüz dünyasında yaygın şekilde şu uygulamalarda kullanılmaktadır:

Telekomünikasyonda, alınan sinyal gücü göstergesi (RSSI) alınan bir radyo sinyalinde mevcut gücün bir ölçümüdür.

<span class="mw-page-title-main">Zamanda sonlu farklar yöntemi</span> elektromanyetizmada kullanılan bir yöntem

Zamanda sonlu farklar yöntemi, kısaca FDTD ya da Yee yöntemi, hesaplamalı elektromanyetizmada kullanılan bir sonlu farklar tekniğidir. Zaman düzleminde çalışan bir yöntem olduğundan ötürü, elektromanyetik spektrumun mikrodalga veya görünür ışık gibi farklı bölgelerinde anten veya fotonik aygıt tasarımı gibi çeşitli problemlerin çözümünde kullanılır. Aynı zamanda bu özellik, simülasyonu yapılan sistemin geniş bir frekans yelpazesine tepkisinin gözlenebilmesini sağlamaktadır. Matris tersinmesi gerektirmeyen bu FDTD, en yaygın elektromanyetik simülasyon yöntemlerinden biri olarak kabul edilir.

<span class="mw-page-title-main">Hareket detektörü</span>

Hareket dedektörü yakındaki hareketi algılamak için bir sensör kullanan elektrikli bir cihazdır. Hareket dedektörü bir görevi otomatik yapan veya bir alanda hareket olduğunda kişiyi uyaran sistemin bileşeni olarak çalışır. Güvenlik, otomatik aydınlatma kumandası, ev kontrolü, enerji verimliliği ve diğer yararlı sistemlerin hayati bir bileşenidir. Mekanik veya elektronik yöntemlerle gerçekleştirilebilir. Doğal organizmalar tarafından yapıldığında buna hareket algısı denir.

Nesne tespiti bilgisayarla görü ve görüntü işleme ile ilgili bilgisayar teknolojisi

Nesne tespiti, dijital görüntülerde ve videolarda belirli bir sınıftaki anlamsal nesnelerin örneklerini algılamakla ilgilenen, bilgisayarla görme ve görüntü işleme ile ilgili bir bilgisayar teknolojisidir. Nesne tespiti, bilgisayarla görme ve görüntü işlemeden farklı olarak algılanan nesnenin görüntü üzerinde koordinatlarının bulunmasını içerir. Bulunan koordinatlar ile nesnenin bir çerçeve ile içine alınacağı alan da tespit edilmiş olur. Nesne tespiti, gerçek zamanlı (anlık) ve gerçek zamanlı olmayan olarak ikiye ayrılır. Üzerinde iyi araştırma yapılmış alanlar yüz tespiti, yaya tespiti ve araç tespitidir. Nesne tespiti, görüntü alma ve video gözetimi dahil olmak üzere bilgisayarla görmenin birçok alanında uygulamaya sahiptir.

<span class="mw-page-title-main">Fitts kanunu</span>

Fitts kanunu, esas olarak insan-bilgisayar etkileşimi ve ergonomide kullanılan insan hareketinin öngörücü bir modelidir. Bu bilimsel yasa, bir hedef alana hızla hareket etmek için gereken sürenin, hedefe olan uzaklık ile hedefin büyüklüğü arasındaki oranın bir fonksiyonu olduğunu öngörür. Paul Fitts tarafından ortaya atılmıştır. Fitts yasası, bir nesneye el veya parmakla fiziksel olarak dokunarak veya bir işaretleme cihazı kullanarak; bilgisayar monitöründeki nesneyi işaret ederek, işaret etme eylemini modellemek için kullanılır. Hedef nesnenin boyutuna ve uzaklığına bağlı olan bir şeye işaret etmek için geçen süreyi hesaplar. Fare kullanma ve diğer giriş araçlarıyla ekranda herhangi bir yere tıklama süresini gösterir. Tasarımcılar tarafından hedefteki butonların, örneğin kaydet butonu gibi önemli butonların daha büyük ve yakın düzenlenmesi ile uygulama alanı bulmaktadır.

Uzay psikolojisi, uzay uçuşunu tavsiye etmek için psikolojik uygulamalardan faydalanmaktadır. Bu uygulamalar; ekip seçimine, bireysel veya ekibin zihinsel hazırlığına, ekip eğitimine psikolojik destekle yardımcı olmaktadır. Endüstriyel ve örgütsel psikolojinin uygulanması ve yeterli yaşam alanının sağlanabilmesi için uzay aracı yapımında insan faktörleri ve ergonomi uygulamalarını içermektedir.

<span class="mw-page-title-main">Bilgisayarlı görü</span> görsellerden veri bilgisi çıkartmak

Bilgisayarlı görü, bilgisayarların dijital görüntülerden veya videolardan nasıl bir anlam kazanabileceğiyle ilgilenen disiplinler arası bilimsel bir alandır. Mühendislik yöntemleriyle, insan görsel sisteminin yapabileceği görevleri anlamaya ve otomatikleştirmeye çalışmaktadır.

Otomatik hedef tanıma, bir algoritmanın veya cihazın, sensörlerden elde edilen verilere dayanarak hedefleri veya diğer nesneleri tanıma yeteneğidir.

Otomatik kümeleme algoritmaları, veri kümeleri hakkında önceden bilgi sahibi olmadan kümeleme yapabilen algoritmalardır. Diğer küme analizi tekniklerinin aksine, otomatik kümeleme algoritmaları, gürültü ve aykırı noktaların varlığında bile en iyi küme sayısını belirleyebilir.

<span class="mw-page-title-main">Genel oyun oynama</span>

Genel oyun oynama, birden fazla oyunu başarıyla oynayabilmek için yapay zeka programlarının yaptığı bir tasarımdır. Satranç gibi birçok oyun için bilgisayarlar, başka bir bağlama aktarılamayan özel olarak tasarlanmış bir algoritma kullanarak bu oyunları oynayacak şekilde programlanmıştır. Örneğin, satranç oynayan bir bilgisayar programı dama oynayamaz. Genel oyun oynama, Yapay Genel Zeka yolunda gerekli bir kilometre taşı olarak kabul edilmektedir.

Video gözetimi için yapay zeka, insanları, araçları, nesneleri ve olayları tanımak için video gözetim kameralarından gelen ses ve görüntüleri analiz eden bilgisayar yazılım programlarını kullanmaktadır. Güvenlik müteahhitleri programı, kamera gözetimi ile korunan mülk için kameranın görüşü ve günün saatleri için programlanan kısıtlı alanları tanımlayan yazılımdır. Yapay zeka, günün o saatinde o bölgeye kimsenin girmesine izin verilmeyen "kural" setini ihlal eden bir kişi tespit ederse bir uyarı göndermektedir.

Video içerik analizi veya video analizi olarak da bilinen video içerik analizi, zamansal ve uzamsal olayları algılamak ve belirlemek için videoyu otomatik olarak analiz etme yeteneğidir.

Rastgele yürüten algoritması, görüntü segmentasyonu için bir algoritmadır. Algoritmanın ilk açıklamasında, bir kullanıcı etkileşimli olarak az sayıda pikseli bilinen etiketlerle, örneğin "nesne" ve "arka plan" olarak etiketlemektedir. Etiketlenmemiş piksellerin her birinin rastgele bir yürüteç serbest bıraktığı düşünülmektedir. Her pikselin rastgele yürüteçlerinin ilk olarak her etiketi taşıyan bir tohuma ulaşma olasılığı hesaplanmaktadır. Yani bir kullanıcı her biri farklı bir etikete sahip K tohum yerleştirirse, o zaman gereklidir. Her piksel için, pikselden ayrılan rastgele bir yürüyenin her bir tohuma ilk varma olasılığını hesaplanır. Bu olasılıklar, bir lineer denklem sistemi çözülerek analitik olarak belirlenmektedir. Her piksel için bu olasılıkları hesapladıktan sonra, piksel, rastgele bir yürüteç gönderme olasılığı en yüksek olan etikete atanmaktadır. Görüntü, her pikselin komşu piksellere kenarlarla bağlanan bir düğüme karşılık geldiği ve kenarların pikseller arasındaki benzerliği yansıtacak şekilde ağırlıklandırıldığı bir grafik olarak modellenmektedir. Bu nedenle, rastgele yürüyüş ağırlıklı grafikte geçekleşmektedir.

<span class="mw-page-title-main">VSDC Free Video Editor</span>

VSDC Ücretsiz Video Düzenleyici, Flash-Integro LLC tarafından geliştirilen doğrusal olmayan bir düzenleme programıdır. VSDC 4K çözünürlük UHD, 3B ve VR 360 derece videolar dahil olmak üzere herhangi bir biçim ve çözünürlükteki video dosyalarını işleyebilir. Düzenleyici, profesyonel renk düzeltme araçlarının yanı sıra Hareket yakalama modülünü kullanarak videodaki nesnelerin hareketini izleme yeteneğine sahiptir. Ayrıca VirtualDub eklentilerini destekleyerek ekrandan video yakalama, ses kaydetme ve multimedya dosyalarını Facebook, Vimeo, YouTube, Instagram ve Twitter'da yayınlamak üzere çeşitli biçimlerde kaydetme olanağı sunar.

<span class="mw-page-title-main">Zaman-aktivite eğrisi</span>

Tıbbi görüntülemede, zaman-aktivite eğrisi, x ekseninde çizilen zamana karşı y ekseninde çizilen radyoaktivitenin bir eğrisidir. Dinamik bir taramadan zaman içinde ölçülen, bir görüntüdeki ilgilenilen bir bölgedeki radyo izleyicinin konsantrasyonunu gösterir. Genel olarak, bir doku içinde bir zaman-aktivite eğrisi elde edildiğinde, buna doku zaman-aktivite eğrisi adı verilir; bu, bir doku içinde ilgilenilen bir bölgedeki izleyicinin zaman içindeki konsantrasyonunu temsil eder.