İçeriğe atla

Veri analizi

Veri görselleştirme sürecini gösteren akış şeması. Şemaya genel bakış Bu diyagram veri bilimi sürecini göstermektedir. Veriler, dünya tarafından temsil edilen ortamdaki sensörlerden toplanır. Veriler, işlenmek üzere kullanılabilen bir veri kümesi (tipik olarak bir veri tablosu) oluşturmak için "temizlenir" veya başka şekilde işlenir. Daha sonra keşif amaçlı veri analizi ve istatistiksel modelleme yapılabilir. "Veri ürünü", perakendecilerin satın alma geçmişine dayalı yeni satın alımlar önermek için kullandıkları bir programdır. Ayrıca veri oluşturabilir ve çevreye geri besleyebilir.Bu diyagram, O'Neill ve Schutt'un (2014) "Veri Bilimi Yapmak" kitabındaki benzer bir şemaya dayanmaktadır.[1] Gil Press, Mayıs 2013'te bir Forbes makalesinde veri biliminin tarihini ve ilgili terminolojiyi tartıştı.[2] Referanslar ↑ O'NEİL, Cathy ve Schutt, Rachel (2014) Veri Bilimi Yapmak, O'REİLLY ISBN 978-1-449-35865-5. ↑ Forbes-Gil Press-Veri Biliminin Çok Kısa Bir Tarihi-Mayıs 2013

Veri analizi, faydalı bilgiler bulma, sonuçları bilgilendirme ve karar vermeyi destekleme amacı ile verileri inceleme, temizleme, dönüştürme ve modelleme işlemidir. Veri analizi, farklı isimler altında çeşitli teknikleri bünyesinde bulunduran, işletme, bilim ve sosyal bilimler gibi farklı alanlarda kullanılan çok çeşitli görünüş ve yaklaşımlara sahiptir. Günümüzün iş dünyasında, veri analizi karar verme işlemlerinin daha bilimsel hale getirilmesine ve işletmelerin daha etkin çalışmalarına yardımcı olmaktadır.[1]

Veri madenciliği, modellemeye ve tamamen tanımlayıcı amaçtan ziyade tahmin edici bilgi keşiflerine odaklanan özel bir veri analiz tekniğidir. Halbuki iş zekası, ağırlıklı olarak iş bilgilerine odaklanan ve büyük ölçüde veri birleştirmeye dayanan veri analizini kapsar.[2] İstatistiksel uygulamalarda veri analizi, tanımlayıcı istatistikler, keşifsel veri analizi (EDA) ve doğrulayıcı veri analizi (CDA) gibi kısımlara ayrılabilir. EDA, verilerdeki yeni özellikleri keşfetmeye odaklanırken, CDA mevcut hipotezleri onaylamaya veya tahrif etmeye odaklanır. Tahmine dayalı analitik, tahmin veya sınıflandırma için istatistiksel modellerin uygulanmasına odaklanırken, metin analizi, yapılandırılmamış veri türü olan metin kaynaklarından bilgi çıkarmak ve sınıflandırmak için istatistiksel, dilsel ve yapısal teknikler uygular. Yukarıdakilerin hepsi veri analizi çeşitleridir.

Veri entegrasyonu veri analizinin öncüsüdür ve veri analizi, veri görselleştirme ve veri yayma ile yakından bağlantılıdır. Veri analizi terimi bazen veri modelleme ile eş anlamlı olarak kullanılır.

Ayrıca bakınız

Kaynakça

  1. ^ Xia, B. S., & Gong, P. (2015). Review of business intelligence through data analysis. Benchmarking, 21(2), 300-311. doi:10.1108/BIJ-08-2012-0050
  2. ^ "Exploring Data Analysis". 18 Ekim 2017 tarihinde kaynağından arşivlendi. Erişim tarihi: 18 Ekim 2017. 

İlgili Araştırma Makaleleri

Veri madenciliği, büyük ölçekli veriler arasından faydalı bilgiye ulaşma, bilgiyi madenleme işidir. Büyük veri yığınları içerisinden gelecekle ilgili tahminde bulunabilmemizi sağlayabilecek bağıntıların bilgisayar programı kullanarak aranması olarak da tanımlanabilir.

<span class="mw-page-title-main">İstatistik</span>

İstatistik veya sayım bilimi, belirli bir amaç için veri toplama, tablo ve grafiklerle özetleme, sonuçları yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin yapma, deney düzenleme ve gözlem ilkelerini kapsayan bir bilimdir. Belirli bir amaç için verilerin toplanması, sınıflandırılması, çözümlenmesi ve sonuçlarının yorumlanması esasına dayanır. Bu çerçevede yapılan işlemlerin tümüne sayımlama denir.

<span class="mw-page-title-main">SPSS</span>

SPSS bilgisayar programı, ilk sürümü 1968 yılında piyasaya verilmiş istatistiksel analize yönelik bir bilgisayar programıdır. Uzun bir dönem bu program SPSS Inc. adını taşıyan bir ABD asıllı şirket tarafından hazırlanıp sürüme sokulup satılmıştır. 2009'da bu şirket ve bu programın sahipliliği IBM şirketine satılmıştır. Bu tarihten sonra bir geçiş döneminde PASW Statistics adıyla anılıp Ağustos 2010 'dan itibaren resmen IBM SPSS Statistics olarak isimlendirilmeye başlanmıştır. Şu anda en son versiyon IBM SPSS Statistics 24.0 olup bu versiyon Mart 2016'dan itibaren pazarlanmaya başlanmıştır.21 Mart 2018 tarihinde Wayback Machine sitesinde arşivlendi.

Veri modelleme, bir işletmenin, kurumun hatırlamaya değer bulduğu verilerin şekil ve metin olarak ifade edilmesidir. Diğer bir deyişle bir işletmede teknik ve teknik olmayan herkesin bilişim ihtiyaçlarını ifade etmeye çalışırken birbirini anlamada kullanabileceği görsel bir iletişim dilidir. Yazılım geliştirmenin en önemli süreçlerinden biri olan veri modelleme bilişim ihtiyaçlarının keşfedilmesi ve herkesin anlayabileceği bir şekilde belgelenmesi işlemidir. Bilişim ihtiyaçları, veriler ve işletme ihtiyaçlarını destekleyen işletme kurallarıdır. Bir veri modeli herhangi bir işletmenin veya bir yazılımın karmaşık bilişim ihtiyaçlarının tümünü yeterince ifade edebilmek için kullanılabilecek bir araçtır. Bir bilişim sistemi başlıca 3 ihtiyacı karşılar; çeşitli verilerin saklanması, işlenmesi ve görüntülenmesi. Görüldüğü gibi bilişim sistemlerinin temelinde veri yer almaktadır. Veri Tabanı sistemleri ise en basit ifadeyle; verinin saklanması ve işlenmesi ile ilgili olarak geliştirilen genel amaçlı çeşitli yazılımlardır. Kısaca bilginin işlenmemiş hali olarak tanımlanan verinin modellenmesi herhangi bir bilişim sistemi geliştirmede neredeyse işin yarısını oluşturur. Verinin gerçek sahibi kullanıcıdır. Durum böyle olunca bilişim sistemlerinin geliştirilmesi sırasında kullanıcı temelli bir yaklaşım önem kazanmaktadır. Kullanıcı yönelimli bu yaklaşımın bazı yararları aşağıda sıralanmaktadır.

Nesne Yönelimli Çözümleme ve Tasarım, bir sistemin/sistem modülleri setinin/organizasyonun/işletme biriminin gereksinimlerinin çözümlenmesinde ve uygun bir çözümün tasarımında nesne ile modelleme tekniklerini kullanır. Modern nesne yönelimli çözümleme ve tasarım yöntemlerinin çoğu, gereksinim, tasarım, uygulama, test ve dağıtım süreçleri boyunca kullanım senaryoları üzerine kuruludur. Kullanım Senaryoları, nesne yönelimli programlama ile birlikte ortaya çıkmış olmasına rağmen yordamsal programlanan sistemlerde de işe yaramaktadır.

<span class="mw-page-title-main">Makine öğrenimi</span> algoritmaların ve istatistiksel modellerin kullanımıyla bilgisayarların yapacakları işleri kendileri çözebilmeleri

Makine öğrenimi (ML), veriden öğrenebilen ve görünmeyen verilere genelleştirebilen ve dolayısıyla açık talimatlar olmadan görevleri yerine getirebilen istatistiksel algoritmaların geliştirilmesi ve incelenmesiyle ilgilenen, yapay zekâda akademik bir disiplindir. Makine öğrenimi, bilgisayarların deneyimlerinden öğrenerek karmaşık görevleri otomatikleştirmeyi sağlayan bir yapay zeka alanıdır. Bu, veri analizi yaparak örüntüler tespit etme ve tahminlerde bulunma yeteneğine dayanır. Son zamanlarda yapay sinir ağları, performans açısından önceki birçok yaklaşımı geride bırakmayı başardı.

Veri ambarı, ilişkili verilerin sorgulandığı ve analizlerinin yapılabildiği bir depodur. Veri ambarı veritabanını yormamak için oluşturulmuştur. Bir veri ambarı ilgili veriyi kolay, hızlı ve doğru biçimde analiz etmek için gerekli işlemleri yerine getirir. Veri ambarı, işlemsel sistemlerdeki veriyi kopyalayıp, karar verme işlemi için uygun formda saklar. Veri ve bilgiler, üretildiklerinde heterojen kaynaklardan elde edilirler. Yıldız Teknik Üniversitesi'ne göre: Veri ambarı, başlangıçta farklı kaynaklardan gelen verinin üzerinde daha etkili ve daha kolay sorguların yapılmasını sağlamaktadır.

Matematiksel model, bir sistemin matematiksel kavramlar ve dil kullanılarak tanımlanmasıdır. Matematiksel model geliştirme süreci, matematiksel modelleme olarak adlandırılır. Matematiksel modeller, doğa bilimlerinde ve mühendislik disiplinlerinde bunun yanı sıra sosyal bilimlerde kullanılır. Matematiksel modelleri daha çok fizikçiler, mühendisler, istatistikçiler, operasyon araştırma analistleri ve ekonomistler kullanır. Model, bir sistemi açıklamaya, farklı bileşenlerin etkilerini incelemeye ve bir davranış hakkında öngörüde bulunmak için yardımcı olabilir.

<span class="mw-page-title-main">İş zekası</span> şirketlerin ve kurumların başarısı için yapılan analizleri anlayabilme ve geliştirebilme kabiliyeti

İş zekası veya kısaca: BI, iş amaçları için ham veriyi anlamlı ve kullanışlı bilgiye dönüştüren teorilerin, yöntemlerin, süreçlerin, mimarilerin ve teknolojilerin bir kümesidir. BI yeni fırsatlar tanımlamak ve geliştirmeye yardım etmek için büyük miktarlarda bilgi yönetir. Yeni fırsatların ve etkili strateji gerçekleştirmek için bir rekabet piyasası avantajı ve uzun soluklu kararlılık sağlar.

<span class="mw-page-title-main">Metin madenciliği</span>

Metin madenciliği, çalışmaları metni veri kaynağı olarak kabul eden veri madenciliği çalışmasıdır. Diğer bir tanımla metin üzerinden yapısallaştırılmış veri elde etmeyi amaçlar. Metin madenciliği, metinlerin sınıflandırılması, bölütlenmesi, metinlerden konu çıkarılması, metinler için sınıf taneciklerinin üretilmesi, metinlerde görüş analizi yapılması, metin özetlerinin çıkarılması ve metinin özü ile ilgili ilişki modellemesi gibi çalışmaları hedefler.

<span class="mw-page-title-main">İşlev modeli</span>

Sistem ve yazılım mühendisliğindeki işlev modeli modellenen sistem veya konu alanının işlevlerinin yapısal temsilidir.

Kavramsal model bir sistemin temsilidir ve modelin temsil ettiği sistemin insanların daha rahat bir şekilde anlamalarına yardımcı olur. Örneğin, montajı yapılarak oluşturulan bir oyuncak model temsil ettiği objenin çalışmasını modelini oluşturacak bir şekilde çalışabilir.

Üst yönetim destek sistemi, olarak da bilinen üst yönetim bilgi sistemi, karar verme gereksinimlerini ve üst düzey yönetsel bilgiyi destekleyen ve kolaylaştıran Yönetim bilişim sisteminin bir parçasıdır. Organizasyonel amaçlar için, konu ile ilgili iç ve dış bilgiye kolay erişim sağlar. Yaygın olarak karar destek sisteminin özelleşmiş bir biçimi olarak göz önüne alınmıştır.

<span class="mw-page-title-main">Küresel Biyoçeşitlilik Danışma Tesisi</span> biyoçeşitlilik üzerine bilimsel verilerin toplayıcısı; veri portalı

Global Biodiversity Information Facility (GBIF) ya da Türkçe çevirisiyle Küresel Biyoçeşitlilik Danışma Tesisi, biyolojik çeşitlilik hakkında bilimsel veri sağlamak amacıyla İnternet üzerinden web hizmeti kullanmaya odaklanmış uluslararası organizasyon. Veriler dünya çapında birçok kurum tarafından sağlanmakta olup; GBIF'in bilgi mimarisi, bu verileri tek bir portal üzerinden erişilebilir ve aranabilir hale getirir. GBIF portalindan elde edilebilecek veriler öncelikle bitkiler, hayvanlar, mantarlar ve dünyadaki mikropların yanı sıra canlıların bilimsel isim verileri ile ilgili dağılım verileridir.

<span class="mw-page-title-main">Matematiksel istatistik</span> matematiksel yöntemlerin kullanıldığı olası istatistikler

Matematiksel istatistik, istatistiksel veri toplama tekniklerinin aksine, matematiğin bir dalı olan olasılık teorisinin istatistiğe uygulanmasıdır. Bunun için kullanılan özel matematiksel teknikler arasında matematiksel analiz, doğrusal cebir, stokastik analiz, diferansiyel denklemler ve ölçü teorisi bulunur.

<span class="mw-page-title-main">Veri bilimi</span> verilerden bilgi ve içgörü elde etmeye odaklanan disiplinler arası çalışma alanı

Veri bilimi, yapılandırılmış ve yapılandırılmamış verilerden bilgi ve öngörü elde etmek için bilimsel yöntemleri, süreçleri, algoritmaları ve sistemleri kullanan çok disiplinli bir alandır. Veri bilimi veri madenciliği ve büyük verilerle ilişkilidir.

<span class="mw-page-title-main">Analiz</span> belirli bir türdeki mevcut verilere analitik yöntemler uygulama, karmaşık bir konuyu veya maddeyi daha iyi anlamak için daha küçük parçalara ayırma süreci

Analiz, karmaşık bir konuyu veya maddeyi daha iyi anlamak için daha küçük parçalara ayırma sürecidir. Teknik, matematik ve mantık çalışmalarında Aristoteles'ten önce uygulanmıştır.

Mantıksal analiz, veri veya istatistiğin sistematik hesaplamalı analizidir. Verilerdeki anlamlı kalıpların keşfi, yorumlanması ve iletişimi için kullanılır. Ayrıca, etkili karar vermeye yönelik veri modellerinin uygulanmasını da gerektirir. Kayıtlı bilgilerle zengin alanlarda değerli olabilir. Analitik, performansı ölçmek için istatistik, bilgisayar programlama ve yöneylem araştırmasının eşzamanlı uygulanmasına dayanır.

İş analitiği, geçmiş iş performansının sürekli yinelemeli keşif ve araştırması için beceriler, teknolojiler ve uygulamaları ifade eder. İş analitiği, verilere ve istatistiksel yöntemlere dayalı olarak yeni içgörüler geliştirmeye ve iş performansının anlaşılmasına odaklanır. Buna karşılık, iş zekası geleneksel olarak hem geçmiş performansı ölçmek hem de iş planlamasına rehberlik etmek için tutarlı bir dizi ölçüm kullanmaya odaklanır. Buna karşılık, iş zekası geleneksel olarak hem geçmiş performansı ölçmek hem de iş planlamasına rehberlik etmek için tutarlı bir dizi ölçüm kullanmaya odaklanır. Başka bir deyişle, iş zekası açıklamaya odaklanırken, iş analitiği tahmin ve reçete üzerine odaklanır.

İstatistikte, keşifsel veri analizi, genellikle istatistiksel grafikler ve diğer veri görselleştirme yöntemlerini kullanarak temel özelliklerini özetlemek için veri kümelerini analiz etme yaklaşımıdır. İstatistiksel bir model kullanılabilir veya kullanılamaz. Ancak öncelikle EDA, verilerin bize resmi modelleme veya hipotez testi görevinin ötesinde neler söyleyebileceğini görmek için vardır. Keşifsel veri analizi, istatistikçileri verileri keşfetmeye ve muhtemelen yeni veri toplama ve deneylere yol açabilecek hipotezler formüle etmeye teşvik etmek için John Tukey tarafından desteklenmiştir. EDA, model uydurma ve hipotez testi için gereken varsayımları daha dar bir şekilde kontrol etmeye ve eksik değerleri ele almaya ve gerektiğinde değişkenlerin dönüşümlerini yapmaya odaklanan ilk veri analizinden farklıdır. EDA, IDA'yı kapsamaktadır.