İçeriğe atla

pandas

pandas
Pandas logosu
Orijinal yazar(lar)Wes McKinney
Geliştirici(ler)Topluluk
İlk yayınlanma11 Ocak 2008 (16 yıl önce) (2008-01-11)
Güncel sürüm1.0.3[1] / 17 Mart 2020 (4 yıl önce) (2020-03-17)
Programlama diliPython, CPython, C
İşletim sistemiÇapraz platform yazılımı
LisansYeni BSD lisansı
Resmî sitesipandas.pydata.org
Kod deposu Bunu Vikiveri'de düzenleyin

pandas, veri işlemesi ve analizi için Python programlama dilinde yazılmış olan bir yazılım kütüphanesidir. Bu kütüphane temel olarak zaman etiketli serileri ve sayısal tabloları işlemek için bir veri yapısı oluşturur ve bu şekilde çeşitli işlemler bu veri yapısı üzerinde gerçekleştirilebilir olur. Yazılım ücretsizdir ve bir çeşit BSD ile lisansına sahiptir.[2] Yazılım ismini bir ekonometri terimi olan veri panelinden almıştır. Bir veri paneli birçok zaman aralığı içinde farklı gözlemlerin işlenebildiği yapıyı tarif eder.[3]

Kütüphane özellikleri

  • İndeksli DataFrame (veri iskeleti) objeleri ile veri işlemesi yapabilmek.
  • Hafızadaki veya farklı türlerde bulunan veriyi okuyabilmek ve yazabilmek için araçlar sağlamak.
  • Veri sıralama ve bütünleşik kayıp veri senaryolarına karşı esnek imkanlar sunması.
  • Veri setlerinin tekrar boyutlandırılması veya döndürülmesi.
  • Etiket bazlı dilimleme, özel indeksleme ve büyük veri setlerini ayrıştırma özelliği.
  • Veri iskeletine sütun ekleme veya var olan sütunu çıkarma.
  • Veri gruplama özelliği ile ayırma-uygulama-birleştirme uygulamalarının yapılabilmesi.
  • Veri setlerinin birleştirilmesi ve birbirine eklenmesi.
  • Hiyerarşik eksenleri indeksleme özelliğiyle birlikte çok boyutlu veriden, daha az boyutlu veri elde edilebilmesi.
  • Zaman serisi özelliği: Zaman aralığı oluşturma[4] ve sıklık çevrimleri yapma, hareketli aralık istatistik fonksiyonları, tarih öteleme ve geciktirme.
  • Veri filtrelemesi yapabilmek.

Kütüphane performans konusunda yüksek derecede en iyilenmiştir. Bu yüzden kütüphanenin önemli parçaları CPython ve C üzerinde yazılmışlardır.[5]

Dataframes (Veri İskeletleri)

Pandas temel olarak makine öğrenmesi uygulamalarında kullanılmaktadır. Bu uygulamalarda en öne çıkan özelliği de veri isketleridir. Pandas ayrıca birçok farklı formattan (csv, excel gibi) veri içe aktarması gerçekleştirebilir. Pandas çok farklı veri işleme yöntemlerini uygulayabilir; örneğin gruplama, ekleme, birleştirme, kaynaştırma, bir araya getirme. Ayrıca bu kütüphane veri temizleme için veri doldurma, değiştirme ve varsayma özelliklerine de sahiptir.

Geçmişi

Geliştirici Wes McKinney pandas için çalışmaya 2008 yılında, AQR Capital isimli şirkette çalışırken başladı. Bu uygulamayı geliştirme sebepleri yüksek performans ve esnek araçlar ile finansal analizler gerçekleştirebilmekti. Kendisi AQR şirketinden ayrılmadan önce yöneticilerini bu kütüphaneyi açık kaynak yapmaya ikna etmiştir.

Bir diğer AQR çalışanı, Change She, 2012 yılında kütüphaneye ana katkı yapan geliştirici olarak katılmıştır.

2015 yılında pandas, NumFOCUS tarafından finansal olarak desteklenmiştir. NumFOCUS, Birleşik Devletlerde kurulu olan bir kâr amacı gütmeyen bir vakıftır.[6]

Ayrıca bakınız

Kaynakça

  1. ^ "What's new in 1.0.3". pandas. 17 Mart 2020. 18 Mart 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 18 Mart 2020. 
  2. ^ "License – Package overview – pandas 1.0.0 documentation". pandas. 28 Ocak 2020. 14 Şubat 2012 tarihinde kaynağından arşivlendi. Erişim tarihi: 30 Ocak 2020. 
  3. ^ Wes McKinney (2011). "pandas: a Foundational Python Library for Data Analysis and Statistics" (PDF). 13 Mayıs 2015 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 2 Ağustos 2018. 
  4. ^ "pandas.date_range – pandas 1.0.0 documentation". pandas. 29 Ocak 2020. 29 Mart 2014 tarihinde kaynağından arşivlendi. Erişim tarihi: 30 Ocak 2020. 
  5. ^ "Python Data Analysis Library – pandas: Python Data Analysis Library". pandas. 13 Şubat 2012 tarihinde kaynağından arşivlendi. Erişim tarihi: 13 Kasım 2017. 
  6. ^ "NumFOCUS – pandas: a fiscally sponsored project". NumFOCUS. 4 Nisan 2018 tarihinde kaynağından arşivlendi. Erişim tarihi: 3 Nisan 2018. 

Literatür

Dış bağlantılar

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">C (programlama dili)</span> programlama dili

C, yapısal bir programlama dilidir. Bell Laboratuvarları'nda, Ken Thompson ve Dennis Ritchie tarafından UNIX işletim sistemini geliştirebilmek amacıyla B dilinden türetilmiştir. Geliştirilme tarihi 1972 olmasına rağmen yaygınlaşması Brian Kernighan ve Dennis M. Ritchie tarafından yayımlanan "C Programlama Dili" kitabından sonra hızlanmıştır. Günümüzde neredeyse tüm işletim sistemlerinin yapımında %95'lere varan oranda kullanılmış, hâlen daha sistem, sürücü yazılımı, işletim sistemi modülleri ve hız gereken her yerde kullanılan oldukça yaygın ve sınırları belirsiz oldukça keskin bir dildir. Keskinliği, programcıya sonsuz özgürlüğün yanında çok büyük hatalar yapabilme olanağı sağlamasıdır. Programlamanın gelişim süreciyle beraber programlamanın karmaşıklaşması, gereksinimlerin artması ile uygulama programlarında nesne yönelimliliğin ortaya çıkmasından sonra C programcıları büyük ölçüde nesne yönelimliliği destekleyen C++ diline geçmişlerdir.

Python, nesne yönelimli, yorumlamalı, birimsel (modüler) ve etkileşimli yüksek seviyeli bir programlama dilidir.

Veri yapısı, bilgisayar ortamında verilerin etkin olarak saklanması ve işlenmesi için kullanılan yapı.

<span class="mw-page-title-main">Sinüs (matematik)</span>

Matematikte sinüs, trigonometrik bir fonksiyon. Sin kısaltmasıyla ifade edilir.

<span class="mw-page-title-main">Android</span> Mobil işletim sistemi

Android, Google ve Open Handset Alliance tarafından, cep telefonları, tabletler ve televizyonlar için geliştirilmekte olan, Linux tabanlı, özgür ve ücretsiz bir işletim sistemidir. Sistem açık kaynak kodlu olsa da, kodlarının ufak ama çok önemli bir kısmı Google tarafından kapalı tutulmaktadır. Google tarafından ücretsiz sunulmasının sebebi, sistemin daha hızlı ve çabuk gelişmesi, birçok popüler marka tarafından kullanılması ve bu sayede reklamlarının daha fazla kişiye ulaşmasını sağlamaktır. Google, Android sistemi üzerinde çalışan Google Play marketteki oyun ve uygulamalar üzerinde aldığı reklamları yayınlayarak para kazanmaktadır. Android'in desteklenen uygulama uzantısı ".apk"dır.

Dijitalleştirme, özellikle eski yazılı kaynakların OCR ve benzeri uygulamalarla dijital ortama aktarılma işlemidir. Dijitalleştirme görsel veya işitsel ögelerin bilgisayara tanımlanabilmesi, işlenebilmesi ve saklanabilmesi amacıyla sayısal kodlara dönüştürülmesidir. Bu işlemin amacı belgenin bütünlüğünü, içeriğini ve fiziksel özelliklerini koruyarak gelecek nesillere aktarmaktır.

<span class="mw-page-title-main">MATLAB</span>

MATLAB, çok paradigmalı sayısal hesaplama yazılımı ve dördüncü nesil programlama dilidir. Özel mülk bir programlama dili olan MATLAB, MathWorks tarafından geliştirilmektedir. MATLAB kullanıcıya, matris işleme, fonksiyon ve veri çizme, algoritma uygulama, kullanıcı arayüzü oluşturma, C, C++, Java ve Fortran gibi diğer dillerde yazılmış programlarla arabağlama imkânı tanır.

<span class="mw-page-title-main">Dizin Oluşturma Hizmeti</span>

İndeksleme Hizmeti PC'lerde ve şirket bilgisayar ağlarındaki arama performansını artırmak için bir bilgisayardaki dosyaların çoğunun bir dizinini tutan bir Windows hizmetidir. Kullanıcı müdahalesi olmadan indeksleri güncelledi. Windows 7'de, yerini daha yeni bir Windows Arama dizinleyicisi almıştır. Dizine ekleme yeteneklerini daha fazla dosya biçimine ve protokollerine genişleten IFilter eklentileri eski Endeksleme Hizmeti ile daha yeni Windows Arama dizinleyicisi arasında uyumludur.

IronPython, Python programlama dilinin .NET Framework ve Mono'yu hedefleyen bir gerçeklemesidir. Proje Jim Hugunin tarafından başlatılmış, Hugunin 5 Eylül 2006'da yayınlanan 1.0 sürümüne kadar aktif olarak katkıda bulunmuştur. IronPython 2.0 10 Aralık 2008'de piyasaya sürüldü. 1.0 sürümünden sonra, 2.7 Beta 1 sürümüne kadar Microsoft'ta küçük bir ekip tarafından geliştirildi. Hugunin'in Google'da çalışmaya başlamasının ardından Microsoft, IronPython'u geliştirmeyi 2010 yılının sonlarında sonlandırdı. Proje şu anda GitHub'da bir grup gönüllü tarafından yürütülmektedir. Ücretsiz ve açık kaynaklı bir yazılımdır ve Microsoft Visual Studio IDE için ücretsiz ve açık kaynaklı bir uzantı olan Visual Studio için Python Tools (PTVS) ile uygulanabilir.

<span class="mw-page-title-main">Anaconda (Python dağıtımı)</span>

Anaconda ücretsiz ve açık kaynaklı, Python ve R programlama dillerinin bilimsel hesaplama kullanımında paket yönetimini kolaylaştırmayı amaçlayan bir özgür ve açık kaynaklı dağıtımdır. Paket sürümleri conda paket yönetim sistemi ile yönetilir. Anaconda dağıtımı Windows, Linux ve MacOS işletim sistemlerinde kullanılabilen veri bilimi paketleri içerir.

PyTorch, Torch kütüphanesine dayanan açık kaynaklı bir makine öğrenme kütüphanesidir, bilgisayarla görme ve doğal dil işleme gibi uygulamalar için kullanılır. Öncelikle Facebook'un AI Araştırma laboratuvarı (FAIR) tarafından geliştirilmiştir. Değiştirilmiş BSD lisansı ile piyasaya sürülen ücretsiz ve açık kaynaklı bir yazılımdır. Python arabirimi daha öne çıkan ve geliştirmenin birincil odağı olmasına rağmen, PyTorch'un bir C ++ arabirimi de vardır.

<span class="mw-page-title-main">TensorFlow</span>

TensorFlow, makine öğrenimi için ücretsiz ve açık kaynaklı bir yazılım kütüphanesidir. Bir dizi görevde kullanılabilir, ancak derin sinir ağlarının eğitimi ve çıkarımına özel olarak odaklanmaktadır.

<span class="mw-page-title-main">Bibsys</span>

BIBSYS, Norveç Eğitim ve Araştırma Bakanlığı tarafından kurulan ve düzenlenen bir idari kurumdur. Araştırma, öğretim ve öğrenmeyle ilgili verilerin - tarihsel olarak kütüphane kaynaklarıyla ilgili meta veri alışverişi, depolanması ve alınması üzerine odaklanan bir hizmet sağlayıcısıdır.

<span class="mw-page-title-main">Python Paket Dizini</span>

Python Paket Dizini, PyPI olarak kısaltılır ve Peynir Dükkanı olarak da bilinir, Python için resmi bir üçüncü taraf yazılım deposudur. Perl için CPAN deposuna ve R için CRAN deposuna benzer. PyPI, bir hayır kurumu olan Python Software Foundation tarafından işletilmektedir. Bazı paket yöneticileri, pip dahil, PyPI'yi paketler ve bağımlılıkları için varsayılan kaynak olarak kullanır.

<span class="mw-page-title-main">NumPy</span>

NumPy, Python programlama dili için büyük, çok boyutlu dizileri ve matrisleri destekleyen, bu diziler üzerinde çalışacak üst düzey matematiksel işlevler ekleyen bir kitaplıktır. NumPy'nin atası Numeric, ilk olarak Jim Hugunin tarafından diğer birkaç geliştiricinin katkılarıyla oluşturuldu. 2005 yılında Travis Oliphant, Numarray'in özelliklerini kapsamlı değişikliklerle Numeric'e dahil ederek NumPy'yi yarattı.

Microsoft Windows uygulama programlamasında, OLE Otomasyonu, Microsoft tarafından oluşturulan süreçler arası bir iletişim mekanizmasıdır. Başlangıçta Visual Basic olan komut dosyası dilleri tarafından kullanılması amaçlanan Bileşen Nesne Modeli'nin (COM) bir alt kümesine dayanmaktadır, ancak şimdi Windows'ta birkaç dil tarafından kullanılmaktadır. IDispatch arabirimini uygulamak için tüm otomasyon nesneleri gereklidir. Otomasyon denetleyicileri adı verilen uygulamaların, diğer uygulamalar tarafından dışa aktarılan paylaşılan otomasyon nesnelerine erişebildiği ve bunları değiştirebildiği bir altyapı sağlamaktadır. Uygulamaların birbirini kontrol etmesi için daha eski bir mekanizma olan Dinamik Veri Değişimi'nin (DDE) yerini almaktadır. DDE'de olduğu gibi, OLE Otomasyonunda otomasyon denetleyicisi "istemci"dir ve otomasyon nesnelerini dışa aktaran uygulama "sunucu"dur.

<span class="mw-page-title-main">Kütüphaneci</span> bir kütüphanede profesyonel olarak çalışan ve genellikle kütüphanecilik eğitimi almış kişi, kütüphanede bilgi hizmeti veren kişi

Kütüphaneci, üniversitelerin bilgi ve belge yönetimi bölümünden mezun olup kütüphanelerde çalışan personellerdir. "Bilgi uzmanı", "bilgi profesyoneli", "kütüphane personeli", "kütüphane uzmanı", "kütüphane öğretmeni" ve "bilgi yöneticisi" gibi unvanlarla da adlandırılır.

<span class="mw-page-title-main">Matplotlib</span>

Matplotlib, Python programlama dili ve sayısal matematik uzantısı NumPy için bir çizim kitaplığıdır. Tkinter, wxPython, Qt veya GTK gibi genel amaçlı GUI araç setlerini kullanan uygulamalara grafikleri yerleştirmek için nesne yönelimli bir API sağlar. Ayrıca, kullanılması önerilmese de, MATLAB'ınkine çok benzeyecek şekilde tasarlanmış, bir durum makinesine dayalı bir yordamsal "plab" arabirimi vardır. SciPy, Matplotlib'i kullanır.

Burada, sayısal analiz veya veri analizi için kullanılmak üzere tasarlanmış önemli son kullanıcı bilgisayar uygulamaları listelenmiştir:

Sarmalayıcı kütüphaneler, bir kütüphanenin mevcut arayüzünü uyumlu bir arayüze çeviren ince bir kod katmanından oluşur. Bu, çeşitli nedenlerle yapılır: