Lineer regresyon - Turkipedia

İstatistikte lineer regresyon veya doğrusal regresyon, skaler bir yanıt ile bir veya daha fazla açıklayıcı değişken (bağımlı ve bağımsız değişkenler) arasındaki ilişkiyi modellemek için kullanılan doğrusal bir yaklaşımdır. Bir açıklayıcı değişkenin durumu, basit doğrusal regresyon olarak adlandırılır. Birden fazla süreç için çoklu doğrusal regresyon terimi kullanılır.^[1] Bu terim, tek bir skaler değişken yerine birden fazla ilişkili bağımlı değişkenin tahmin edildiği çok değişkenli doğrusal regresyondan farklıdır.^[2]

Lineer regresyonda ilişkiler, bilinmeyen model parametreleri verilerden tahmin edilen doğrusal öngörücü işlevler kullanılarak modellenir. Bu tür modellere lineer modeller denir.^[3] En yaygın olarak, açıklayıcı değişkenlerin (veya öngörücülerin) değerleri verilen yanıtın koşullu ortalamasının, bu değerlerin benzer bir işlevi olduğu varsayılır. Daha az yaygın olarak ise koşullu medyan veya başka bir nicelik kullanılır. Tüm regresyon analizi biçimleri gibi doğrusal regresyon da, çok değişkenli analizin alanı olan tüm bu değişkenlerin ortak olasılık dağılımı yerine yordayıcıların değerleri verilen yanıtın koşullu olasılık dağılımına odaklanır.

Kaynakça

^ David A. Freedman (2009). Statistical Models: Theory and Practice. Cambridge University Press. s. 26. A simple regression equation has on the right hand side an intercept and an explanatory variable with a slope coefficient. A multiple regression e right hand side, each with its own slope coefficient
^ "Chapter 10, Multivariate regression – Section 10.1, Introduction", Methods of Multivariate Analysis, Wiley Series in Probability and Statistics, 709, John Wiley & Sons, 2012, s. 19, ISBN 9781118391679 Birden fazla |sürüm= ve |seri= kullanıldı (yardım).
^ Hilary L. Seal (1967). "The historical development of the Gauss linear model". Biometrika. 54 (1/2): 1-24. doi:10.1093/biomet/54.1-2.1.

Dış bağlantılar

Vikiversite'de

Lineer regresyon ile ilgili kaynaklar bulunur.

Vikikitap

Vikikitapta bu konu hakkında daha fazla bilgi var:

R Programming

Wikimedia Commons'ta Lineer regresyon ile ilgili ortam dosyaları bulunmaktadır.

En Küçük Kareler Regresyonu 28 Nisan 2021 tarihinde Wayback Machine sitesinde arşivlendi., PhET Etkileşimli simülasyonlar, Colorado Üniversitesi, Boulder

İstatistik

Betimsel istatistik

Sürekli veriler

Merkezî konum	Ortalama (Aritmetik, Geometrik, Harmonik) • Medyan • Mod
Yayılma	Açıklık • Standart sapma • Varyasyon katsayısı • Çeyrekler açıklığı • Kesirlilikler (kantil) (Dörttebirlik,Ondabirlik, Yüzdebirlik)
Dağılım şekli	Varyans • Çarpıklık • Basıklık • Moment (matematik)

İstatistiksel tablolar

Sıklık dağılımı • Çoklu sayılı özetleme tabloları • İlişki tablosu • Çoklu-yönlü sınıflandırma tabloları

İstatistiksel grafikler

Dairesel grafik • Çubuk grafiği • Kutu grafiği • Dal-yaprak grafikleri •Kontrol diyagramı • Histogram • Sıklık çizelgesi • Q-Q grafiği • Serpilme diyagramı

Veri toplama

Örnek tasarımı	Anakütle •Basit rassal örnekleme Örüntülü örnekleme • Tabakalı örnekleme • Küme örneklemesi • Çok aşamalı örnekleme •
Deneysel tasarım	Anakütle • İstatistiksel deneysel tasarım tipleri • Deneysel hata • Yineleme • Bloklama • Duyarlılık ve belirleme
Örneklem kavramları	Örneklem büyüklüğü • Sınama gücü • Etki büyüklüğü • Örnekleme dağılımı •Standart hata

Çıkarımsal istatistik
ve
İstatistiksel kestirim ve testler

Çıkarımsal analiz tipleri

Kestirim • Parametrik çıkarımsal analiz •Parametrik olmayan çıkarımsal analiz • Bayesci çıkarımsal analiz • Meta-analiz

Çıkarımsal kestirim

Genel kestirim kavramları	Momentler yöntemi • Enbüyük olabilirlik • Enbüyük artçıl • Bayes-tipi kestirimci • Minimum uzaklık • Maksimum aralık verme
Tekdeğişkenli kestirim	Kestirim • Güven aralığı • İnanılır aralık

Hipotez testi

İstatistiksel test ana kavramları	Sıfır hipotez • I.Tür ve II.Tür hata • Anlamlılık seviyesi •p-değeri
Basit tek-değişkenli ve iki-değişkenli parametrik hipotez testi	μ için testi • π için test • μ₁-μ₂ için test • π₁-π₂ için test • σ₁/σ₂ için test
Tek-değişkenli ve iki-değişkenli parametrik olmayan test analizi	Medyan testi • Ki-kare testi • Pearson ki-kare testi •Phi katsayısı • Wald testi • Mann-Whitney U testi • Wilcoxon'in işaretli sıralama testi

Korelasyon
ve
Regresyon analizi

Korelasyon	Pearson çarpım-moment korelasyonu • Sıralama korelasyonu ( Spearman'in rho • Kendall'in tau)
Doğrusal regresyon	Regresyon analizi • Doğrusal model • Genel doğrusal model • Genelleştirilmiş doğrusal model
Doğrusal olmayan regresyon	Parametrik olmayan • Yarıparametrik • Logistik
Varyans analizi	Tek-yönlü varyans analizi • Kovaryans analizi • Bloklu tek-yönlü varyans analizi • Etki karışımı değişkeni

Çokdeğişkenli istatistik

Çokdeğişkenli regresyon • temel bileşenler · Faktör analizi •Kanonik korelesyon • Uygunluk analizi • Kümeleme analizi

Zaman serileri analizi

Yapısal model tanımlanması	Zaman serisi yapisal model ögeleri • Zaman serisi ögeleri saptanması • Zaman grafiği • Korrelogram
Zaman serileri kestirim teknik ve modelleri	Dekompozisyon • Trend uygulama kestirimi • Üssel düzgünleştirme • ARIMA modelleri • Box–Jenkins • Spektral yoğunluk kestirimi
Kestirim değerlendirmesi	Zaman seri kestirim değerlendirmesi

Sağkalım analizi

Sağkalım fonksiyonu • Kaplan–Meier • Log-sıra testi • Başarısızlık oranı • orantılı tehlikeler modeli

İlgili Araştırma Makaleleri

Ekonometri İki veya daha fazla verinin, birbirleri arasındaki ilişkiyi ve bu ilişkiden yola çıkarak, matematik, istatistik ve bilgisayar bilimi aracılığıyla ekonomik ilişkilerin ampirik bir biçimde değerlendirilerek, bu veriler arasındaki ilişkiyi inceleyen bilim dalıdır. Daha açık olmak gerekirse, "sonucu uygun metodlarla ilişkilendirilmiş, teori ve gözlemin eşzamanlı gelişimi tabanlı mevcut ekonomik olgunun nicel çözümlemesidir." Bir ekonomiye giriş ders kitabı ekonometriyi: "dağlarca verinin arasından basit ilişkileri çıkarmak için titizlikle araştırmak" olarak açıklamıştır. "Ekonometri" terimi ilk olarak Polonyalı ekonomist Pawel Ciompa tarafından 1910 yılında kullanılmıştır. Bugünkü kullanım şekline getiren ise Ragnar Frisch'dir. Günümüzde daha güçlü bilgisayar yazılımların varlığıyla ekonometrik analizlerin gücü artmıştır.

Regresyon analizi, iki ya da daha çok nicel değişken arasındaki ilişkiyi ölçmek için kullanılan analiz metodudur. Eğer tek bir değişken kullanılarak analiz yapılıyorsa buna tek değişkenli regresyon, birden çok değişken kullanılıyorsa çok değişkenli regresyon analizi olarak isimlendirilir. Regresyon analizi ile değişkenler arasındaki ilişkinin varlığı, eğer ilişki var ise bunun gücü hakkında bilgi edinilebilir. Regresyon terimi için öz Türkçe olarak bağlanım sözcüğü kullanılması teklif edilmiş ise de Türk ekonometriciler arasında bu kullanım yaygın değildir.

Otokorelasyon ya da öz ilinti, bir sinyalin farklı zamanlardaki değerleri arasındaki korelasyonudur. Başka bir deyişle, gözlemlenen değerler arasındaki benzerliğin, zamansal gecikmenin bir fonksiyonu olarak ifadesidir. Otokorelasyon analizi tekrar eden örüntülerin tanınması, bir sinyalin kayıp temel frekansının tespit edilmesi gibi amaçlar için kullanılan bir matematiksel araçtır. Sinyal işlemede fonksiyonların ya da dizilerin analizi için sıkça kullanılır.

Durbin Watson istatistiği, bir regresyon modeli tahmin edildikten sonra artık terimlerin korelasyon halinde olup olmadığını test etmeye yarayan bir sayıdır. Bu sayının 2 civarında çıkması, "otokorelasyon vardır" boş hipotezini reddedemeyeceğimizi gösterir. Buna göre e = hata terimi ya da artık, t = zaman olmak üzere Durbin Watson test istatistiği:

\text{[math]}

Varyans Analizi istatistik bilim dalında, grup ortalamaları ve bunlara bağlı olan işlemleri analiz etmek için kullanılan bir istatistiksel modeller koleksiyonudur. Varyans Analizi kullanılmaktayken belirlenmiş bir değişkenin gözlemlenen varyansı farklı değişim kaynaklarına dayandırılabilen varyans bileşenine ayrılır. En basit şekliyle varyans analizi birkaç grubun ortalamalarının birbirine eşit mi eşit değil mi olduğunu sınamak için bir çıkarımsal istatistik sınaması olur ve bu sınama iki-grup için yapılan t-test sınamasını çoklu-gruplar için genelleştirir. Eğer, çoklu değişkenli analiz için birbiri arkasından çoklu iki-örneklemli-t-sınaması yapmak istenirse bunun I. tip hata yapma olasılığını artırma sonucu doğurduğu aşikardır. Bu nedenle, üç veya daha fazla sayıda ortalamaların ististiksel anlamlığının sınama ile karşılaştırılması için Varyans Analizleri daha faydalı olacağı gerçeği ortaya çıkmaktadır.

En küçük kareler yöntemi, birbirine bağlı olarak değişen iki fiziksel büyüklük arasındaki matematiksel bağlantıyı, mümkün olduğunca gerçeğe uygun bir denklem olarak yazmak için kullanılan, standart bir regresyon yöntemidir. Bir başka deyişle bu yöntem, ölçüm sonucu elde edilmiş veri noktalarına "mümkün olduğu kadar yakın" geçecek bir fonksiyon eğrisi bulmaya yarar. Gauss-Markov Teoremi'ne göre en küçük kareler yöntemi, regresyon için optimal yöntemdir.

İstatistiksel terimler, kavramlar ve konular listesi matematik biliminin çok önemli bir alt-bölümü olan istatistik biliminde içeriğinde bulunan konuların çok ayrıntılı olarak sınıflandırılması ile ortaya çıkarılmıştır. Milletlerarası İstatistik Enstitüsü bir enternasyonal bilim kurumu olarak istatistik bilimi konu ve terimlerini bir araya toplayıp 28 bilim dilinde karşılıklı olarak yayınlamıştır. Bu uğraşın sonucunun milletlerarası bilim camiasının büyük başarılarından biri olduğu kabul edilmektedir. Ortaya çıkartılan, istatistik bilimi içinde kullanılan ve bu bilime ait özel kavramların ve terimlerin listesi, tam kapsamlı olma hedeflidir ve böylelikle istatistik bilimi için bir Türkçe yol haritası yapılmış olmaktadır.

Olasılık kuramı ve istatistik bilim dallarında geometrik dağılım şu iki şekilde ifade edilebilen ayrık olasılık dağılımıdır:

Bütün tam sayılar setine, yani { 1, 2, 3, .... } üzerine, bağlı olarak X sayıda Bernoulli denemesinde ilk başarıyı elde etmenin olasılık dağılımı; veya
Bütün tam sayılar setine, yani {1, 2,3, ....} üzerine, bağlı olarak ilk başarıyı elde etmeden Y = X − 1 başarısızlık sayısı olasılık dağılımı.

Matematik biliminde, özellikle yöneylem araştırması uygulamalı dalında, doğrusal programlama problemleri bir doğrusal amaç fonksiyonunun doğrusal eşitlik ve/veya eşitsizlik kısıtlamalarını sağlayacak şekilde optimizasyon yapılmasıdır. Bir optimizasyon modeli eğer sürekli değişkenlere ve tek bir doğrusal amaç fonksiyonuna sahipse ve tüm kısıtlamaları doğrusal eşitlik veya eşitsizliklerden oluşuyorsa, doğrusal (lineer) program olarak adlandırılır. Başka bir deyişle, modelin tek-amaçlı fonksiyonu ve tüm kısıtlamaları, süreklilik gösteren karar değişkenlerinin ağırlıklı toplamlarından oluşmalıdır.

İstatistik biliminde normallik sınamaları bir seri parametrik olmayan istatistik sınamalar çeşididir. Normallik sınamalarının amacı verilmiş bir veri dizisinin normal dağılıma uygunluk iyiliğinin incelenmesidir. Bir sıra parametrik olmayan sınama geliştirilmiş bulunmasına rağmen birçok istatistikçi pratikte daha az kesin ve daha çok subjektif sağduyu ve ekpertiz gerektiren gösterim karşılaştırmalarını kullanmaktadır. Normallik sınamaları yalnız örneklem verilerinin doğrudan doğruya incelenmesinde kullanılmamakta, fakat özellikle ekonometrik analizlerde tek regresyon denklemi tahmininden sonra çıkan hataların normal olup olmadıklarının araştırılması için de çok kullanılmaktadırlar.

İstatistik bilim dalında, Jarque-Bera sınaması normal dağılımdan ayrılmayı ölçmek için kullanılan bir uygulama iyiliği ölçüsüdür. İlk defa bu sınamayi ortaya atan ekonometrici A.K.Bera ve C.M.Jarque adları ile anılmaktadır.

<span class="mw-page-title-main">Sayısal analiz</span>

Sayısal analiz, diğer adıyla nümerik analiz veya sayısal çözümleme, matematiksel analiz problemlerinin yaklaşık çözümlerinde kullanılan algoritmaları inceler. Bu nedenle birçok mühendislik dalı ve doğa bilimlerinde önem arz eden sayısal analiz, bilimsel hesaplama bilimi olarak da kabul edilebilir. Bilgisayarın işlem kapasitesinin artması ile gündelik hayatta ortaya çıkan birçok sistemin matematiksel modellenmesi mümkün olmuş ve sayısal analiz algoritmaları burada ön plana çıkmıştır. 21. yüzyıldan itibaren bilimsel hesaplama yöntemleri mühendislik ve doğa bilimleri ile sınırlı kalmamış ve sosyal bilimler ile işletme gibi alanları da etkilemiştir. Sayısal analizin alt başlıklarına adi diferansiyel denklemlerin yaklaşık çözümleri ve özellikle veri biliminde önem taşıyan sayısal lineer cebir ile optimizasyon örnek gösterilebilir.

Doğrusal olmayan regresyon, istatistik bilimde gözlemi yapılan verilerin bir veya birden fazla bağımsız değişkenin model parametrelerinin doğrusal olmayan bileşiği olan ve bir veya daha çok sayıda bağımsız değişken ihtiva eden bir fonksiyonla modelleştirilmesini içeren bir regresyon (bağlanım) analizi türüdür. Veriler arka-arkaya yapılan yaklaşımlarla kurulan modele uydurularak çözümleme yapılır.

Tobit modeli negatif olmayan bağımlı bir değişken $\text{[math]}$ ile bağımsız bir değişken veya vektör $\text{[math]}$ arasındaki ilişkiyi tanımlamak için James Tobin tarafından öne sürülen bir ekonometrik yöntemdir.

Olasılık kuramında iki olayın bağımsız olması bu olaylardan birinin gerçekleşme olasılığının diğer olayın gerçekleşip gerçekleşmediğine bağlı olmaması anlamına gelmektedir. Örneğin;

Bir zarın ilk atışta 6 gelmesi olayı ile ikinci atışta 6 gelmesi olayı bağımsızdır.
Öte yandan, bir zarın ilk atışta 6 gelmesi olayı ilk iki atış sonunda elde edilen sayılar toplamının 8 olması olayına bağlıdır.
Bir kart destesinden seçilen ilk kartın kırmızı olması olayı ile ikinci kartın aynı renkte olması olayı bağımsızdır. Ne var ki, seçilen kartın desteye geri konulmaması durumunda bu iki olay bağımlıdır.

Matematiksel model, bir sistemin matematiksel kavramlar ve dil kullanılarak tanımlanmasıdır. Matematiksel model geliştirme süreci, matematiksel modelleme olarak adlandırılır. Matematiksel modeller, doğa bilimlerinde ve mühendislik disiplinlerinde bunun yanı sıra sosyal bilimlerde kullanılır. Matematiksel modelleri daha çok fizikçiler, mühendisler, istatistikçiler, operasyon araştırma analistleri ve ekonomistler kullanır. Model, bir sistemi açıklamaya, farklı bileşenlerin etkilerini incelemeye ve bir davranış hakkında öngörüde bulunmak için yardımcı olabilir.

Kukla değişken tuzağı çoklu regresyon analizinde bir m kategorili bir kalitatif etkinin m tane 0-1 değeri alan açıklayıcı kukla değişken ile ifade edilmesi dolayısıyla ortaya çıkar. Bu tuzağa düşmemek için m-1 sayıda 0-1 değeri alan açıklayıcı kukla değişken kullanmak yeterli ve gereklidir.

Granger nedensellik sınaması, bir zaman serisinin başka bir zaman serisini tahmininde kullanışlı olup olmadığının bir istatistiksel hipotez sınamasıdır. Normalde, bağlanımlar, "sadece" ilintileri yansıtırlar, ancak Ekonomi Nobel Ödülünü kazanan Clive Granger, belli bir sınamalar kümesinin nedensellikle ilgili bir şeyler ortaya çıkardığını savunmuştur.

Matematiksel istatistik, istatistiksel veri toplama tekniklerinin aksine, matematiğin bir dalı olan olasılık teorisinin istatistiğe uygulanmasıdır. Bunun için kullanılan özel matematiksel teknikler arasında matematiksel analiz, doğrusal cebir, stokastik analiz, diferansiyel denklemler ve ölçü teorisi bulunur.

Doğrusallık, grafiksel olarak düz bir çizgi olarak gösterilebilen matematiksel bir ilişkinin (fonksiyonun) özelliğidir. Doğrusallık, orantılılık kavramı ile yakından ilişkilidir. Fizikteki örnekler, bir elektrik iletkenindeki voltaj ve akımın doğrusal ilişkisini ve kütle ve ağırlık ilişkisini içermektedir. Daha karmaşık ilişkiler doğrusal olarak sayılmamaktadır.

Bu sayfa, bu Vikipedi makalesine dayanmaktadır.
Metin, CC BY-SA 4.0 lisansı altında mevcuttur; ek koşullar uygulanabilir.
Görseller, videolar ve sesler kendi lisansları altında mevcuttur.