İçeriğe atla

Lineer regresyon

İstatistikte lineer regresyon veya doğrusal regresyon, skaler bir yanıt ile bir veya daha fazla açıklayıcı değişken (bağımlı ve bağımsız değişkenler) arasındaki ilişkiyi modellemek için kullanılan doğrusal bir yaklaşımdır. Bir açıklayıcı değişkenin durumu, basit doğrusal regresyon olarak adlandırılır. Birden fazla süreç için çoklu doğrusal regresyon terimi kullanılır.[1] Bu terim, tek bir skaler değişken yerine birden fazla ilişkili bağımlı değişkenin tahmin edildiği çok değişkenli doğrusal regresyondan farklıdır.[2]

Lineer regresyonda ilişkiler, bilinmeyen model parametreleri verilerden tahmin edilen doğrusal öngörücü işlevler kullanılarak modellenir. Bu tür modellere lineer modeller denir.[3] En yaygın olarak, açıklayıcı değişkenlerin (veya öngörücülerin) değerleri verilen yanıtın koşullu ortalamasının, bu değerlerin benzer bir işlevi olduğu varsayılır. Daha az yaygın olarak ise koşullu medyan veya başka bir nicelik kullanılır. Tüm regresyon analizi biçimleri gibi doğrusal regresyon da, çok değişkenli analizin alanı olan tüm bu değişkenlerin ortak olasılık dağılımı yerine yordayıcıların değerleri verilen yanıtın koşullu olasılık dağılımına odaklanır.

Kaynakça

  1. ^ David A. Freedman (2009). Statistical Models: Theory and Practice. Cambridge University Press. s. 26. A simple regression equation has on the right hand side an intercept and an explanatory variable with a slope coefficient. A multiple regression e right hand side, each with its own slope coefficient 
  2. ^ "Chapter 10, Multivariate regression – Section 10.1, Introduction", Methods of Multivariate Analysis, Wiley Series in Probability and Statistics, 709, John Wiley & Sons, 2012, s. 19, ISBN 9781118391679  Birden fazla |sürüm= ve |seri= kullanıldı (yardım).
  3. ^ Hilary L. Seal (1967). "The historical development of the Gauss linear model". Biometrika. 54 (1/2): 1-24. doi:10.1093/biomet/54.1-2.1. 

Dış bağlantılar

Vikiversite'de
Lineer regresyon ile ilgili kaynaklar bulunur.
Vikikitap
Vikikitap
Vikikitapta bu konu hakkında daha fazla bilgi var:

İlgili Araştırma Makaleleri

<span class="mw-page-title-main">Ekonometri</span>

Ekonometri İki veya daha fazla verinin, birbirleri arasındaki ilişkiyi ve bu ilişkiden yola çıkarak, matematik, istatistik ve bilgisayar bilimi aracılığıyla ekonomik ilişkilerin ampirik bir biçimde değerlendirilerek, bu veriler arasındaki ilişkiyi inceleyen bilim dalıdır. Daha açık olmak gerekirse, "sonucu uygun metodlarla ilişkilendirilmiş, teori ve gözlemin eşzamanlı gelişimi tabanlı mevcut ekonomik olgunun nicel çözümlemesidir." Bir ekonomiye giriş ders kitabı ekonometriyi: "dağlarca verinin arasından basit ilişkileri çıkarmak için titizlikle araştırmak" olarak açıklamıştır. "Ekonometri" terimi ilk olarak Polonyalı ekonomist Pawel Ciompa tarafından 1910 yılında kullanılmıştır. Bugünkü kullanım şekline getiren ise Ragnar Frisch'dir. Günümüzde daha güçlü bilgisayar yazılımların varlığıyla ekonometrik analizlerin gücü artmıştır.

Regresyon analizi, iki ya da daha çok nicel değişken arasındaki ilişkiyi ölçmek için kullanılan analiz metodudur. Eğer tek bir değişken kullanılarak analiz yapılıyorsa buna tek değişkenli regresyon, birden çok değişken kullanılıyorsa çok değişkenli regresyon analizi olarak isimlendirilir. Regresyon analizi ile değişkenler arasındaki ilişkinin varlığı, eğer ilişki var ise bunun gücü hakkında bilgi edinilebilir. Regresyon terimi için öz Türkçe olarak bağlanım sözcüğü kullanılması teklif edilmiş ise de Türk ekonometriciler arasında bu kullanım yaygın değildir.

<span class="mw-page-title-main">Otokorelasyon</span>

Otokorelasyon ya da öz ilinti, bir sinyalin farklı zamanlardaki değerleri arasındaki korelasyonudur. Başka bir deyişle, gözlemlenen değerler arasındaki benzerliğin, zamansal gecikmenin bir fonksiyonu olarak ifadesidir. Otokorelasyon analizi tekrar eden örüntülerin tanınması, bir sinyalin kayıp temel frekansının tespit edilmesi gibi amaçlar için kullanılan bir matematiksel araçtır. Sinyal işlemede fonksiyonların ya da dizilerin analizi için sıkça kullanılır.

Durbin Watson istatistiği, bir regresyon modeli tahmin edildikten sonra artık terimlerin korelasyon halinde olup olmadığını test etmeye yarayan bir sayıdır. Bu sayının 2 civarında çıkması, "otokorelasyon vardır" boş hipotezini reddedemeyeceğimizi gösterir. Buna göre e = hata terimi ya da artık, t = zaman olmak üzere Durbin Watson test istatistiği:

Varyans Analizi istatistik bilim dalında, grup ortalamaları ve bunlara bağlı olan işlemleri analiz etmek için kullanılan bir istatistiksel modeller koleksiyonudur. Varyans Analizi kullanılmaktayken belirlenmiş bir değişkenin gözlemlenen varyansı farklı değişim kaynaklarına dayandırılabilen varyans bileşenine ayrılır. En basit şekliyle varyans analizi birkaç grubun ortalamalarının birbirine eşit mi eşit değil mi olduğunu sınamak için bir çıkarımsal istatistik sınaması olur ve bu sınama iki-grup için yapılan t-test sınamasını çoklu-gruplar için genelleştirir. Eğer, çoklu değişkenli analiz için birbiri arkasından çoklu iki-örneklemli-t-sınaması yapmak istenirse bunun I. tip hata yapma olasılığını artırma sonucu doğurduğu aşikardır. Bu nedenle, üç veya daha fazla sayıda ortalamaların ististiksel anlamlığının sınama ile karşılaştırılması için Varyans Analizleri daha faydalı olacağı gerçeği ortaya çıkmaktadır.

En küçük kareler yöntemi, birbirine bağlı olarak değişen iki fiziksel büyüklük arasındaki matematiksel bağlantıyı, mümkün olduğunca gerçeğe uygun bir denklem olarak yazmak için kullanılan, standart bir regresyon yöntemidir. Bir başka deyişle bu yöntem, ölçüm sonucu elde edilmiş veri noktalarına "mümkün olduğu kadar yakın" geçecek bir fonksiyon eğrisi bulmaya yarar. Gauss-Markov Teoremi'ne göre en küçük kareler yöntemi, regresyon için optimal yöntemdir.

İstatistiksel terimler, kavramlar ve konular listesi matematik biliminin çok önemli bir alt-bölümü olan istatistik biliminde içeriğinde bulunan konuların çok ayrıntılı olarak sınıflandırılması ile ortaya çıkarılmıştır. Milletlerarası İstatistik Enstitüsü bir enternasyonal bilim kurumu olarak istatistik bilimi konu ve terimlerini bir araya toplayıp 28 bilim dilinde karşılıklı olarak yayınlamıştır. Bu uğraşın sonucunun milletlerarası bilim camiasının büyük başarılarından biri olduğu kabul edilmektedir. Ortaya çıkartılan, istatistik bilimi içinde kullanılan ve bu bilime ait özel kavramların ve terimlerin listesi, tam kapsamlı olma hedeflidir ve böylelikle istatistik bilimi için bir Türkçe yol haritası yapılmış olmaktadır.

<span class="mw-page-title-main">Geometrik dağılım</span>

Olasılık kuramı ve istatistik bilim dallarında geometrik dağılım şu iki şekilde ifade edilebilen ayrık olasılık dağılımıdır:

Matematik biliminde, özellikle yöneylem araştırması uygulamalı dalında, doğrusal programlama problemleri bir doğrusal amaç fonksiyonunun doğrusal eşitlik ve/veya eşitsizlik kısıtlamalarını sağlayacak şekilde optimizasyon yapılmasıdır. Bir optimizasyon modeli eğer sürekli değişkenlere ve tek bir doğrusal amaç fonksiyonuna sahipse ve tüm kısıtlamaları doğrusal eşitlik veya eşitsizliklerden oluşuyorsa, doğrusal (lineer) program olarak adlandırılır. Başka bir deyişle, modelin tek-amaçlı fonksiyonu ve tüm kısıtlamaları, süreklilik gösteren karar değişkenlerinin ağırlıklı toplamlarından oluşmalıdır.

İstatistik biliminde normallik sınamaları bir seri parametrik olmayan istatistik sınamalar çeşididir. Normallik sınamalarının amacı verilmiş bir veri dizisinin normal dağılıma uygunluk iyiliğinin incelenmesidir. Bir sıra parametrik olmayan sınama geliştirilmiş bulunmasına rağmen birçok istatistikçi pratikte daha az kesin ve daha çok subjektif sağduyu ve ekpertiz gerektiren gösterim karşılaştırmalarını kullanmaktadır. Normallik sınamaları yalnız örneklem verilerinin doğrudan doğruya incelenmesinde kullanılmamakta, fakat özellikle ekonometrik analizlerde tek regresyon denklemi tahmininden sonra çıkan hataların normal olup olmadıklarının araştırılması için de çok kullanılmaktadırlar.

İstatistik bilim dalında, Jarque-Bera sınaması normal dağılımdan ayrılmayı ölçmek için kullanılan bir uygulama iyiliği ölçüsüdür. İlk defa bu sınamayi ortaya atan ekonometrici A.K.Bera ve C.M.Jarque adları ile anılmaktadır.

<span class="mw-page-title-main">Sayısal analiz</span>

Sayısal analiz, diğer adıyla nümerik analiz veya sayısal çözümleme, matematiksel analiz problemlerinin yaklaşık çözümlerinde kullanılan algoritmaları inceler. Bu nedenle birçok mühendislik dalı ve doğa bilimlerinde önem arz eden sayısal analiz, bilimsel hesaplama bilimi olarak da kabul edilebilir. Bilgisayarın işlem kapasitesinin artması ile gündelik hayatta ortaya çıkan birçok sistemin matematiksel modellenmesi mümkün olmuş ve sayısal analiz algoritmaları burada ön plana çıkmıştır. 21. yüzyıldan itibaren bilimsel hesaplama yöntemleri mühendislik ve doğa bilimleri ile sınırlı kalmamış ve sosyal bilimler ile işletme gibi alanları da etkilemiştir. Sayısal analizin alt başlıklarına adi diferansiyel denklemlerin yaklaşık çözümleri ve özellikle veri biliminde önem taşıyan sayısal lineer cebir ile optimizasyon örnek gösterilebilir.

<span class="mw-page-title-main">Doğrusal olmayan regresyon</span>

Doğrusal olmayan regresyon, istatistik bilimde gözlemi yapılan verilerin bir veya birden fazla bağımsız değişkenin model parametrelerinin doğrusal olmayan bileşiği olan ve bir veya daha çok sayıda bağımsız değişken ihtiva eden bir fonksiyonla modelleştirilmesini içeren bir regresyon (bağlanım) analizi türüdür. Veriler arka-arkaya yapılan yaklaşımlarla kurulan modele uydurularak çözümleme yapılır.

Tobit modeli negatif olmayan bağımlı bir değişken ile bağımsız bir değişken veya vektör arasındaki ilişkiyi tanımlamak için James Tobin tarafından öne sürülen bir ekonometrik yöntemdir.

Olasılık kuramında iki olayın bağımsız olması bu olaylardan birinin gerçekleşme olasılığının diğer olayın gerçekleşip gerçekleşmediğine bağlı olmaması anlamına gelmektedir. Örneğin;

Matematiksel model, bir sistemin matematiksel kavramlar ve dil kullanılarak tanımlanmasıdır. Matematiksel model geliştirme süreci, matematiksel modelleme olarak adlandırılır. Matematiksel modeller, doğa bilimlerinde ve mühendislik disiplinlerinde bunun yanı sıra sosyal bilimlerde kullanılır. Matematiksel modelleri daha çok fizikçiler, mühendisler, istatistikçiler, operasyon araştırma analistleri ve ekonomistler kullanır. Model, bir sistemi açıklamaya, farklı bileşenlerin etkilerini incelemeye ve bir davranış hakkında öngörüde bulunmak için yardımcı olabilir.

Kukla değişken tuzağı çoklu regresyon analizinde bir m kategorili bir kalitatif etkinin m tane 0-1 değeri alan açıklayıcı kukla değişken ile ifade edilmesi dolayısıyla ortaya çıkar. Bu tuzağa düşmemek için m-1 sayıda 0-1 değeri alan açıklayıcı kukla değişken kullanmak yeterli ve gereklidir.

Granger nedensellik sınaması, bir zaman serisinin başka bir zaman serisini tahmininde kullanışlı olup olmadığının bir istatistiksel hipotez sınamasıdır. Normalde, bağlanımlar, "sadece" ilintileri yansıtırlar, ancak Ekonomi Nobel Ödülünü kazanan Clive Granger, belli bir sınamalar kümesinin nedensellikle ilgili bir şeyler ortaya çıkardığını savunmuştur.

<span class="mw-page-title-main">Matematiksel istatistik</span> matematiksel yöntemlerin kullanıldığı olası istatistikler

Matematiksel istatistik, istatistiksel veri toplama tekniklerinin aksine, matematiğin bir dalı olan olasılık teorisinin istatistiğe uygulanmasıdır. Bunun için kullanılan özel matematiksel teknikler arasında matematiksel analiz, doğrusal cebir, stokastik analiz, diferansiyel denklemler ve ölçü teorisi bulunur.

Doğrusallık, grafiksel olarak düz bir çizgi olarak gösterilebilen matematiksel bir ilişkinin (fonksiyonun) özelliğidir. Doğrusallık, orantılılık kavramı ile yakından ilişkilidir. Fizikteki örnekler, bir elektrik iletkenindeki voltaj ve akımın doğrusal ilişkisini ve kütle ve ağırlık ilişkisini içermektedir. Daha karmaşık ilişkiler doğrusal olarak sayılmamaktadır.