İstatistik testlerdeki sonuçlarda görülen p değeri nasıl yorumlanır?


Bunu anlatmadan önce “sıfır hipotezi (null hypothesis”) kavramını anlatmalıyım:

Örneğin, “iki ölçülen olgu arasında bir bağlantı yoktur” veya “denenen tedavinin bir etkisi yoktur” sıfır hipotez olabilirler (Wikipedia)

Şimdi istatistik programlarında yaptığınız bir testin sonucu yerine çıkan p değeri ise sıfır hipotezine göre yorumlanır. 

p değeri 0 ile 1 arasındadır. Bu  değer 0.05 değerinden küçük ise sıfır hipotezine inanmayın der. (Kaynak)

Yani p değeri:

  • 0.05’ten büyükse sıfır hipotezi yalan (yani büyük ihtimalle)
  • 0.05’ten küçükse sıfır hipotezi doğru (yani büyük ihtimalle)

Bir örnek ADF Test:

Şimdi bir örnek verelim:

R’da ADF diye bir test var. Bir zaman serisinin durağan olup olmadığını test ediyor (Açılım: Augmented Dickey-Fuller test). Dokümantasyonu okuyunca şöyle diyor:

Computes the Augmented Dickey-Fuller test for the null that x has a unit root.

Yani bu testin sıfır hipotezi verilen serinin (x) birim kök içerdiğidir.

Birim kök içermek demek verinin durağan olmadığı anlamına gelir
Kaynak

Bir deney yapalım:

Şimdi R ile normal dağılıma sahip 100 sayı oluşturalım:


x = rnorm(1000)

Bu oluşan sayılar pozitif ve negatif tamamen tesadüfi olan 0 ile 1 arasında 1000 adet sayıdır. Bu sayıların durağan olup olmadığına bakmak için ADF testi yapıyoruz.


adf.test(x)

Sonuç şöyle çıkıyor:


data: x
Dickey-Fuller = -8.6139, Lag order = 9, p-value = 0.01
alternative hypothesis: stationary

Warning message:
In adf.test(x) : p-value smaller than printed p-value

Biz veri durağan mı kardaş diye soruyoruz p-value- 0.01 olduğundan yani 0.05’ten küçük olduğundan sıfır hipotezimiz (yani bu veride birim kök vardır hipotezi) doğru değildir. Yani bu veride birim kök vardır yalan. Birim kök yoktur. Dolayısıyla veri durağan değildir.

Birim kök, durağanlık p değeri derken kafa karışıyor haliyle. Buna çözüm olarak şöyle özetleyelim adf testi için:

adf.test yapınca p-value

  • 0.05’ten küçük veya ona eşit ise veri durağan değildir
  • 0.05’ten büyükse veri durağandır.

Durağanlık neydi yaa..

Tanımı Şurada

Veri durağan ise sorun yoktur. Ancak modellere konacak ise durağan hale getirilmesi gerekir. Durağan olmayan bir veri farkı alınarak durağan hale getirilebilir. (Kaynak: Gujaraati-Basic Econometrics s:747)

Bu istatistikçilerle, ekonometriciler millete eziyet olsun diye olayları hep olduğundan daha zor şekilde anlatıyorlar.

Reklamlar

R içerisinden Java fonksiyonlarını çağırmak


Yazdığınız Java kodlarını jar’a dönüştürün. R’ı çalıştırdığınız proje dizini içine koyun ve aşağıdaki gibi çağırın:

library(rJava)
.jinit("BenimJar.jar”) # this starts the JVM
jobject <- .jnew("jarIcindekiClass")  ## paket adı dahil
.jcall(jobject ,"I",method="ÇağrılacakMetot") 

Ki-Kare testi


Agah Bey’in babası paparazi izlettirmem, cahil adam işidir diyerek Bloomberg TV’de küresel finans haberlerini açtı. Agah Bey ise zor bir soru sordu: Efendim, eğitim düzeyi ile izlenen programlar arasında ilişki var mı?

Agah Bey’in babası iyi istatistikçi olduğundan, var dedi. Şöyle açıkladı:

Ki kare testine göre ilişki var gözüküyor. Kontenjans oranı ise 1’e çok yakın yani çok güçlü ilişki var.

Ki Kare testi nasıl yapılır? Burada

Zihinden Standart Sampa Hesaplama


Courtney Taylor’un bir yazısı standart sapmayı zihinden hesaplama için ilginç bir formül veriyor. Bu formülle  bir serinin standart sapmasını hızlıca hesaplayabilirsiniz. Formül şu: (Serinin en büyük değeri-En küçük değeri)/4

Şu seriyi deneyelim (makaledeki): 12, 12, 14, 15, 16, 18, 18, 20, 20, 25

Gerçek standart sapması:4.1

Bizim hızlı formülle: 25-12 / 3= 3.25

İyi hava atılabilir:)