Bulk replacing Turkish characters in R


Turkish character sometimes became the menace for the data scientist. To avoid the risks you may want to change it with safe characters. To do that you can use this code:

#turkce karakter donusumu
to.plain <- function(s) {

# 1 character substitutions
old1 <- “çğşıüöÇĞŞİÖÜ”
new1 <- “cgsiuocgsiou”
s1 <- chartr(old1, new1, s)

# 2 character substitutions
old2 <- c(“œ”, “ß”, “æ”, “ø”)
new2 <- c(“oe”, “ss”, “ae”, “oe”)
s2 <- s1
for(i in seq_along(old2)) s2 <- gsub(old2[i], new2[i], s2, fixed = TRUE)

s2
}
df$source=as.vector(sapply(df$source,to.plain))

Reklamlar

A tool for getting rid of SQLServer chore


Capture

Declaration variables and setting the initial value in SQLServer is a boring chore. Especially when there are a lot of variables you should write 2 times more code.

To circumvent that I’ve developed a script.
Just define your variables then assign the which value you want then get result and copy-paste it to SQLServer

Here is how:

http://rpubs.com/suatatan/sqlserver-declarator

R’da tüm korelasyonları toplu göstermek


Verisetiniz içerisinde kaç parametre varsa bunların birbirleri ile ilişkisi için teker teker korelasyonlara bakmanıza gerek yok. R’da bu işlemi topluca yaparak zaman kazanabilirsiniz.

Veri Amerika’nın Wyoming eyaletindeki suç verileri (2013)

  library(xlsx)
  a=xlsx::read.xlsx("wyoming.xls",sheetName = "13tbl8wy"
                    ,as.data.frame = T
                    ,stringAsFactors=F)
  #NA konları sil
  a=a[colSums(!is.na(a)) > 0]
  #correlation pairs
  panel.cor <- function(x, y, digits = 2, prefix = "", cex.cor, ...)
  {
    usr <- par("usr"); on.exit(par(usr))
    par(usr = c(0, 1, 0, 1))
    r <- abs(cor(x, y))
    txt <- format(c(r, 0.123456789), digits = digits)[1]
    txt <- paste0(prefix, txt)
    if(missing(cex.cor)) cex.cor <- 0.8/strwidth(txt)
    text(0.5, 0.5, txt, cex = cex.cor * r)
  }
  pairs(a[1:5], lower.panel = panel.smooth, upper.panel = panel.cor)

#corelation pairs fonksiyonundan sonraki kısımla aşağıdaki gibi koralasyon tablosu elde edebiliyorsunuz.

Gördüğünüz üzere hem korelasyonlar hem grafikler kolayca eşleştirilebiliyor. Bu grafikten ne anlıyoruz. Wyoming için 2013 yılında şehir bazında nüfus ile işlenen şiddet içeren suçlar arasında ciddi ilişki var. O zaman küçük yerler daha güvenli olabilir. Ama kumarbaz yanılgısına düşmeyin. Küçük ihtimaller gelip sizi bulabilir.

Interpreting Linear Model(lm) in R


In R as you know, when it have been written: summary(lm(x~y)), the command gives  a lot of different ‘mystic’ values. I have found a good manual for interpreting the result. It is here

Besides, do not forget lm command is relevant with “regression” model. If you want to compute the simple correlation between two parameter use cor(x,y) command.

If you do not have any idea about difference, here is good article for you

Enjoy

R Kullanım Kılavuzu


İstatistik, ekonometri ve matematiksel işlemlerde komut bazlı çalışan (yani düğme filan yok tamamen sözüm ona sıkıcı bilgisayar kodları ile) ancak tam anlamı ile zehir gibi bir araç olan R için bazı temel komutları unutmama ve paylaşma adına “cheatsheet” kabilinden bir dosya paylaşmaya karar verdim. Yenilerini de buradan devam ettireceğim.

İşte bazı basit kodlar:

https://gist.github.com/suatatan/2f5a1cf5c1f84ae46d42.js Yararlanılan Kaynaklar
http://www.montefiore.ulg.ac.be/~kvansteen/GBIO00091/ac20092010/Class8/Using%20R%20for%20linear%20regression.pdf

http://stackoverflow.com/questions/6771588/how-to-define-a-simple-dataset-in-r