Bazen elinize uzun bir liste gelir ve bu listede her bir kategorik değere sayısal bir değer atamanız icap eder. Mesela data frame (df) nesnemiz şöyle olsun:

  interest_level
0           high
1            low
2         medium
3           high
4            low
5           high
6           high
7            low
8            low
9         medium

Bu taloda high 1, medium 2, low 3 olsun şeklinde ID ataması her yazılımcının günlük olarak karşılaşabildiği bir problemdir. Yukarıdaki gibi bir tablo söz konusu olduğunda elle de atama yapılabilir. Ama dün elime 334 satırlık ve bol kolonlu bir tablo geldi ve bunlara ID atamam gerekiyordu. Python ve Panda kütüphanesinin “factorize” fonksiyonunu keşfettim. Bu fonksiyon otomatik atama yapıyor:

df['interest_level_id'] = pd.factorize(df['interest_level'])[0]

Bu kod interest_level_id diye bir kolon açarak her interest_level’deki değerlere göre atama yapıyor ve sonuç şöyle oluyor:

Güzel değil mi?

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Google fotoğrafı

Google hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Connecting to %s