検索プログラマのメモ帳

壁にぶつかったら検索で調べるプログラマのちょっと遅れたメモ帳。たまに自分で挑戦する。

Skip to: Content | Sidebar | Footer

Rでデータの処理(カテゴリカルデータと標準化)

25 7月, 2016 (17:01) | R解析 | By: admin

[:ja]Rでデータの処理

・カテゴリカルデータのダミー変数化
library(caret)
library(ggplot2)

#data1の全ての(~.)列をダミー変数化の対象と指定
tmp<-dummyVars(~., data=sample1)

#指定列をダミー変数化し、データフレームに成型する。
sample1.dummy<-as.data.frame(predict(tmp, sample1))

・単位が異なる変数を基準化/標準化
#2~9列までをscaleで標準化する。
scale.dummy<-scale(data1.dummy[,2:9])

#確認
summary(scale.dummy)

#標準偏差が1になっているか確認
library(psych)
describe(scale.dummy)[:]

Write a comment