Rでデータの処理(カテゴリカルデータと標準化)

[:ja]Rでデータの処理

・カテゴリカルデータのダミー変数化
library(caret)
library(ggplot2)

#data1の全ての(~.)列をダミー変数化の対象と指定
tmp<-dummyVars(~., data=sample1)

#指定列をダミー変数化し、データフレームに成型する。
sample1.dummy<-as.data.frame(predict(tmp, sample1))

・単位が異なる変数を基準化/標準化
#2~9列までをscaleで標準化する。
scale.dummy<-scale(data1.dummy[,2:9])

#確認
summary(scale.dummy)

#標準偏差が1になっているか確認
library(psych)
describe(scale.dummy)[:]

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です