Home‎ > ‎ProgramTool‎ > ‎R‎ > ‎データマイニング入門‎ > ‎

Chap.3

090225_21_30

決定木
基準変数が質的変数の場合 分類木
基準変数が連続変数の場合 回帰木
と呼ぶらしい

P100

library(mvpart)
タイタニックデータ <- read.csv("タイタニック.csv",header=T)
タイタニック木 <- rpart(生死~等級+大人子ども+性別,data=タイタニックデータ,method="class")
print(タイタニック木)

plot(タイタニック木,uniform=T,branch=0.6,margin=0.15)
text(タイタニック木,all=TRUE,use.n=TRUE,pretty=0)

どうも、グラフでは、日本語が通ってない

判別 <- predict(タイタニック木,newdata=タイタニックデータ,type="class")
table(判別,タイタニックデータ$生死)

P103
090226_21_11

次は、お札

お札データ <- read.csv("お札.csv",header=T)
お札木 <- rpart(真偽 ~ . , data=お札データ)
print(お札木)
plot(お札木,uniform=T,branch=1,margin=0.05)
text(お札木,all=T,use.n=T)

P104

次はおうち

ハウスデータ <- read.csv("ハウス.csv",header=T)
ハウス木 <- rpart(家価格 ~ . , data=ハウスデータ,method="anova")
print(ハウス木)

ハウス木 <- rpart(家価格 ~ . , data=ハウスデータ,method="anova",cp=0)
print(ハウス木)

plotcp(ハウス木)
ハウス木2 <- prune(ハウス木,cp=0.03)
print(ハウス木2)
plotcp(ハウス木2)

plot(ハウス木2,uniform=T,branch=0.6,margin=0.1)
text(ハウス木2,all=T,use.n=T)

P108


Comments