A análise apresentada é uma análise de um conjunto de dados clássico disponível no livro do prof. Pimentel Gomes (1990) - Curso de Estatística Experimental, 13ed., pag. 168.
Os dados referem-se ao brix de frutos de 5 variedades de mangueira (parcela), colhidos de 3 pés por variedade. De cada pé foram colhidos 4 frutos, um de cada um dos pontos cardeais (subparcela). O experimento foi montado no delineamento inteiramente casualizado - DIC.
pg <- read.table("http://nbcgib.uesc.br/lec/download/R/dados/pimentel_gomes_psd.txt",
h = T)
str(pg)
'data.frame': 60 obs. of 4 variables:
$ var : Factor w/ 5 levels "v1","v2","v3",..: 1 1 1 2 2 2 3 3 3 4 ...
$ pc : Factor w/ 4 levels "L","N","O","S": 2 2 2 2 2 2 2 2 2 2 ...
$ r : Factor w/ 3 levels "r1","r2","r3": 1 2 3 1 2 3 1 2 3 1 ...
$ brix: num 18 17.5 17.8 16.3 16.6 15 16 19.5 16.3 16.6 ...
head(pg, 16)
var pc r brix
1 v1 N r1 18.0
2 v1 N r2 17.5
3 v1 N r3 17.8
4 v2 N r1 16.3
5 v2 N r2 16.6
6 v2 N r3 15.0
7 v3 N r1 16.0
8 v3 N r2 19.5
9 v3 N r3 16.3
10 v4 N r1 16.6
11 v4 N r2 15.9
12 v4 N r3 17.5
13 v5 N r1 18.9
14 v5 N r2 18.5
15 v5 N r3 21.5
16 v1 S r1 17.1
boxplot(brix ~ interaction(var, pc), data = pg, col = 2:6)
Observa-se de mais importante:
par(mfrow = c(2, 1))
with(pg, interaction.plot(pc, var, brix, col = 1:5, lwd = 1, ylab = "Brix, %"))
with(pg, interaction.plot(var, pc, brix, col = 1:4, lwd = 1, ylab = "Brix, %"))
avp <- aov(brix ~ var * pc + Error(r:var), data = pg) # Desconsidere o warning gerado por esta instrução!
Warning: Error() model is singular
summary(avp)
Error: r:var
Df Sum Sq Mean Sq F value Pr(>F)
var 4 29.6 7.39 4.7 0.021 *
Residuals 10 15.7 1.57
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
pc 3 20.6 6.87 3.99 0.017 *
var:pc 12 20.1 1.68 0.97 0.493
Residuals 30 51.6 1.72
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Observa-se que o resultado da ANOVA e dos gráficos de interação (interaction.plot) se contradizem!
Ou seja, a ANOVA informa que não existe interação entre Variedade e Ponto Cardeal (p = 49.31%). Já os gráficos fornecem indicativos visuais que a interação pode ser significativa.
Somente o aprofundamento da análise, ao se estudar o efeito do fator Ponto Cardeal (pc) dentro de cada nível do fator Variedade (var) usando testes discriminatórios irá redimir a dúvida.
library(TukeyC)
# Efeito principal: var
tkvar <- TukeyC(avp, which = "var", error = "r:var")
summary(tkvar)
Goups of means at sig.level = 0.05
Means G1
v5 17.61 a
v1 17.56 a
v3 16.33 a
v4 16.19 a
v2 15.98 a
Matrix of the difference of means above diagonal and
respective p-values of the Tukey test below diagonal values
v5 v1 v3 v4 v2
v5 0.000 0.050 1.275 1.417 1.625
v1 1.000 0.000 1.225 1.367 1.575
v3 0.168 0.194 0.000 0.142 0.350
v4 0.112 0.129 0.998 0.000 0.208
v2 0.060 0.070 0.956 0.993 0.000
# Efeito principal: pc
tkpc <- TukeyC(avp, which = "pc", error = "Within")
summary(tkpc)
Goups of means at sig.level = 0.05
Means G1 G2
N 17.46 a
O 16.88 a b
L 16.77 a b
S 15.83 b
Matrix of the difference of means above diagonal and
respective p-values of the Tukey test below diagonal values
N O L S
N 0.000 0.580 0.687 1.633
O 0.625 0.000 0.107 1.053
L 0.489 0.996 0.000 0.947
S 0.010 0.147 0.219 0.000
Estranho não? A ANOVA informa que existe diferença entre as Variedade (p = 2.10%) e o teste de Tukey não detectou diferenças. Detectaria se adotasse p >= 6.10%.
# Estudando: v1/pc
tk1 <- TukeyC.nest(avp, which = "var:pc", error = "Within", fl1 = 1)
summary(tk1)
Goups of means at sig.level = 0.05
Means G1
v1/L 17.77 a
v1/N 17.77 a
v1/S 17.60 a
v1/O 17.10 a
Matrix of the difference of means above diagonal and
respective p-values of the Tukey test below diagonal values
v1/L v1/N v1/S v1/O
v1/L 0.000 0.000 0.167 0.667
v1/N 1.000 0.000 0.167 0.667
v1/S 0.999 0.999 0.000 0.500
v1/O 0.924 0.924 0.966 0.000
# Estudando: v2/pc
tk2 <- TukeyC.nest(avp, which = "var:pc", error = "Within", fl1 = 2)
summary(tk2)
Goups of means at sig.level = 0.05
Means G1
v2/O 17.00 a
v2/L 16.23 a
v2/N 15.97 a
v2/S 14.73 a
Matrix of the difference of means above diagonal and
respective p-values of the Tukey test below diagonal values
v2/O v2/L v2/N v2/S
v2/O 0.000 0.767 1.033 2.267
v2/L 0.890 0.000 0.267 1.500
v2/N 0.770 0.994 0.000 1.233
v2/S 0.171 0.509 0.661 0.000
# Estudando: v3/pc
tk3 <- TukeyC.nest(avp, which = "var:pc", error = "Within", fl1 = 3)
summary(tk3)
Goups of means at sig.level = 0.05
Means G1
v3/N 17.27 a
v3/L 16.30 a
v3/O 15.93 a
v3/S 15.83 a
Matrix of the difference of means above diagonal and
respective p-values of the Tukey test below diagonal values
v3/N v3/L v3/O v3/S
v3/N 0.000 0.967 1.333 1.433
v3/L 0.803 0.000 0.367 0.467
v3/O 0.604 0.986 0.000 0.100
v3/S 0.546 0.972 1.000 0.000
# Estudando: v4/pc
tk4 <- TukeyC.nest(avp, which = "var:pc", error = "Within", fl1 = 4)
summary(tk4)
Goups of means at sig.level = 0.05
Means G1
v4/O 17.07 a
v4/N 16.67 a
v4/L 16.30 a
v4/S 14.73 a
Matrix of the difference of means above diagonal and
respective p-values of the Tukey test below diagonal values
v4/O v4/N v4/L v4/S
v4/O 0.000 0.400 0.767 2.333
v4/N 0.982 0.000 0.367 1.933
v4/L 0.890 0.986 0.000 1.567
v4/S 0.152 0.291 0.472 0.000
# Estudando: v5/pc
tk5 <- TukeyC.nest(avp, which = "var:pc", error = "Within", fl1 = 5)
summary(tk5)
Goups of means at sig.level = 0.05
Means G1 G2
v5/N 19.63 a
v5/O 17.30 a b
v5/L 17.27 a b
v5/S 16.23 b
Matrix of the difference of means above diagonal and
respective p-values of the Tukey test below diagonal values
v5/N v5/O v5/L v5/S
v5/N 0.000 2.333 2.367 3.400
v5/O 0.152 0.000 0.033 1.067
v5/L 0.144 1.000 0.000 1.033
v5/S 0.017 0.753 0.770 0.000
sk <- list()
library(ScottKnott)
for (i in 1:5) sk[[i]] <- SK.nest(avp, which = "var:pc", error = "Within", fl1 = i)
res <- sapply(sk, summary)
Nested: var/pc
Levels Means SK(5%)
v1/L 17.77 a
v1/N 17.77 a
v1/S 17.60 a
v1/O 17.10 a
Nested: var/pc
Levels Means SK(5%)
v2/O 17.00 a
v2/L 16.23 a
v2/N 15.97 a
v2/S 14.73 a
Nested: var/pc
Levels Means SK(5%)
v3/N 17.27 a
v3/L 16.30 a
v3/O 15.93 a
v3/S 15.83 a
Nested: var/pc
Levels Means SK(5%)
v4/O 17.07 a
v4/N 16.67 a
v4/L 16.30 a
v4/S 14.73 a
Nested: var/pc
Levels Means SK(5%)
v5/N 19.63 a
v5/O 17.30 b
v5/L 17.27 b
v5/S 16.23 b
Observa-se:
Isto é um demonstrativo claro da existência de interação. Concorda?
A análise de experimentos da família das parcelas subdivididas deve ser conduzida com muito cuidado, atenção e bom senso. Somente é conclusiva quando se chega a 1 grau de liberdade na ANOVA (via análise de contrastes preferencialmente ortogonais) ou ao final dos testes discriminatórios.