Conteúdo
A análise apresentada é uma análise de um conjunto de dados clássico disponível no livro do prof. Pimentel Gomes (1990) - Curso de Estatística Experimental, 13ed., pag. 168.
Os dados referem-se ao brix de frutos de 5 variedades de mangueira (parcela), colhidos de 3 pés por variedade. De cada pé foram colhidos 4 frutos, um de cada um dos pontos cardeais (subparcela). O experimento foi montado no delineamento inteiramente casualizado - DIC.
Dados
Descrição dos dados
- var: Variedade com 5 níveis (v1, v2, …, v5) - parcela
- v1 = Carlota
- v2 = Extrema
- v3 = Oliveira
- v4 = Bourbon
- v5 = Imperial
- pc: Ponto Cardeal com 4 níveis (N, S, L, O) - subparcela
- r: repetição (3)
- brix: Variável de resposta: brix dos frutos em percentual (%)
Leitura de dados
pg <- read.table("http://nbcgib.uesc.br/lec/download/R/dados/pimentel_gomes_psd.txt",
h = T)
str(pg)
'data.frame': 60 obs. of 4 variables:
$ var : Factor w/ 5 levels "v1","v2","v3",..: 1 1 1 2 2 2 3 3 3 4 ...
$ pc : Factor w/ 4 levels "L","N","O","S": 2 2 2 2 2 2 2 2 2 2 ...
$ r : Factor w/ 3 levels "r1","r2","r3": 1 2 3 1 2 3 1 2 3 1 ...
$ brix: num 18 17.5 17.8 16.3 16.6 15 16 19.5 16.3 16.6 ...
head(pg, 16)
var pc r brix
1 v1 N r1 18.0
2 v1 N r2 17.5
3 v1 N r3 17.8
4 v2 N r1 16.3
5 v2 N r2 16.6
6 v2 N r3 15.0
7 v3 N r1 16.0
8 v3 N r2 19.5
9 v3 N r3 16.3
10 v4 N r1 16.6
11 v4 N r2 15.9
12 v4 N r3 17.5
13 v5 N r1 18.9
14 v5 N r2 18.5
15 v5 N r3 21.5
16 v1 S r1 17.1
Análise
Gráfica
boxplot(brix ~ interaction(var, pc), data = pg, col = 2:6)
Observa-se de mais importante:
- Ausência de valores discrepantes (outiers) em todas as combinações possíveis de Variedade e Ponto Cardeal;
- Um valor médio relativamente elevado do brix na Variedade 5 no Ponto Cardeal N;
- Prevalência de valores menores do brix no Ponto Cardeal S.
par(mfrow = c(2, 1))
with(pg, interaction.plot(pc, var, brix, col = 1:5, lwd = 1, ylab = "Brix, %"))
with(pg, interaction.plot(var, pc, brix, col = 1:4, lwd = 1, ylab = "Brix, %"))
ANOVA
avp <- aov(brix ~ var * pc + Error(r:var), data = pg) # Desconsidere o warning gerado por esta instrução!
Warning: Error() model is singular
summary(avp)
Error: r:var
Df Sum Sq Mean Sq F value Pr(>F)
var 4 29.6 7.39 4.7 0.021 *
Residuals 10 15.7 1.57
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
pc 3 20.6 6.87 3.99 0.017 *
var:pc 12 20.1 1.68 0.97 0.493
Residuals 30 51.6 1.72
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Observa-se que o resultado da ANOVA e dos gráficos de interação (interaction.plot) se contradizem!
Ou seja, a ANOVA informa que não existe interação entre Variedade e Ponto Cardeal (p = 49.31%). Já os gráficos fornecem indicativos visuais que a interação pode ser significativa.
Somente o aprofundamento da análise, ao se estudar o efeito do fator Ponto Cardeal (pc) dentro de cada nível do fator Variedade (var) usando testes discriminatórios irá redimir a dúvida.
Comparando médias: efeitos principais
library(TukeyC)
# Efeito principal: var
tkvar <- TukeyC(avp, which = "var", error = "r:var")
summary(tkvar)
Goups of means at sig.level = 0.05
Means G1
v5 17.61 a
v1 17.56 a
v3 16.33 a
v4 16.19 a
v2 15.98 a
Matrix of the difference of means above diagonal and
respective p-values of the Tukey test below diagonal values
v5 v1 v3 v4 v2
v5 0.000 0.050 1.275 1.417 1.625
v1 1.000 0.000 1.225 1.367 1.575
v3 0.168 0.194 0.000 0.142 0.350
v4 0.112 0.129 0.998 0.000 0.208
v2 0.060 0.070 0.956 0.993 0.000
# Efeito principal: pc
tkpc <- TukeyC(avp, which = "pc", error = "Within")
summary(tkpc)
Goups of means at sig.level = 0.05
Means G1 G2
N 17.46 a
O 16.88 a b
L 16.77 a b
S 15.83 b
Matrix of the difference of means above diagonal and
respective p-values of the Tukey test below diagonal values
N O L S
N 0.000 0.580 0.687 1.633
O 0.625 0.000 0.107 1.053
L 0.489 0.996 0.000 0.947
S 0.010 0.147 0.219 0.000
Estranho não? A ANOVA informa que existe diferença entre as Variedade (p = 2.10%) e o teste de Tukey não detectou diferenças. Detectaria se adotasse p >= 6.10%.
Comparando médias: comparando subparcela (pc) em cada nível de parcela (var)
Tukey
# Estudando: v1/pc
tk1 <- TukeyC.nest(avp, which = "var:pc", error = "Within", fl1 = 1)
summary(tk1)
Goups of means at sig.level = 0.05
Means G1
v1/L 17.77 a
v1/N 17.77 a
v1/S 17.60 a
v1/O 17.10 a
Matrix of the difference of means above diagonal and
respective p-values of the Tukey test below diagonal values
v1/L v1/N v1/S v1/O
v1/L 0.000 0.000 0.167 0.667
v1/N 1.000 0.000 0.167 0.667
v1/S 0.999 0.999 0.000 0.500
v1/O 0.924 0.924 0.966 0.000
# Estudando: v2/pc
tk2 <- TukeyC.nest(avp, which = "var:pc", error = "Within", fl1 = 2)
summary(tk2)
Goups of means at sig.level = 0.05
Means G1
v2/O 17.00 a
v2/L 16.23 a
v2/N 15.97 a
v2/S 14.73 a
Matrix of the difference of means above diagonal and
respective p-values of the Tukey test below diagonal values
v2/O v2/L v2/N v2/S
v2/O 0.000 0.767 1.033 2.267
v2/L 0.890 0.000 0.267 1.500
v2/N 0.770 0.994 0.000 1.233
v2/S 0.171 0.509 0.661 0.000
# Estudando: v3/pc
tk3 <- TukeyC.nest(avp, which = "var:pc", error = "Within", fl1 = 3)
summary(tk3)
Goups of means at sig.level = 0.05
Means G1
v3/N 17.27 a
v3/L 16.30 a
v3/O 15.93 a
v3/S 15.83 a
Matrix of the difference of means above diagonal and
respective p-values of the Tukey test below diagonal values
v3/N v3/L v3/O v3/S
v3/N 0.000 0.967 1.333 1.433
v3/L 0.803 0.000 0.367 0.467
v3/O 0.604 0.986 0.000 0.100
v3/S 0.546 0.972 1.000 0.000
# Estudando: v4/pc
tk4 <- TukeyC.nest(avp, which = "var:pc", error = "Within", fl1 = 4)
summary(tk4)
Goups of means at sig.level = 0.05
Means G1
v4/O 17.07 a
v4/N 16.67 a
v4/L 16.30 a
v4/S 14.73 a
Matrix of the difference of means above diagonal and
respective p-values of the Tukey test below diagonal values
v4/O v4/N v4/L v4/S
v4/O 0.000 0.400 0.767 2.333
v4/N 0.982 0.000 0.367 1.933
v4/L 0.890 0.986 0.000 1.567
v4/S 0.152 0.291 0.472 0.000
# Estudando: v5/pc
tk5 <- TukeyC.nest(avp, which = "var:pc", error = "Within", fl1 = 5)
summary(tk5)
Goups of means at sig.level = 0.05
Means G1 G2
v5/N 19.63 a
v5/O 17.30 a b
v5/L 17.27 a b
v5/S 16.23 b
Matrix of the difference of means above diagonal and
respective p-values of the Tukey test below diagonal values
v5/N v5/O v5/L v5/S
v5/N 0.000 2.333 2.367 3.400
v5/O 0.152 0.000 0.033 1.067
v5/L 0.144 1.000 0.000 1.033
v5/S 0.017 0.753 0.770 0.000
ScottKnott
sk <- list()
library(ScottKnott)
for (i in 1:5) sk[[i]] <- SK.nest(avp, which = "var:pc", error = "Within", fl1 = i)
res <- sapply(sk, summary)
Nested: var/pc
Levels Means SK(5%)
v1/L 17.77 a
v1/N 17.77 a
v1/S 17.60 a
v1/O 17.10 a
Nested: var/pc
Levels Means SK(5%)
v2/O 17.00 a
v2/L 16.23 a
v2/N 15.97 a
v2/S 14.73 a
Nested: var/pc
Levels Means SK(5%)
v3/N 17.27 a
v3/L 16.30 a
v3/O 15.93 a
v3/S 15.83 a
Nested: var/pc
Levels Means SK(5%)
v4/O 17.07 a
v4/N 16.67 a
v4/L 16.30 a
v4/S 14.73 a
Nested: var/pc
Levels Means SK(5%)
v5/N 19.63 a
v5/O 17.30 b
v5/L 17.27 b
v5/S 16.23 b
Observa-se:
- O mesmo padrão de respostas para os dois testes discriminatórios: Tukey e ScottKnott;
- Para ambos (5%) o padrão de resposta do fator Ponto Cardeal (pc) é diferente dos demais dentro do nível 5 do fator Variedade (var).
Isto é um demonstrativo claro da existência de interação. Concorda?
Conslusões
A análise de experimentos da família das parcelas subdivididas deve ser conduzida com muito cuidado, atenção e bom senso. Somente é conclusiva quando se chega a 1 grau de liberdade na ANOVA (via análise de contrastes preferencialmente ortogonais) ou ao final dos testes discriminatórios.