Chapter 5 Gráficos de controle para localização do processo

Neste tópico será abordado os gráficos que consideram a média como medida de tendência central. O intuito é verificar se alguma medida de localização da distribuição da variável permanece estável ao longo do tempo. O gráfico mais popular é o \(\bar{X}\).

5.1 O gráfico \(\bar{X}\) baseado em valores de parâmetro conhecidos

Relembrando a distribuição amostral do estimador \(\bar{X}\) temos que:

\[ \bar{X} \sim N \left(\mu, \frac{\sigma^2}{n} \right) \]

Portanto, sabemos que \(P(\mu - 3\sigma_{\bar{X}} \le \bar{X} \le \mu + 3\sigma_{\bar{X}}) = 0,9974\), ou seja,

Logo, é altamente provável que um processo sob controle tenha a média amostral dentro de 3 desvios padrão da média do processo \(\mu\).

De um modo mais prático, para elaboração do gráfico precisamos conhecer a média (\(\mu\)) e o desvio padrão (\(\sigma\)). Então calculamos o limite de controle inferior (LCI) e superior (LCS) da seguinte forma:

\[ LCI = \mu - 3\cdot \frac{\sigma}{\sqrt{n}} \\ LCS = \mu + 3\cdot \frac{\sigma}{\sqrt{n}} \]

Então, com as médias estimadas de cada amostra coletada no tempo \(t\) elaboramos o gráfico com os componentes citados anteriormente para checar se um processo está ou não sob controle.

5.1.1 Aplicação

Uma vez por dia, três tipos de óleo de motos são selecionados aleatoriamente a partir do processo de produção e cada um é analisado para determinar a viscosidade. Os dados a seguir https://lec.pro.br/download/R/dados/Devore_Ex16.xlsx. são para um período de 25 dias. Experimentos contínuos com este processo sugerem que, quando o processo está sob controle, a viscosidade de uma espécie é normalmente distribuída com média 10,5 e desvio padrão de 0,18. Assim, \(\sigma_{\bar{x}}=\sigma/\sqrt{n} = 0,18/\sqrt{3} = 0,104\). Logo, os limites de controle 3 sigma são:

\[ LCI = 10,5 - 3\cdot0,104 = 10,188\\ LCS = 10,5 + 3\cdot0,104 = 10,812 \]

No R temos:

#Carregando o pacote importar os dados
library(openxlsx)

#Importando os dados
ex1 <- read.xlsx('Devore_Ex16.xlsx')

#Vendo um resumo dos dados     
summary(ex1)
##       dia       amostra           viscosidade   
##  Min.   : 1   Length:75          Min.   :10.00  
##  1st Qu.: 7   Class :character   1st Qu.:10.36  
##  Median :13   Mode  :character   Median :10.46  
##  Mean   :13                      Mean   :10.48  
##  3rd Qu.:19                      3rd Qu.:10.60  
##  Max.   :25                      Max.   :10.84
#Calculando as médias diárias
medias <- with(ex1, tapply(viscosidade,dia,mean))
medias
##        1        2        3        4        5        6        7        8 
## 10.30667 10.43333 10.51000 10.34667 10.70667 10.50333 10.46333 10.49000 
##        9       10       11       12       13       14       15       16 
## 10.39000 10.49333 10.44667 10.43667 10.40333 10.60667 10.49333 10.48000 
##       17       18       19       20       21       22       23       24 
## 10.44333 10.76000 10.47000 10.39000 10.59333 10.44333 10.40667 10.48667 
##       25 
## 10.39333
#plotando o gráfico
plot(medias, pch=16, xlab='Dia', ylab='Médias', ylim=c(10,11),axes=FALSE)
axis(1,at=1:25)#inserindo o eixo x
axis(2)#inserindo o eixo y
abline(h = 10.188, col='red')#colocando o LCI
abline(h = 10.812, col='red')#colocando o LCS
abline(h = 10.5, col='blue')#colocando a média de controle

Como nenhum ponto está acima ou abaixo do LCI e LCS respectivamente podemos afirmar que o processo está sob controle.

5.2 O gráfico \(\bar{X}\) baseado em parâmetros estimados

Na maioria das situações desconhecemos os parâmetros \(\mu\) e \(\sigma\) principalmente se um processo está sujeito à análise de controle de qualidade pela primeira vez. Então, neste caso faz-se necessário estimar tanto \(\mu\) quanto \(\sigma\).

No caso do parâmetro \(\mu\), basta relembrarmos do conceito de valor esperado ou esperança matemática do estimador \(\bar{X}\) visto na disciplina de probabilidade e estatística. Se imaginarmos que cada amostra tomada no tempo \(t\) é representativa do processo e então estimarmos a média de cada amostra, ou seja, \(\bar{X_1}, \bar{X_2}, \cdots, \bar{X_t}\), o valor mais provável do parâmetro \(\mu\) seria a média das médias amostrais tomadas no tempo \(t\), ou seja,

\[ \hat{\mu} = \frac{\sum_{i=1}^{t}\bar{X_i}}{t} \]

Usualmente costuma-se coletar amostras de tamanho \(3,4,5\) ou \(6\) e um período \(t \ge 20\).

Para estimar \(\sigma\) já foi abordado na displina de probabilidade e estatística que \(S\) é o melhor estimador comparado com a amplitude, embora, este último tenha sido largamente utilizado em processos de controle por falta de recursos computacionais da época. Logo, neste material só será utilizado o estimador \(S\).

O estimador \(S\) embora seja um bom estimador de \(\sigma\), ainda sim é um estimador viesado, ou seja, \(E(S)\neq \sigma\). Não ache estranho porque você viu que \(E(S^2) = \sigma^2\). O fato de tirarmos a raiz quadrada de \(S^2\) bagunça todas as propriedades. Logo, o valor mais provável de \(S\) é

\[ E(S) = a_{n} \cdot \sigma \]

em que

\[ a_{n} = \frac{\sqrt{2}(n/2)}{\sqrt{n-1}\gamma{(n-1)/2}} \]

O valor de \(n\) significa o tamanho da amostra coletada em cada tempo \(t\) e \(\gamma\) é a função gama. O valor de \(a_n\) será obtido facilmente no R.

an <- function(n){
   num = sqrt(2)*gamma(n/2)
   deno = sqrt(n-1)*gamma((n-1)/2)
   res = num/deno
   res
}     

Vamos obter então um estimador não viesado para \(\sigma\). Sejam \(S_1, S_2, \cdots, S_t\) desvios padrões amostrais tomados em cada tempo \(t\). Então o valor mais provável de \(\bar{S}\) é

\[ E(\bar{S}) = \frac{\sum_{i=1}^{t}S_i}{k} = \frac{k \cdot a_n \cdot \sigma}{k} = a_n \cdot \sigma \]

Então,

\[ E\left(\frac{\bar{S}}{a_n}\right) = \frac{E(\bar{S})}{a_n} = \frac{a_n \cdot \sigma}{a_n} = \sigma \]

Portanto \(\hat{\sigma} = \bar{S}/a_n\) é um estimador não-viesado de \(\sigma\).

Logo, poderemos calcular os limites de controle inferior (LCI) e superior (LCS) da seguinte forma:

\[ LCI = \hat{\mu} - 3 \cdot \frac{\bar{S}}{a_n \cdot \sqrt{n}} \\ LCS = \hat{\mu} + 3 \cdot \frac{\bar{S}}{a_n \cdot \sqrt{n}} \]

5.2.1 Aplicação

Vamos utilizar o mesmo exemplo abordado anteriormente. Neste caso devemos estimar \(\hat{\mu}\), ou sejam calcular a média de cada amostra e depois tirar a média das médias amostrais. Então,

muchapeu <- mean(medias)#percebam que o objeto "medias" já foi calculado no exemplo anterior
muchapeu   
## [1] 10.47587

Vamos então estimar \(\bar{S}\) e calcular \(a_n\).

desviopadrao <-  with(ex1, tapply(viscosidade,dia,sd))#desvio padrão de cada amostra
desviopadrao
##          1          2          3          4          5          6 
## 0.10115994 0.17473790 0.27622455 0.10969655 0.15947832 0.02516611 
##          7          8          9         10         11         12 
## 0.05507571 0.17349352 0.08717798 0.21825062 0.21733231 0.38214308 
##         13         14         15         16         17         18 
## 0.08504901 0.14011900 0.05773503 0.18330303 0.19604421 0.06082763 
##         19         20         21         22         23         24 
## 0.24979992 0.18330303 0.10785793 0.09291573 0.26312228 0.17672955 
##         25 
## 0.05859465
sbarra <- mean(desviopadrao)#média dos desvios  
sbarra 
## [1] 0.1534135
a3 <- an(3)#o tamanho de cada amostra foi 3
a3 
## [1] 0.8862269

Portanto, os LCI e LCS são,

\[ LCI = 10,476 - 3\cdot\frac{0,153}{0,886\cdot \sqrt{3}} = 10,177\\ LCS = 10,476 + 3\cdot\frac{0,153}{0,886\cdot \sqrt{3}} = 10,775 \]

No R temos:

#plotando o gráfico
plot(medias, pch=16, xlab='Dia', ylab='Médias', ylim=c(10,11),axes=FALSE)
axis(1,at=1:25)#inserindo o eixo x
axis(2)#inserindo o eixo y
abline(h = 10.177, col='red')#colocando o LCI
abline(h = 10.775, col='red')#colocando o LCS
abline(h = 10.476, col='blue')#colocando a média de controle

Neste exemplo também percebemos que nenhum ponto está acima ou abaixo dos LCI e LCS respectivamente, indicando que o processo está sob controle.