Capítulo 20 Importando banco de dados e exportando resultados

# ------------------------------------------------------------------------
# Importando base de dados
# ------------------------------------------------------------------------
getwd()  # Para saber em qual diretório o R está direcionado

# Direcionando o R para o diretório onde está as bases de dados
#setwd('c:\\Users\\ivan\\Desktop\\CursoR\\Dados') - windows
# Selecionando de qualquer arquivo. No caso de planilha eletrônica.
dad1 = read.table(file = 'clipboard',
                  sep = '\t',
                  header = TRUE)
summary(dad1) #Percebam que a variavel med foi lida de modo errado!

dad1 = read.table(file = 'clipboard',
                  sep = '\t',
                  dec = ',',
                  header = TRUE)
summary(dad1) #Percebam que a variavel med foi lida de modo errado!

# Em formato .txt (Eu acho o melhor formato, pois é simples e sem complicações)
dad3 = read.table('pop1.txt',
                  dec=',',
                  header = T)
dad3
summary(dad3)

# Em formato .csv
dad4_possi1 = read.table('dpalito.csv',
                         sep=',',
                         dec = ',',
                         header = TRUE)
dad4_possi1

dad4_possi2 = read.table('dpalito2.csv',
                         sep=';',
                         dec = ',',
                         header = TRUE)
dad4_possi2

# Importanto uma base de dados colocando o endereço do diretório diretamente.
dad4 = read.table('C:\\Users\\ivana\\Desktop\\pop1.txt',
                  dec=',',
                  h = T)
dad4

# Escolhendo a base de dados de maneira interativa. Obs: Apenas em formato '.txt'
dad5 = read.table(file.choose(),
                  header = T)

# Em formato .xls ou .xlsx do Excel.
library(openxlsx) 
dad6 = read.xlsx("C:\\Users\\ivana\\Desktop\\dpalito.xlsx",
                  sheet=1)
summary(dad6)

# Lendo arquivos disponíveis da internet.
dad7 = read.table('http://nbcgib.uesc.br/lec/download/R/dados/matarazzo.txt',
                  header = T)
dad7                  

# Ordenando a base de dados
iris

with(iris,
     iris[order(Species), ])

with(iris,
     iris[rev(order(Species)), ])

with(iris,
     iris[rev(order(Species, Sepal.Length, Sepal.Width)), ])

# Utilizando a função subset
modatual = subset(iris,
                  Species == 'setosa')
modatual

summary(modatual)

modmean = subset(iris,
                 Sepal.Length > mean(Sepal.Length))
modmean

summary(modmean)

# -----------------------------------------------------------------------------
# Salvando os objetos que foram executados
# para não precisar rodar o script novamente!
# -----------------------------------------------------------------------------
save.image('CursoR.RData')

load('\\Users\\ivana\\Desktop\\CursoR.RData') # Para carregar o que foi feito e executado.

# -----------------------------------------------------------------------------
# Salvando os resultados
# -----------------------------------------------------------------------------
sink('analysis.doc',
     type = 'output')

summary(iris)

media = mean(iris$Sepal.Length)
media

sink()

# -----------------------------------------------------------------------------
# Salvando matrizes e data.frames em excel
# -----------------------------------------------------------------------------
tabsimp = rep(c('Mulheres',
                'Homens'),
              c(20, 12)) 
tabsimp1 = table(tabsimp)

write.table(tabsimp1,           # O objeto a ser salvo
            'tabsimp.xlsx',     # O nome do arquivo
            row.names = FALSE, # Com nome das linhas???
            quote = FALSE)     # Com aspas??

write.table(modmean,
            'modmean.xls',
            row.names = FALSE,
            quote = FALSE,
            sep = '\t')        # Separar as colunas
            
write.table(iris,
           'iris.xlsx',
           row.names=FALSE,
           quote=FALSE)