abrir dados no R
4 participantes
Página 1 de 1
abrir dados no R
Pretendo realizar uma anova multi fatores para analisar meus dados:
Como fatores tenho: intervalos de tempo (5) e comprimento de trilha (3)
Minha variavel resposta eh peso da carga.
Os dados estão digitados e salvos em txt conforme todas as recomendacoes do R.
Ja transformei minha variavel tempo em categorica, no entatno a variavel peso nao eh disponibilxada como variavel resposta.
Utilizo o Rcommander. O que pode estar acontecendo?
Nao tem espaço no titulo das variaveis, mesmo numero de casas decimais, ponto para separar casas decimais.
Como fatores tenho: intervalos de tempo (5) e comprimento de trilha (3)
Minha variavel resposta eh peso da carga.
Os dados estão digitados e salvos em txt conforme todas as recomendacoes do R.
Ja transformei minha variavel tempo em categorica, no entatno a variavel peso nao eh disponibilxada como variavel resposta.
Utilizo o Rcommander. O que pode estar acontecendo?
Nao tem espaço no titulo das variaveis, mesmo numero de casas decimais, ponto para separar casas decimais.
juliane- Convidado
Re: abrir dados no R
Juliane, para eu poder analisar melhor você poderia postar parte de seus dados aqui, do jeito como está no txt, apenas as 10 primeiras linhas seriam suficientes.
Dicas de como entrar com os dados no R:
1) Pode-se usar "," ou "." como separador decimal, desde que você especifique para o programa qual dos dois você utilizou, através do argumento dec="," ou dec="."
2) O separador de coluna: é onde acontecem os maiores problemas, o que oferece menos conflitos é o ";". Para utilizá-lo é só abrir o arquivo no excel, escolher a opção "Salvar como" -> tipo de arquivo:"csv(separado por vírgulas)" e salvar.
3) Escolher a função que mais combina com a formatação de seus dados, basicamente são 3 variações:
read.table
Por padrão tem os seguintes argumentos:
header=FALSE : os dados não possuem cabeçalho
sep="" : a separação das colunas é o espaço
dec="." : o separador de casa decimal é o ponto
read.csv
Por padrão tem os seguintes argumentos:
header=TRUE : os dados possuem cabeçalho (nome das colunas)
sep="," : a separação das colunas é a vírgula
dec="." : o separador de casa decimal é o ponto
read.csv2
Por padrão tem os seguintes argumentos:
header=TRUE : os dados possuem cabeçalho (nome das colunas)
sep=";" : a separação das colunas é o ponto e vírgula
dec="," : o separador de casa decimal é a vírgula
Para os padrões brasileiros o que mais se adequa é o read.csv2
obs: os parâmetros padrões podem ser alterados em qualquer uma dessas funções basta mencioná-los ao utilizar a função, exemplo:
read.csv2("C:/dados.csv",dec=".")
Dicas de como entrar com os dados no R:
1) Pode-se usar "," ou "." como separador decimal, desde que você especifique para o programa qual dos dois você utilizou, através do argumento dec="," ou dec="."
2) O separador de coluna: é onde acontecem os maiores problemas, o que oferece menos conflitos é o ";". Para utilizá-lo é só abrir o arquivo no excel, escolher a opção "Salvar como" -> tipo de arquivo:"csv(separado por vírgulas)" e salvar.
3) Escolher a função que mais combina com a formatação de seus dados, basicamente são 3 variações:
read.table
Por padrão tem os seguintes argumentos:
header=FALSE : os dados não possuem cabeçalho
sep="" : a separação das colunas é o espaço
dec="." : o separador de casa decimal é o ponto
read.csv
Por padrão tem os seguintes argumentos:
header=TRUE : os dados possuem cabeçalho (nome das colunas)
sep="," : a separação das colunas é a vírgula
dec="." : o separador de casa decimal é o ponto
read.csv2
Por padrão tem os seguintes argumentos:
header=TRUE : os dados possuem cabeçalho (nome das colunas)
sep=";" : a separação das colunas é o ponto e vírgula
dec="," : o separador de casa decimal é a vírgula
Para os padrões brasileiros o que mais se adequa é o read.csv2
obs: os parâmetros padrões podem ser alterados em qualquer uma dessas funções basta mencioná-los ao utilizar a função, exemplo:
read.csv2("C:/dados.csv",dec=".")
Última edição por gustavoreis em Ter Jun 28, 2011 9:38 pm, editado 1 vez(es)
modelo lineat geral
Gustavo,
Consegui abrir os dados.
Era um problema na base de dados, tinha um mal digitado.
Agora minha questao é outra.
Fiz a analise pelo Rcmdr e pelo console do R e vi que estava dando diferente o resultado.
investiguei ate que descobri que era porque no Rcmdr a Anova Table é do tipo II e pelo R console eu tava pedindo o tipo I.
Bom, rodei de novo a analise e descobri outra coisa.
Quando eu mudo a ordem dos meus fatores principais, o resultado se altera, porem meus dados tem design ortogonal e isso nao era pra acontecer.
Minha variavel resposta: carga
Fatores principais:
Peso formiga -continuo
Distancia: 3 niveis
Tempo: 5 niveis
Para cada uma das combinacoes tenho o mesmo numero de replicas. isto é, tenho 10 valores para a variavel resposta.
Ja procurei em varios livros e nao consigo descobrir como devo proceder para determinar a ordem dos fatores na analise.
Poderia me ajudar?
Obrigada, Juliane
Consegui abrir os dados.
Era um problema na base de dados, tinha um mal digitado.
Agora minha questao é outra.
Fiz a analise pelo Rcmdr e pelo console do R e vi que estava dando diferente o resultado.
investiguei ate que descobri que era porque no Rcmdr a Anova Table é do tipo II e pelo R console eu tava pedindo o tipo I.
Bom, rodei de novo a analise e descobri outra coisa.
Quando eu mudo a ordem dos meus fatores principais, o resultado se altera, porem meus dados tem design ortogonal e isso nao era pra acontecer.
Minha variavel resposta: carga
Fatores principais:
Peso formiga -continuo
Distancia: 3 niveis
Tempo: 5 niveis
Para cada uma das combinacoes tenho o mesmo numero de replicas. isto é, tenho 10 valores para a variavel resposta.
Ja procurei em varios livros e nao consigo descobrir como devo proceder para determinar a ordem dos fatores na analise.
Poderia me ajudar?
Obrigada, Juliane
juliane- Convidado
Re: abrir dados no R
Juliane,
Assim como você, acho que o resultado deveria ser o mesmo independente da ordem dos fatores.
Em seu planejamento fatorial quais componentes está analisando:
1) Apenas o componentes principais
2) Principais + todas as Interações
3) Principais+ algumas interações
Caso sua resposta seja 3, dependendo de como você está escolhendo as interações, pode ser que a ordem venha a mudar o resultado, mas acredito que não tenha uma ordem mais correta, você pode escolher qualquer uma.
Att
Gustavo
Assim como você, acho que o resultado deveria ser o mesmo independente da ordem dos fatores.
Em seu planejamento fatorial quais componentes está analisando:
1) Apenas o componentes principais
2) Principais + todas as Interações
3) Principais+ algumas interações
Caso sua resposta seja 3, dependendo de como você está escolhendo as interações, pode ser que a ordem venha a mudar o resultado, mas acredito que não tenha uma ordem mais correta, você pode escolher qualquer uma.
Att
Gustavo
ordem dos fatores
Gustavo,
Nossa primeiro quero te dizer que é muito bom poder discutir com alguem. Muito obrigada pela atençao.
Entao, analiso o efeito de todos os fatores principais e todas as interacoes.
A partir dos resultados que vou obtendo, vou simplificando o modelo retirando aquelas interacoes que não são significativas.
Tambem começo a achar que a ordem dos fatores devo escolher aquela que faz mais sentido biologico.
Muito obrigada de novo.
Juliane
Nossa primeiro quero te dizer que é muito bom poder discutir com alguem. Muito obrigada pela atençao.
Entao, analiso o efeito de todos os fatores principais e todas as interacoes.
A partir dos resultados que vou obtendo, vou simplificando o modelo retirando aquelas interacoes que não são significativas.
Tambem começo a achar que a ordem dos fatores devo escolher aquela que faz mais sentido biologico.
Muito obrigada de novo.
Juliane
Juliane- Convidado
Re: abrir dados no R
Isso mesmo Juliane! Sentia muita falta de um fórum para discutir o R. Espero que este cubra este vazio.Nossa primeiro quero te dizer que é muito bom poder discutir com alguem. Muito obrigada pela atençao.
Cristiano Melo- Mensagens : 6
Data de inscrição : 23/04/2011
Dificuldade para importar banco excel
Prezado Gustavo,
estou tentando importar um arquivo excel (formato xls) para o R, mas está dando erro:
mapa<-read.delim2(file.choose())
Mensagens de aviso perdidas:
In read.table(file = file, header = header, sep = sep, quote = quote, :
linha final incompleta encontrada por readTableHeader em 'C:\Users\Gabriel\Documents\Mestrado\R\Mapa Geral_2009_Percentil.xls'
Outras formatos de arquivo (csv e dta) estou conseguindo importar sem problemas.
O que pode estar havendo?
Att,
Gabriel
estou tentando importar um arquivo excel (formato xls) para o R, mas está dando erro:
mapa<-read.delim2(file.choose())
Mensagens de aviso perdidas:
In read.table(file = file, header = header, sep = sep, quote = quote, :
linha final incompleta encontrada por readTableHeader em 'C:\Users\Gabriel\Documents\Mestrado\R\Mapa Geral_2009_Percentil.xls'
Outras formatos de arquivo (csv e dta) estou conseguindo importar sem problemas.
O que pode estar havendo?
Att,
Gabriel
Gabri- Mensagens : 1
Data de inscrição : 24/05/2012
Re: abrir dados no R
Seja Bem Vinda ao fórum Gabri!
Os arquivos .xls sempre são mais complicados, na minha opinião é mais seguro salvá-los como arquivo .csv e então fazer a entrada de dados, dentro de algum outro tópico eu expliquei melhor como fazer isso.
Caso prefira utilizar o .xls mesmo, então a dica que posso dar para esse erro é que você copie os dados (não selecione linhas ou colunas em branco) para um novo arquivo .xls e então fazer a entrada de dados novamente. A minha suspeita é de que esse erro possa ter ocorrido pelo fato de você ter utilizado em algum momento alguma(s) das células em branco e depois tenha apagado, neste caso o R vai reconhecer como valor perdido (NA). É apenas uma suspeita, caso queira enviar o arquivo eu posso analisar melhor.
att,
Gustavo Mello Reis.
Os arquivos .xls sempre são mais complicados, na minha opinião é mais seguro salvá-los como arquivo .csv e então fazer a entrada de dados, dentro de algum outro tópico eu expliquei melhor como fazer isso.
Caso prefira utilizar o .xls mesmo, então a dica que posso dar para esse erro é que você copie os dados (não selecione linhas ou colunas em branco) para um novo arquivo .xls e então fazer a entrada de dados novamente. A minha suspeita é de que esse erro possa ter ocorrido pelo fato de você ter utilizado em algum momento alguma(s) das células em branco e depois tenha apagado, neste caso o R vai reconhecer como valor perdido (NA). É apenas uma suspeita, caso queira enviar o arquivo eu posso analisar melhor.
att,
Gustavo Mello Reis.
O que fazer com os dados faltantes (NA's)
Oi Pessoal!
Sempre trabalhei com bancos completos, mas agora estou com um banco com dados faltantes
Costumo abrir como:
dados<-read.table("D:\\Michele\\Estatística\\Consultoria Estatística\\Rosi\\bancorosi.txt",h=T)
Como faço para icluir o NA no comando acima, para que ele faça todas as demais análises sem problemas?
Aguardo!
Sempre trabalhei com bancos completos, mas agora estou com um banco com dados faltantes
Costumo abrir como:
dados<-read.table("D:\\Michele\\Estatística\\Consultoria Estatística\\Rosi\\bancorosi.txt",h=T)
Como faço para icluir o NA no comando acima, para que ele faça todas as demais análises sem problemas?
Aguardo!
michelemaria- Mensagens : 3
Data de inscrição : 10/07/2012
Re: abrir dados no R
Boa noite Michele!
Normalmente ao se fazer a entrada de dados o R reconhece automaticamente células em branco como NA, caso isto não esteja acontecendo com seus dados certifique-se de que no arquivo original as faltas estejam em branco (não podem estar identificadas com algum simbolo ou letra). Após fazer essa verificação, caso continue não reconhecendo como NA, eu recomendo a você utilizar a entrada de dados com arquivo do tipo .csv (em outros tópicos expliquei como se faz).
Agora com relação às funções rodarem corretamente, em algumas você deve acrescentar no final o seguinte argumento:
função(x, na.rm=T)
att
Gustavo Mello Reis.
Normalmente ao se fazer a entrada de dados o R reconhece automaticamente células em branco como NA, caso isto não esteja acontecendo com seus dados certifique-se de que no arquivo original as faltas estejam em branco (não podem estar identificadas com algum simbolo ou letra). Após fazer essa verificação, caso continue não reconhecendo como NA, eu recomendo a você utilizar a entrada de dados com arquivo do tipo .csv (em outros tópicos expliquei como se faz).
Agora com relação às funções rodarem corretamente, em algumas você deve acrescentar no final o seguinte argumento:
função(x, na.rm=T)
att
Gustavo Mello Reis.
Obrigada
Muito obrigada Gustavo, só agora estou vendo sua resposta.
michelemaria- Mensagens : 3
Data de inscrição : 10/07/2012
Página 1 de 1
Permissões neste sub-fórum
Não podes responder a tópicos
|
|