Então pessoal, neste semestre eu irei pagar uma cadeira chamada Estatística , e ela tem uma linguagem, muito utilizada dentro de alguns processos da mineração , chamada R.
Eu vou tentar mostrar à vocês alguns pequenos gráficos que construirei na aula de estatística e em casa, aplicando alguns conceitos, espero que curtam e me ajudem nessa. Para começar à aprender , resolvi utilizar alguns datasets online e ler o livro “Using R for Statistics”.
O dataset utilizado foi o RcmdrTestDrive , baixado em: http://cran.r-project.org/web/packages/RcmdrPlugin.IPSUR/ , o processo é bem simples. Tentarei fazer algumas medidas estatística simples e necessárias que(quase) sempre fazem parte do processamento de dados.
A função summary() nos dá uma boa ideia dos dados que o nosso data.frame possui, dependendo do como o R interpretou os dados que recebeu , o que é história para outro post. Ao chamar summary(RcmdrTestDrive) isto é o que recebo como visualização:
É fácil de perceber que além de distinguir variáveis categóricas das númericas, ele consegue trazer valores simples como mínimos, máximos, classes(um conceito de R para diferenciar as categorias), enfim, um “summary” do dataset que eu tenho.
Essa e algumas outras funções estatísticas simples estão espalhadas por todo o R, vou mostrar mais algumas nos próximos episódios, espero que vocês tenham curtido um pouco do que R pode fazer, no próximo post trarei novos scripts, após pesquisar na amazon achei os livros mais bem citados e aqui vai uma lista pra quem se interessar:
“SELECT link FROM Books ORDER BY Rating DESC”:
Abraços!