Series Temporais – Pesquisa

Como eu disse no post anterior, vou explorar o processo de pesquisa dos links que pesquisei. Um dos artigos já fornece um conjunto de dados, que vou usar para aprender as coisas dos outros links também.

O que é um Time Series?

Através da minha pesquisa, esta questão surgiu, minha primeira ideia foi: “qualquer informação que tenha um timestamp anexado aos pontos de dados”. Mas o mais descritivo que eu poderia encontrar foi:

“Time Series é uma seqüência de pontos de dados bem definidos medidos em intervalos de tempo consistentes ao longo de um período de tempo”. source.

Dados

Os dados usados ​​nesta publicação serão o conjunto de dados “Daily Female Birth”. Basicamente é feito das tuplas (data, número de fêmeas nascidas).

Exemplo:

02/08/1995, 34

03/08/1995, 45

Código

Acabei de seguir os tutoriais e mergulhar no código, principalmente para ver o que é possível fazer, utilizei o jupyter notebook e o que eu pensei que precisava ser explicado, eu fiz (se você tiver alguma sugestão de melhoria, por favor, avise-me nos comentários, seria muito massa).

Minha configuração é apenas o Python (como os links fornecidos são) e uso o anaconda como gerenciador de pacote / ambiente. A primeira coisa que faço é fazer o download e importar os pacotes que vou usar e ler os dados em uma Series, conforme indicado no artigo:

loading_data

Depois disso, uma das funções mais úteis em Pandas Dataframes, Series, etc: describe(), como apontado na documentação:

describe_function

 

“Gera estatística descritiva que resume a tendência central, a dispersão e a forma da distribuição de um conjunto de dados, excluindo os valores de NaN”. Para aqueles que não sabem quais são os valores da NaN, eles são a representação mais simples dos dados missing (não preenchidos). Este é um assunto completamente diferente na análise de dados que eu não quero tocar ainda.

Por último como visualizar os dados da série temporal, uma simples função de “plot()” pode ajudar com isso, descobri agora que minha pesquisa era muito superficial, uma vez que os 3 artigos não aumentam/modificam muito entre si, Espero que amanhã traga novos artigos para a pesquisa e também explore novas maneiras de analisar as séries temporais.

Plotando de 1º de janeiro à 1º de abril:

plotting_timeseries

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s