Series Temporais – Pesquisa

Como eu disse no post anterior, vou explorar o processo de pesquisa dos links que pesquisei. Um dos artigos já fornece um conjunto de dados, que vou usar para aprender as coisas dos outros links também.

O que é um Time Series?

Através da minha pesquisa, esta questão surgiu, minha primeira ideia foi: “qualquer informação que tenha um timestamp anexado aos pontos de dados”. Mas o mais descritivo que eu poderia encontrar foi:

“Time Series é uma seqüência de pontos de dados bem definidos medidos em intervalos de tempo consistentes ao longo de um período de tempo”. source.

Dados

Os dados usados ​​nesta publicação serão o conjunto de dados “Daily Female Birth”. Basicamente é feito das tuplas (data, número de fêmeas nascidas).

Exemplo:

02/08/1995, 34

03/08/1995, 45

Código

Acabei de seguir os tutoriais e mergulhar no código, principalmente para ver o que é possível fazer, utilizei o jupyter notebook e o que eu pensei que precisava ser explicado, eu fiz (se você tiver alguma sugestão de melhoria, por favor, avise-me nos comentários, seria muito massa).

Minha configuração é apenas o Python (como os links fornecidos são) e uso o anaconda como gerenciador de pacote / ambiente. A primeira coisa que faço é fazer o download e importar os pacotes que vou usar e ler os dados em uma Series, conforme indicado no artigo:

loading_data

Depois disso, uma das funções mais úteis em Pandas Dataframes, Series, etc: describe(), como apontado na documentação:

describe_function

 

“Gera estatística descritiva que resume a tendência central, a dispersão e a forma da distribuição de um conjunto de dados, excluindo os valores de NaN”. Para aqueles que não sabem quais são os valores da NaN, eles são a representação mais simples dos dados missing (não preenchidos). Este é um assunto completamente diferente na análise de dados que eu não quero tocar ainda.

Por último como visualizar os dados da série temporal, uma simples função de “plot()” pode ajudar com isso, descobri agora que minha pesquisa era muito superficial, uma vez que os 3 artigos não aumentam/modificam muito entre si, Espero que amanhã traga novos artigos para a pesquisa e também explore novas maneiras de analisar as séries temporais.

Plotando de 1º de janeiro à 1º de abril:

plotting_timeseries

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s