Featured

Apache Airflow 02 – Conceitos principais

Os principais conceitos do Airflow que serão explicados neste artigo serão: DAGs, operators, sensors e hooks. O que vou explicar será sobre como eles se encaixam no Airflow e como utilizá-los no seu dia a dia, até mesmo vamos construir nossa primeira DAG. Eu vou tentar ensinar a partir dos partes ao invés de destrinchar … Continue reading Apache Airflow 02 – Conceitos principais

Does time has a say? – Exponential Smoothing

Guys, I got sick yesterday and today I was still recovering, so, I'll go slower on the "Time Series Analysis" of today, if you haven't seen the previous post, I highly recommend since it has a custom code attached to it that shows nicely the improvements on result you can reach just by looking at … Continue reading Does time has a say? – Exponential Smoothing

Series Temporais – Pesquisa

Como eu disse no post anterior, vou explorar o processo de pesquisa dos links que pesquisei. Um dos artigos já fornece um conjunto de dados, que vou usar para aprender as coisas dos outros links também. O que é um Time Series? Através da minha pesquisa, esta questão surgiu, minha primeira ideia foi: "qualquer informação … Continue reading Series Temporais – Pesquisa

I do care about my City Hall’s Data.

I am a Computer Science undergraduate student from Recife, Pernambuco, Brazil. And Recife is a tech hub . I can’t tell my whole story in tech here but just to sum up: Studied in a technichal school of Game Development (which also had lectures on Design and Game Design). Passed the entrance exam for University (ENEM) … Continue reading I do care about my City Hall’s Data.

SAMU em 2015 — Uma análise Parte I

Peço perdão se você achar meus vícios de escrita neste texto, ele é um pouco informal. A primeira parte deste post se refere ao objetivo deste projeto que estou escrevendo o código e rodando desde Janeiro. Eu estou tentando melhorar minha formulação de perguntas. Não desoluções. Ainda não sou bom nem na primeira quanto mais … Continue reading SAMU em 2015 — Uma análise Parte I

Drop #3 – Tweepy e Pandas: Primeiras Impressões

Esta semana eu tentei construir um post interessante para amanhã( 04 de setembro), talvez, quem saiba, eu consiga. E os culpados desta semana, ou seja, me deram um trabalho enorme para aprender e ler sua documentação, esses são : Pandas e Tweepy. Pandas é um dos melhores packages para manipulação de dados para Python, standard … Continue reading Drop #3 – Tweepy e Pandas: Primeiras Impressões

DS – Day #1: Será que Python presta mesmo?

Então…por enquanto, eu não posso me introduzir como um cientista de dados, consegui apenas 68% de AUC(área sob a curva ROC) em um problema de predição sobre internação de diabéticos mas estou tentando me tornar um!, para aumentar meus horizontes em programação e em análise de dados, resolvi estudar Python. Primeiro, procurei por bons recursos, … Continue reading DS – Day #1: Será que Python presta mesmo?