O que é Kafka e porque ele endoida quem gosta de Big Data?

Quem é curioso por Big Data e gerenciamento de dados em geral sempre procura estar por dentro de soluções novas nesse mundo como CosmosDB , ElasticSearch, entre outros. Neste post o foco é em uma dessas novas soluções, o Kafka.

Kafka – O que é?

O kafka é uma plataforma streaming distríbuida. E o que isso quer dizer? Basicamente, é uma plataforma streaming que pode crescer e diminuir de acordo com a demanda.

Pra que serve?

Uma plataforma streaming é algo que pela definição da documentação deve ser capaz de basicamente três coisas:

  1. Permite você publicar e inscrever à um stream de records.
  2. Permite guardar os seus dados “in a fault-tolerant way”, ou seja, sem erros. (ou, caso o erro aconteça, a informação não se perca).
  3. Permite você processar uma stream de dados em tempo real.

 

E porque Kafka é tão bom?  Por que ele é simples. Kafka não é um framework gigante e (ainda não é) cheio de comandos, e sim um forma simples e fácil de usar (apesar de possuir alguns conceitos bem complexos de entender em alguns casos).

Pela minha experiência com o Kafka, dá pra aprender sobre e utilizá-lo de forma básica em 1 semana. Claro que você vai cometer uns erros conceituais e provavelmente criar mais dados do que precisa xD’, contudo vai ser uma experiência massa em uma ferramenta que já está na Apache como um projeto de alto nível.

Espero que vocês tenham gostado! Se você tem uma experiência com o Kafka, compartilha aqui o/!

 

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s