Logo
    Search

    Dw vs. Data Lake vs. MDW vs. Data Lakehouse para Pipeline de Dados

    pt-brMarch 12, 2021

    About this Episode

    Uma das dúvidas mais comuns em ambientes de big data e construção de data pipelines é de fato entender as diferenças entre os diversos tipos de storages que podemos nos conectar para processar os dados.

    Nesse episódio, atacamos todos os tipos que o mercado oferece mostrando seus lados positivos e negativos para que você que está construindo entenda da melhor forma como cada um desses storages se comportam.

    Falamos também da importância do mindset tanto do profissional como da empresa em não somente armazenar mas como processar dados de forma eficiente, madura e rápida.

    Entenda a evolução do mercado de Big Data e Analytics e entenda os mais novos termos e tecnologias utilizadas para construção de pipeline de dados.

    Luan Moreno =
    https://www.linkedin.com/in/luanmoreno/


    Recent Episodes from Engenharia de Dados [Cast]

    Data Analytics com o Time de Dados da Clicksign

    Data Analytics com o Time de Dados da Clicksign

    No episódio de hoje, Leonardo Souza & Mateus Oliveira entrevistam Filipe Mubarac (Analista de dados), Acácio Komesu (Analista de BI), Levi de Carvalho (Analista de Dados) e Franklin Ferreira (Arquiteto de Dados),  integrantes do time de dados e analytics da Clicksign.


    Data Analytics  sempre foi um das principais áreas dentro de uma empresa. Nos últimos anos, com certeza, passou de uma área de apoio a tomada de decisão a uma área core da empresa, pois o mundo hoje é data-driven, e tornou-se uma questão competitiva produzir e ler dados em grande escala, além de analisá-los para decisões usando Machine Learning, NLP e Generativa.


    Neste bate-papo iremos falar sobre:

    • Data Analytics;
    • Analytics e Business.


    Este podcast tem como principal objetivo mostrar como as empresas constroem suas áreas de dados e analytics no dia a dia, como se tornar um profissional atrativo para empresas data-driven como a  Clicksign, e como alinhar tudo com o business da empresa.

    Linkedin do time Clicksign
    Franklin Ferreira (Arquiteto de dados): https://www.linkedin.com/in/franklinfs390/
    Filipe Mubarac (Analista de Dados): https://www.linkedin.com/in/filipemubarac/
    Acácio Komesu (Analista de BI): https://www.linkedin.com/in/ac%C3%A1cio-komesu-14b244b5/
    Levi de Carvalho (Analista de Dados) :https://www.linkedin.com/in/levidecarvalho/

    Luan Moreno =
    https://www.linkedin.com/in/luanmoreno/


    Desafios na Construção de uma Plataforma de Dados no Kubernetes com o Time do Orion

    Desafios na Construção de uma Plataforma de Dados no Kubernetes com o Time do Orion


    No episódio de hoje, Luan Moreno & Mateus Oliveira entrevistam o time do Orion da One Way Solution.

    Plataforma de Dados no Kubernetes é um dos tópicos mais pedidos para falarmos aqui no Podcast, principalmente para quem tem a necessidade de uma plataforma agnóstica a cloud e de baixo custo.

    Neste bate papo iremos falar sobre:

    • Nas trincheiras da consultoria;
    • Aprendendo Kubernetes;
    • Plataforma de Dados no Kubernetes.

    Esse podcast tem como principal objetivo mostrar os desafios de criar uma plataforma customizada usando open-source.

    LinkedIn do time Orion
    Site da One Way Solution
    Strimzi
    MinIO
    Airflow 



    Luan Moreno =
    https://www.linkedin.com/in/luanmoreno/


    Gestão & Produtos de Dados com o Time de Dados da Clicksign

    Gestão & Produtos de Dados com o Time de Dados da Clicksign

    No episódio de hoje, Luan Moreno & Mateus Oliveira entrevistaram
    Thiago Rocha (Scrum Master), Marco Coimbra (Data Product Manager),
    José Ivamotto (Head de Dados) e Franklin Ferreira (Arquiteto de Dados), integrantes do time de dados da Clicksign.

    Gestão & Dados com Produto são tópicos extremamente relevantes nos dias de hoje.
    Falar sobre dados sem se preocupar com a gestão, pode trazer impactos negativos às entregas envolvendo dados nas organizações.
    Além disso, entender como as empresas vem produzindo dados é um excelente benchmarking para inovações.
    Neste bate papo iremos falar sobre:

    • Dados como Produto;
    • Times de dados;
    • Gestão de Dados.

    O principal objetivo deste episódio é mostrar como as empresas estão tratando esses tópicos no cotidiano.
    Não apenas no nível técnico e gerencial, mas também com a visão de todos os envolvidos, Scrum Master e DPM (Data Product Manager).

    Linkedin do time Clicksign
    Thiago Rocha (Scrum Master): https://www.linkedin.com/in/thiago-rocha98/
    Marco Coimbra (Data Product Manager): https://www.linkedin.com/in/marcoantoniocoimbrafilho/
    Jose Ivamotto (Head de dados): https://www.linkedin.com/in/jose-ivamotto/
    Franklin Ferreira (Arquiteto de dados): https://www.linkedin.com/in/franklinfs390/



    Luan Moreno =
    https://www.linkedin.com/in/luanmoreno/


    Challenge in Bulding an Open-Source Community with Aaron Williams

    Challenge in Bulding an Open-Source Community with Aaron Williams

    No episódio de hoje, Luan Moreno e Mateus Oliveira entrevistaram Aron Willians, atualmente como Community Manager/ Developer Advocate na Ampare.

    Aaron é apaixonado por trazer novas tecnologias para desenvolvedores atuais e para a próxima geração, por meio de hacking e treinamento prático. Neste podcast, você vai aprender sobre:

    •  Desafios na construção da comunidade de código aberto;
    •  Visão gerencial de comunidades de dados;
    • Empresas que estão investindo no impulsionamento do Pulsar.

    Falamos também nesse bate-papo sobre os seguintes temas:

    • Tecnologia como Kuberbetes;
    •  Apache Pulsar.

    Aprenda mais sobre as comunidades de dados e sobre as principais tecnologias do Mercado.

    Ararob Willians= https://www.linkedin.com/in/aaron-don-williams/

    Luan Moreno =
    https://www.linkedin.com/in/luanmoreno/


    O Desafio da Engenharia de Dados no iFood com o Diretor de ML e Engenharia, Ivan Lima

    O Desafio da Engenharia de Dados no iFood com o Diretor de ML e Engenharia, Ivan Lima


    No episódio de hoje, Luan Moreno e Mateus Oliveira entrevistam Ivan Lima, atualmente Director of Machine Learning & Data Engineering no Ifood.

    Ifood é uma das maiores empresas do Brasil e, claro, leva o assunto sobre dados muito a serio. Imagine receber diversos dados do aplicativo, além de possuir várias sessões analíticas e dados em alto volume.
    Neste podcast, conversamos sobre:

    • Desafios na área de dados de grandes corporações;
    • Visão gerencial.

    Falamos também sobre os seguintes temas:

    • Mercado de trabalho no Brasil em 2022;
    • Tecnologias usadas dentro do Ifood;
    • Softskills;
    • Gestão de times de dados.

    Aprenda mais sobre como as empresas estão lidando com o desafio de dados internamente, principalmente de grande porte como Ifood.
    Ivan Lima = Linkedin

    Luan Moreno =
    https://www.linkedin.com/in/luanmoreno/


    The Data Lakehouse Paradigm with Bill Inmon - The Father of Data Warehouse

    The Data Lakehouse Paradigm with Bill Inmon - The Father of Data Warehouse

    No episódio de hoje, Luan Moreno, Mateus Oliveira e Orlando Marley entrevistam Bill Inmon, criador do conceito de Data Warehouse e escritor de diversos livros com temáticas voltadas para dados.

    Data Warehouse é o conceito de centralização de dados analíticos das organizações, de forma estruturar um visão 360° do business. Neste episódio, você irá aprender:

    •  Diferenças entre OLTP e OLAP;
    • Histórico dos dados para tomada de decisão;
    • Criar um processo resiliente para entender os fatos dos dados.Falamos também,
       
      neste bate-papo, sobre os seguintes temas:
    •  História do Bill Inmon;
    • Pilares de sistemas analíticos;
    • Nova geração de plataforma de dados analíticos;

      Aprenda mais sobre análise de dados, como utilizar tecnologias para tornar o seu ambiente analítico confiável e resiliente com as palavras do pai do Data Warehouse.

     Bill Inmon = Linkedin

    Luan Moreno =
    https://www.linkedin.com/in/luanmoreno/


    Querying Data with Trino from Earth to Space - Talk with Brian Olsen, a Developer Advocate at Starburst

    Querying Data with Trino from Earth to Space - Talk with Brian Olsen, a Developer Advocate at Starburst

    No episódio de hoje, Luan Moreno e Mateus Oliveira entrevistam Brian Olsen, atualmente Head of Developer Relations na Tabular.

    Trino é um produto open-source, para virtualizar os dados através de queries. Imagine uma engine de SQL capaz de consultar dados do Apache Kafka, Cloud Storage, Databases e diversas outras fontes de forma simples e extremamente eficaz.
    Com Trino, você tem os seguintes benefícios:

    • Diversos conectores para múltiplas fontes de dados
    • Gerar queries analytics de forma simples e eficaz
    • Trabalhar com modelos de Lakehouse como Iceberg e Delta

    Falamos também neste bate-papo sobre os seguintes temas:

    • História do Trino
    • Capacidades do Trino
    • Recursos avançados
    •  Novas features
    • Adaptive Query Execution
    • Casos de Uso

    Aprenda mais sobre Trino, e como utilizar esta tecnologia para explorar os dados em diversas fontes diferentes, junto com um dos principais vozes da comunidade.

    Brian Olsen

    Luan Moreno =
    https://www.linkedin.com/in/luanmoreno/


    A Day in a Life of a Founding Engineer at StarTree: Apache Pinot with Neha Pawar

    A Day in a Life of a Founding Engineer at StarTree: Apache Pinot with Neha Pawar

    No episódio de hoje, Luan Moreno e Mateus Oliveira entrevistam Neha Pawar, atualmente Founder Engineer na StarTree.

    Apache Pinot é um banco de dados OLAP de baixa latência, que foi desenvolvido para queries analíticas dentro do Linkedin.
    O objetivo é resolver um dos problemas que tecnologias como o Apache Kafka não resolvem, consultar bilhões de eventos com performance e baixa latêcia .

     Com  Apache Pinot, você tem os seguintes benefícios:

    •  Alto desempenho de consultas analíticas;
    •   Dados que residem no Apache Pinot são comprimidos;
    •  Habilita milhares de acessos concorrentes aos dados residentes no Apache Pinot.

    Falamos também sobre os temas:

    •  Criação do Apache Pinot;
    •  User Facing Analytics;
    • Tipos de Deployment no Apache Pinot;
    •   O que vem por aí no Apache Pinot.

    Aprenda mais sobre Apache Pinot, uma tecnologia capaz de armazenar dados em tempo real, e executar queries com baixa latência, chegando até milissegundos.

    Neha Pawar = Linkedin

    https://pinot.apache.org/



    Luan Moreno =
    https://www.linkedin.com/in/luanmoreno/


    Simplificando Projetos de Analytics utilizando dbt e Modern Data Stack com Matheus Willian, Head of Data Engineering na One Way Solution

    Simplificando Projetos de Analytics utilizando dbt e Modern Data Stack com Matheus Willian, Head of Data Engineering na One Way Solution

    No episódio de hoje, Luan Moreno e Mateus Oliveira conversam com Matheus Willian, atualmente Head de Engenharia de Dados na One Way Solution.

    dbt é uma das tecnologias mais faladas e utilizadas fora do país, possibilitando aos times de todos os portes trabalhar com o conceito de Modern Data Stack, tornando o desenvolvimento de transformações dos dados de forma simples e com SQL.

    Com dbt, você tem os seguintes benefícios:

    • Desenvolvimento de pipeline de dados usando SQL;
    • Reutilização dos códigos usando estruturas de git;
    • Simplificação da Stack de dados;
    • Processamento em Modern Data Warehouses dentro outros adapters.

    Falamos também nesse bate-papo sobre os seguintes temas:

    • Dados como pilar central;
    • Dbt;
    • Times de BI Moderno.

    Aprenda mais sobre dbt, como utilizar uma tecnologia para Modern Data Stack, junto com o time da One Way Solution, que mais impulsiona a comunidade, tanto com conteúdo, como com treinamentos e eventos para ajudar os profissionais de dados brasileiros em vagas de trabalho dentro e fora do país.

    Matheus Willian = https://www.linkedin.com/in/matheuswillian/
    https://www.getdbt.com/

    Luan Moreno =
    https://www.linkedin.com/in/luanmoreno/


    Conferência Kafka Summit 2023 London

    Conferência Kafka Summit 2023 London

    No episódio de hoje, Luan Moreno e Mateus Oliveira conversam sobre a participação no Kafka Summit London 2023.
    Kafka Summit é uma das maiores conferências de tecnologia do mundo, onde empresas de tecnologias de streaming anunciam novidades e podemos entender mais sobre como as elas estão usando estas tecnologias no dia a dia.

    Na conferência tivemos 3 momentos:

    • Keynote - (Anúncios);
    • Vendor Hall - (Onde os patrocinadores ficam);
    •  Sessions - (Salas que os palestrantes fazem suas apresentações).

      Falamos também nesse bate-papo sobre os seguintes temas:

    •  Anúncios Open-Source;
    • Anúncios Confluent;
    • Overview das sessões;
    • Hall dos patrocinadores;
    • Impressões principais da Conferência.

      Aprenda mais sobre tecnologias como Apache Kafka, Apache Flink dentre outras de Streaming. Além disso, vamos entender como as empresas como financeiras europeias, Apple, Uber, Netflix, entre outras, estão usando o Apache Kafka para resolver problemas de negócio.

      Kafka Summit 2023 London
      https://www.confluent.io/events/kafka-summit-london-2023/


    Luan Moreno =
    https://www.linkedin.com/in/luanmoreno/