Trilha BigData e NoSQL In God, we trust. All others, must bring Data: Ter a capacidade de armazenar e processar quantidades imensas de dados traz conhecimentos imensuráveis!

NoSQL e Big Data vivem um em função do outro. A ascensão contínua de novas tecnologias, incentivam o armazenamento de maiores volumes de dados. Que por sua vez, trazem novos e novos desafios.

Todo o processo de conscientização e tomada de decisão com base em dados, depende da estruturação da base: como meus dados chegam? Como são armazenados? Como catalogo e facilito a descoberta deles pelos profissionais da minha organização?

De Data Lakes a Bancos colunares. De tratamento da informação à análises de dados massivos. É o que você vai encontrar na trilha Big Data & NoSQL!

Coordenação

Joice Ferreira Rodrigues Souza

Allan Sene Oliveira

Leandro Domingues

Patrocínio Trilha

TODAS AS TRILHAS

Programação / Palestras TODAS AS TRILHAS

Importante: A grade de palestras está sujeita a alterações sem prévio aviso.

	Conteúdo
08:00 às 09:00	Credenciamento e recepção dos participantes Todas as pessoas inscritas, palestrantes, coordenadores e de imprensa, devem retirar seus crachás e kit do congressista nos balcões de credenciamento localizados na entrada do evento, para obterem acesso às salas e Auditório Principal.
09:00 às 10:00	Abertura do evento no Auditório Principal Após o credenciamento, convidamos os participantes a comparecerem ao auditório para receberem as boas vindas por parte dos realizadores e patrocinadores. Neste keynote de abertura, todos serão orientados sobre o funcionamento do evento, destaques e outras novidades.
10:10 às 11:00	Streaming de dados com Kinesis e MSK (Kafka) Elton Corrêa de Almeida Um comparativo entre essas duas ferramentas que permitem trabalhar um grande volume de dados que são produzidos continuamente, e como isso nos ajudou na Hotmart. Buscas poderosas em BILHÕES de documentos? Seu sistema pode prover isso de forma escalável e resiliente com o Elasticsearch Matheus de Faria Moraes SLIDES Atualmente o Elasticsearch é a principal engine de buscas do mercado. Com ele, o GitHub, por exemplo, fornece poderosas buscas em 8 milhões de repositórios e 2 bilhões de documentos. Além de performáticas buscas textuais e complexas, o Elasticsearch também provê escalabilidade horizontal, resiliência e alta disponibilidade. Na palestra serão abordados todos esses conceitos, as melhores práticas e algumas demonstrações.
11:10 às 12:00	Dataflow poliglota com Apache Nifi Adriano Bonacin SLIDES Vamos conversar um pouco sobre o Apache NiFi, componente do novo Cloudera Dataflow. Ele tem uma incrível capacidade de integrar diversas fontes e destino de dados. Seja um banco relacional, um NoSQL, um HDFS, Azure BlobStore, AWS S3, um Kafka, um CSV ou um WebService: o NiFi possui centenas opções. Como garantimos qualidade de dados de Tracking na OLX sem perder agilidade Maria Beatriz Ribeiro Vaz / Tiago Montalvão SLIDES Dados de Tracking descrevem o comportamento dos usuários nas diferentes plataformas. Na OLX, esses dados são a base dos mais importantes KPIs da cia e por isso garantir a qualidade dos mesmos é fundamental. Vamos abordar como garantimos a qualidade de mais de 1M de eventos por minuto, sem perder a agilidade e autonomia que os squads possuem de rastrear seus próprios eventos de maneira independente
12:10 às 13:00	De SQL em produção para um data-lake 90.8% serverless em menos de 1 ano Jones Madruga / Alexsandro Santos Uma demonstração de como o Stoodi, uma startup de cursos online, saiu de SQLs nos bancos de produção rodados pelo CTO para um Data Lake 100% automatizado e 90.8% serverless na AWS em menos de um ano. Reduzindo custos, aumentando a segurança e governança dos dados com o uso de um stack simples: S3, Step Functions, Segment, AWS Glue, Redshift e Metabase. Hortonworks HDP - Como começar com o pé direito Raul Oliveira Você já provavelmente já ouviu falar de Big Data. Você já deve ter conversado sobre Big Data. Você já deve ter visto centenas de soluções para Big Data. Você já deve ter visto dezenas de fornecedores de soluções para Big Data. mas você já instalou um cluster de Big Data no seu ambiente? E que tal colocar ele no ambiente de produção? Quer começar sem problemas com licença e começar sem ter problemas no seu ambiente? Essa palestra é para você.
13:10 às 14:00	Intervalo para Almoço Uma excelente oportunidade de todas as pessoas no evento interagirem e trocarem ideias, colaboradores, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores.
14:10 às 15:00	ETL em Real Time com Apache Kafka no Azure Luan Moreno M. Maciel Nessa sessão será ensinado os componentes principais para o entendimento e desenvolvimento de pipelines em real-time não somente em nuvem mas em on-premises também. Se você deseja saber como extrair dados de fontes heterogeneas em real-time, aplicar transformações e regras essa sessão é para você. Entenda porque o Apache Kafka hoje está presente em mais de 30% da Fortune 500.
15:10 às 16:00	Big Data na Nuvem com o Azure Databricks Thiago Zavaschi Azure Databricks é uma plataforma analítica baseada no Apache Spark otimizada para a plataforma de nuvem da Microsoft. Venha conhecer nessa palestra como configurar (um clique) e usar nos cenários mais comuns (engenharia de dados, streaming, machine learning). Do bit ao EBITDA, a jornada da engenharia de dados até o impacto no business Matheus Espanhol / Marcel Souza A estratégia de dados vem revolucionando empresas ao longo dos últimos anos e passou de "diferencial competitivo" à "necessidade" com o surgimento de tecnologias que dão vida a grandes volumes de dados anteriormente ignorados. Nessa palestra iremos compartilhar as lições aprendidas na implantação de novas tecnologias e mudanças culturais lideradas por times de dados e business analytics dentro da Wavy. Abordaremos as principais características de tecnologias como PostgreSQL, Elasticsearch, Kafka, Bigquery, Dremio, PowerBI e Google Data Studio para enfrentar desafios de escalabilidade, disponibilidade, consistência, democratização de dados e análise de indicadores de negócio.
16:00 às 16:30	Coffee-break e Networking Durante o intervalo de coffee-break, serão entregues kits contendo suco e biscoitos. Um delicioso intervalo para relaxar, conhecer novas pessoas e estreitar contatos. Neste tempo, também surge a oportunidade de todas as pessoas no evento interagirem entre sí, participantes das trilhas, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores.
16:40 às 17:30	DataOps: Estendendo as práticas de DevOps para BigData Eduardo Hahn SLIDES Cada vez mais participamos de projetos de Big Data onde a complexidade e a diversidade de dados são cada vez maiores. Ter segurança em todas as etapas do projeto até colocar e manter em produção são grandes desafios. Assim, as práticas de DataOps, soma de boas práticas de Agile e DevOps, auxiliam a melhor gerenciar, publicar e sustentar seu Big Data. Nesta palestra vamos conhecer o passo a passo para você implementar DataOps em seus projetos. Elasticsearch: O poder das buscas full-text Thiago Barradas SLIDES Cada milissegundo faz diferença ao realizarmos as mais variadas consultas, principalmente quando falamos de busca full-text, e é nessa etapa que o Elasticsearch com seu alto desempenho e velocidade de resposta se destaca. O palestra apresenta, além de muitos conceitos, seu uso na prática de Elasticsearch para o uso com qualquer tecnologia.
17:40 às 18:30	Criando um pipeline de dados usando Spark no Google Cloud Plataform Evandro Caldeira SLIDES Um pipeline de dados é um canal para o transporte e processamento de um fluxo de dados. O pipeline pode conter vários blocos de processamento e cada um desses tem o nome de estágio. Cada estágio executa uma tarefa simples e passa o seu resultado ao próximo estágio e a combinação dessas diversas pequenas tarefas permite a construção de transformações complexas em grandes volumes de dados. Nesta apresentação iremos mostrar como criar um pipeline de dados usando Spark e como submetê-lo para execução na nuvem do google. Starburst Presto on Azure - Querying for Big Data Environments Arthur Luz Nesta sessão será possível aprender sobre o Starburst Presto. Ele é uma ferramenta de Bid Data Query Engine. Aqui você aprenderá não somente como instalá-lo em ambiente de Azure como também como usá-lo para executar consultas em seu ambiente híbrido de dados e/ou Data Lake.
18:40 às 19:00	Encerramento e Sorteios No horário de encerramento, todas as trilhas serão direcionadas de suas salas para o Auditório Principal, mesmo local da abertura. Após a apresentação de resultados do dia, muitos sorteios fecharão o dia.

Data e Local

Sexta-feira, 14 de Junho de 2019

10 às 19 h

UniBH - Campus Buritis

Av. Prof. Mário Werneck, 1685 - Estoril
Estoril | Belo Horizonte - MG

Informações sobre Data e Local

Público Alvo

Engenheiros de Dados, Administradores de Bancos de Dados, Analistas de Dados, Desenvolvedores e Arquitetos de plataformas de alto-desempenho, Analistas DevOps e SRE e entusiastas da área de Dados e Infraestrutura.

Investimento

presencial:R$ 290,00

Fazendo sua inscrição presencial, você terá acesso a esta trilha e no mesmo dia também:
TDC Expo: Venha conversar com pessoas e conhecer empresas incríveis.
Lounge +Diversidade e Carreiras: Você poderá assistir às palestras que acontecem nesta área no mesmo dia.
Trilha Stadium: Você poderá assistir às palestras da trilha Stadium do mesmo dia.