Clique no banner para conhecer e adquirir o meu treinamento de Bancos de Dados no Azure

[Evento Presencial] – Microsoft Reactor São Paulo – Como compartilhar relatórios de bilhões de linhas com milhares de pessoas e baixo custo

Post Views 6 views
Reading time 4 minutes

Hoje pude fazer mais uma palestra no Reactor, com o tema “Como compartilhar relatórios de bilhões de linhas com milhares de pessoas e baixo custo”, um tema muito útil e relevante para a maioria dos profissionais e empresas.

O evento foi um sucesso total e lotou de gente. Muito obrigado pelo convite Larissa Cyganski, Hugo Venturini, Gustavo Leo, Sidney Cirqueira e Victor Temple.

Palestrantes que fizeram a diferença no evento:

  • Rafael Mendonça
  • Fabio Santos
  • Sidney Cirqueira
  • Jones Santos
  • Juliana Maria Lopes

Também esteve presente a Team Leader de Analytics da Power Tuning, Nayara Hellen e os feras do time de suporte do Power Embedded Edilson Santos Sthéfane Lisboa João Paulo Macedo Paulo Eduardo e também meus grandes amigos Samyr Moises, Orlando Gomes, Andre Jaar e Guilherme Louzada.

Fiquei muito feliz em poder contribuir um pouco com as mais de 140 pessoas presentes, aumentar meu networking com pessoas super qualificadas e participar de mais um evento do Microsoft Reactor, que sempre são excelentes.

A Apresentação

Vídeo da minha apresentação:

 

Slides da Apresentação:

Galeria de fotos do evento:

This slideshow requires JavaScript.

Como compartilhar relatórios de bilhões de linhas com milhares de pessoas e baixo custo

O tema é uma dor latente em quase toda grande empresa: como compartilhar relatórios que batem na casa dos bilhões de linhas, para milhares de usuários, sem que a conta do Azure chegue custando o preço de uma Ferrari.

Se você acha que a única saída é sair comprando licença Pro para todo mundo ou subir o nível do Fabric até o limite, essa palestra é para você.

Durante a palestra, fiz um overview dos tipos de licenciamento do Power BI e mostrei onde o SQL Server Analysis Services (SSAS) pode ajudar a reduzir drasticamente o consumo da sua capacidade Fabric/Power BI Embedded.

O Cenário: O Mito do Bilhão de Linhas

Antes de falarmos de preço, precisamos falar de arquitetura. Quando um usuário pede um relatório de 1 bilhão de linhas, a primeira pergunta deve ser: Por quê?

Ninguém analisa 1 bilhão de linhas individualmente no Power BI. Se o usuário quer filtrar uma nota fiscal específica no meio de um oceano de dados, talvez o Power BI não seja a ferramenta; talvez ele precise de uma aplicação. No BI, trabalhamos com agregação. Porém, se o cenário realmente exige essa volumetria para análise de tendências históricas, a estratégia de licenciamento e o motor de processamento passam a ser críticos para a viabilidade financeira do projeto.

Licenciamento: Pro, PPU, Premium ou Fabric?

O ecossistema mudou. O Power BI Premium por Capacidade (SKUs P) foi descontinuado para novos contratos, dando lugar ao Microsoft Fabric. Mas a base continua a mesma: ou você paga por usuário, ou paga por capacidade.

Tipo de Licença Modelo de Custo Ideal para…
Power BI Pro Por Usuário ($) Pequenos times e self-service BI básico.
Power BI PPU Por Usuário ($$) Recursos Premium (Deployment Pipelines, Datasets > 1GB) para poucos usuários.
Fabric (F SKUs) Capacidade (Reserva/Horista) Empresas que precisam de escala, OneLake e Engenharia de Dados unificada.
Power BI Embedded (A SKUs) Capacidade (Horista) SaaS e portais internos onde o custo por usuário Pro é inviável.
Observação Importante: O Fabric no Brasil chega a ser 60% mais caro do que nos Estados Unidos devido à carga tributária e infraestrutura local. Se a latência não for o fator número 1 (e para Power BI, raramente é), considere criar sua capacidade em regiões como East US para economizar drasticamente.

SQL Server Analysis Services (SSAS) + Live Connection

Aqui está o segredo para lidar com bilhões de linhas e custo baixo.

O Power BI, por padrão, utiliza o modo Import, onde os dados são carregados para a memória da capacidade (F SKUs ou A SKUs). Se o seu dataset tem 50GB, você vai precisar de uma capacidade cara para aguentar processar esse modelo de dados.

No entanto, o Power BI é “filho” do Analysis Services. Quando utilizamos o modo Live Connection apontando para um servidor de SSAS (seja On-premises ou uma VM), o processamento do DAX e a gestão da memória não acontecem no Power BI, mas sim no servidor do Analysis Services.

Impacto na Capacidade: Em meus testes, um relatório com 400 milhões de linhas no modo Import consumia quase 100% de uma capacidade F2 durante o refresh e interações. O mesmo relatório via Live Connection com SSAS resultou em consumo ZERO da capacidade do Fabric.

Isso permite que você utilize uma capacidade mínima (como uma F2 ou F4) apenas para “exibir” o portal, enquanto o trabalho pesado de processar bilhões de linhas fica em um servidor onde o upgrade de RAM é infinitamente mais barato do que subir de nível no licenciamento de nuvem.

Embedded Analytics: Compartilhando com Milhares de Pessoas

Se você tem 2.000 usuários, pagar licença Pro para todos custaria uma fortuna. A saída legalizada e licenciada é o Power BI Embedded. Você desenvolve um portal simples (ou utiliza uma solução pronta) e “embaia” os relatórios lá.

  • Vantagem: Usuários finais não precisam de licença Pro. Eles acessam via aplicação.
  • Flexibilidade: Você pode ligar a capacidade de manhã e desligar à noite, ou escalar de uma F2 para uma F64 apenas durante o processamento de madrugada.
  • Instância Reservada: No Fabric, você pode reservar a capacidade por 1 ano e ganhar 40% de desconto.
ALERTA CRÍTICO: Cuidado com o “Publish to Web” (Publicar na Web). Ele NÃO é uma ferramenta de economia para dados privados. Qualquer dado publicado ali fica indexado no Google. Já vi multinacionais com dados sensíveis expostos porque tentaram economizar licença da forma errada.

Análise de Performance: Concorrência, Smoothing, Bursting e Throttling

Ao utilizar o Fabric ou Embedded, monitore os limites de conexões simultâneas.

Uma capacidade F2 permite apenas 2 conexões de Live Connection por segundo. Se você tiver um pico de 100 usuários acessando ao mesmo tempo, o relatório ficará lento, e você verá o impacto no tempo de resposta do Analysis Services.

Cuidado com o Smoothing & Bursting:: O Fabric permite que você “pegue emprestado” CPU do futuro para não travar o relatório agora, mas se você abusar, a sua capacidade entrará em Throttling, deixando tudo lento por horas e provavelmente até indisponível, sem conseguir abrir nenhum relatório até devolver todos os créditos utilizados ou reiniciar a capacidade (gera um custo extra, que pode ser bem alto).

Conclusão

Compartilhar dados massivos com baixo custo não é mágica, é engenharia.

Ao mover o processamento pesado para o Analysis Services e utilizar o licenciamento de capacidade (Fabric ou Embedded) de forma estratégica, você consegue entregar performance com custo bem mais baixo.

Seja o guardião da capacidade na sua empresa. Não aceite relatórios mal modelados que utilizem muito mais capacidade que deveriam. Otimize o DAX, utilize agregações e, se mesmo assim, o consumo da sua capacidade ainda estiver muito alta, o SSAS é o seu melhor amigo.