O problema com os gráficos de barras

Os gráficos no nosso canto da visualização de dados devem ser, antes do mais, eficazes. E que há mais eficaz, sóbrio e burocrático que um gráfico de barras?
Na verdade, o conceito de “eficácia” deve ser mais que a codificação dos dados: deve incluir também a capacidade de atrair a manter a atenção. O gráfico de barras tende a falhar neste aspeto e, com frequência, também no outro.
Quando nos focamos em extrair valor dos dados e comunicar melhor, um subproduto frequente é o de que os gráficos se tornam também esteticamente mais apelativos e interessantes.
Um exemplo normal
Isto é fácil de demonstrar usando um gráfico particularmente mau, como uma tarte 3D com os segmentos explodidos e cores garridas. Mas vou dar um exemplo um pouco mais sofisticado.
Este gráfico do instituto italiano de estatística representa a participação no mercado de trabalho da população entre 15–64 anos em Itália, por sexo e nível de escolaridade. Não há absolutamente nada de extraordinário nele. Pelo contrário, é difícil encontrar algo mais típico da forma como os organismos de estatística representam os dados. Os gráficos de barras são em geral apostas seguras para a representação correta e eficaz dos dados, e que não nos obrigam a pensar muito na forma como vamos comunicar.

O que é interessante neste gráfico é que ele nos dá umas impressões vagas, mas poucas conclusões concretas. Só percebemos como comunica mal quando lhe fazemos perguntas específicas a que ele tem dificuldade em responder, para lá da comparação 2005–2015 em cada par de colunas. Qual foi a evolução por sexo em cada nível de escolaridade? Há variações significativas na amplitude? Os dados estão lá e podemos lê-los. Mas o que consigo extrair é arrancado a ferros, é algo que ele me diz a contragosto, e só porque eu perguntei. Se não perguntar não vou obter informações adicionais.
Uma alternativa pensada
Este gráfico está disponível numa das lições do curso como alternativas a gráficos de barras, usando os mesmos dados:
(Uma versão em Excel já está disponível na Biblioteca de Gráficos)
Neste gráfico, as respostas aparecem instantaneamente quando formulamos a pergunta:
- Sim, há um decréscimo de participação total entre 2005 e 2015
- Sim, há um efeito de escolaridade na participação (mais escolaridade, mais participação)
- Sim, a diferença de participação por sexo tende a reduzir-se com o aumento da escolaridade
- Sim, no total a participação das mulheres aumenta, mas por nível de escolaridade diminui, e não sei como se explica isso (é fácil detetar neste gráfico, mas não no outro)
Para ser honesto, quando desenhei este gráfico não estava à espera de uma tão grande diferença na capacidade de comunicação entre um e outro. Mais grave: não me apercebera de quão mau o gráfico de barras é.
Este gráfico, para além das vantagens óbvias, facilmente poderia acomodar mais anos. Um dos problemas dos gráficos de barras é a gestão de várias séries, pelo que teria dificuldade em representar mais dados.
Uma normalidade que não quer saber
O gráfico de barras é, num certo sentido, o mais burocrático de todos os gráficos. Quando bem desenhado, é muito eficaz na comparação de valores. Tal como a burocracia, pode maravilhar-nos pela eficiência (sim, eficiência e burocracia na mesma frase soa estranho), mas não pela curiosidade. E tudo tem de encaixar no modelo.
O desenho de um gráfico revela com frequência a falta de curiosidade e interesse pelo que os dados têm para dizer, e de que modo lhes queremos dar voz. Por vezes precisamos de um designer para o fazer. Mas, para as tarefas do dia a dia, o fundamental é perceber o que queremos perguntas aos dados. No gráfico de barras acima, é enfatizado o valor individual dado por cada barra; no gráfico alternativo, é enfatizada a análise das diferenças, o que parece ser uma análise mais relevante. Quando essa perspetiva fica clara, a escolha do desenho simplifica-se muito.
Takeaways
O lema deste site, “Valorize os seus dados”, encontra aqui uma excelente aplicação: a escolhe de um tipo de gráfico mais adequado revela um valor insuspeito nos dados. Para não perder esse valor, há algumas ideias que podemos explorar:
- Decida o que quer valorizar: valores individuais vs. diferenças
- Escolha o desenho e tipo de gráfico que mais eficazmente comunica essa mensagem
- Evite legendas sempre que possível
- Se as séries são períodos temporais, tente colocá-las no eixo horizontal, não na legenda.
Este é o tipo de reflexão que desenvolvemos no nosso Curso de Visualização de Dados: perceber como diferentes escolhas gráficas moldam a informação que conseguimos extrair. Torne-se membro da Academia Wisevis e melhore as suas competências em visualização de dados. E se utiliza folhas de cálculo, versões Excel dos gráficos do curso irão começar a ser disponibilizadas em breve.
Member discussion