Pirâmides etárias 1950-2100

Pirâmides etárias interativas onde pode observar a evolução demográfica dos países numa forma eficaz e esteticamente apelativa.
Pirâmides etárias 1950-2100

Estas pirâmides etárias interativas mostram a estrutura da população por idade em grupos de cinco anos, para quase todos os países, e a sua evolução entre 1950–2100. Pode escolher o país, ver Total/Homens/Mulheres (as percentagens são sempre relativas ao total), e definir um intervalo de anos para observar a evolução com escala fixa. Os dados são das Nações Unidas e as projeções 2024-2100 correspondem à variante média.

País
Sexo
Anos 1950 2100

A origem do desenho

Publiquei a primeira versão destas pirâmides etárias há alguns anos. De vez em quando gosto de revê-las, atualizar os dados, experimentar novas paletas de cores e testar a sua implementação em outras ferramentas.

Esta nova versão foi feita em Vega e é a primeira versão interativa que publiquei. Também escolhi um esquema de cores divergentes para facilitar a observação da alteração na estrutura da população entre 1950 e 2100 na maioria dos países.

Embora tenha feito a primeira versão destas pirâmides etárias há muitos anos, o que me levou até elas foi um processo que não mudou muito ao longo dos anos: uma pergunta que leva ao reconhecimento de uma ineficiência na forma como essa pergunta é tradicionalmente respondida.

Neste caso, foi algo como "e se eu quisesse ter uma forma mais eficaz de comparação dos sexos?" e também "e se eu quisesse comparar a população ao longo do tempo?"

A solução para ambos os casos foi a substituição das barras tradicionais por linhas, e colocar todos os dados a comparar no mesmo lado do eixo.

Outra coisa que também gosto de fazer é a de aplicar pressão a um desenho: qual a sua capacidade para gerir um volume de dados que em princípio não será utilizado. Neste caso, tinha descoberto recentemente as estimativas e projeções demográficas das Nações Unidas, com um total de 150 anos. Decidi ir a pé juntos e usar todos os dados. Era evidente para mim que só podia usar a cor para diferenciar os anos, o que implicava criar 150 tons que exprimissem continuidade, devendo ser claro para o utilizador que uma certa gama de tons correspondia ao início da série e outra gama ao fim da série.

A aplicação da cor, associada à interpolação para suavizar a ligação entre pontos, criou algo que eu não tinha antecipado: linhas como que de um tecido diáfano suavemente embaladas pela brisa (desculpem, é assim que vejo estes gráficos).

Não sendo particularmente sensível à harmonia de cores e à sua escolha e uso mais sofisticados, sinto que estes gráficos têm um potencial estético que as minhas escolhas cromáticas não permitiram otimizar.

O design tradicional das pirâmides etárias

A pirâmide etária é provavelmente o gráfico específico de uma área de conhecimento mais reconhecível e popular. Qualquer um de nós pode lê-la com alguma facilidade. Algo que é menos familiar é a codificação de certos perfis: um formato de pirâmide ou um perfil de urna têm interpretações diferentes, e correspondem, em geral, ao que os demógrafos designam por transição demográfica.

Como surgiu o gráfico? Alguém, no século XIX, notou que, numa população típica, o número de homens e mulheres é semelhante, e que, na altura, o número de pessoas por idade tendia a diminuir, com muitos jovens e poucos idosos. A partir desta estrutura, é tentador criar um gráfico que se assemelhe a uma pirâmide:

  • Colocar a população no eixo horizontal e as idades no eixo vertical permite criar o terceiro lado do triângulo.
  • Separar os sexos, rodando o valor dos homens para a esquerda, cria a simetria.

O problema com o design tradicional

As opções de design das pirâmides etárias originais são pouco eficazes. Isto é um problema comum quando temos uma ideia pré-concebida de uma visualização e tentamos encaixar os dados nessa representação. Vemos o mesmo problema quando tentamos adaptar os dados organizacionais à imagem dos dashboards dos automóveis.

O que justifica essa degradação da eficácia? Aqui estão alguns motivos (veja a nota abaixo):

  • Quando temos categorias ordenadas, como as idades, elas devem ser colocadas no eixo horizontal, com os dados quantitativos ao longo do eixo vertical. O uso do eixo vertical para categorias tende a ser mais usado para rankings.
  • O lado esquerdo do eixo horizontal corresponde aos valores negativos. A pirâmide abriga-nos a pensar em valores absolutos (na maioria das aplicações, é necessário multiplicar o valor dos homens por -1, e a seguir remover o sinal negativo do rótulo dos eixos).
  • O afastamento da representação dos dois sexos dificulta a interpretação do gráfico. Como em geral os valores são semelhantes, pequenas diferenças podem ser significativas, mas elas não são percebidas porque os valores de homens e mulheres estão afastados.
  • A própria segmentação entre homens e mulheres é frequentemente irrelevante para a interpretação do perfil da população (mas há exceções: no gráfico interativo acima, selecione o Qatar e observe a diferença entre homens e mulheres).
💡
Note que "deve ser feito assim" em visualização de dados deve ser sempre visto mais como sugestão do que como regra. Para além de depender do contexto, a sensibilidade e leitura de cada autor pode levar a soluções diferentes.

O problema da herança

Apesar dos seus problemas, as pirâmides etárias tradicionais têm um lastro histórico e um reconhecimento que torna difícil ajustar o design a formas mais eficientes de representação. Penso que este é um exemplo em que a eficácia a todo o custo tem impacto mais negativo que positivo. No curso vemos vários exemplos disso, em particular quando falamos de Edward Tufte.

Assim, o que me parece razoável mudar é o que fiz neste caso: ter os dados apenas de um lado do eixo, e substituir as barras por linhas. A rotação dos eixos, com as idades ao longo do eixo horizontal cria, na minha opinião, uma disrupção excessiva e sem benefícios relevantes.

Power BI

O Power BI alia uma avançada gestão de dados com um medíocre motor de visualização de dados, e é desesperante navegar naquela muito básica, e com frequência errada, implementação de gráficos.

Estas pirâmides etárias não são particularmente complexas, e são fáceis de recriar na maioria dos programas. Em Power BI não há uma forma razoável de o fazer, porque não suporta linhas de ligação entre pontos num gráfico de dispersão.

A alternativa é usar o Deneb, que permite interpretar uma linguagem de programação (Vega) e relacionar o código com os dados geridos pelo Power BI. Na imagem abaixo, as linhas foram criadas em Deneb e o resto são visuais nativos de Power BI. O melhor de dois mundos, portanto.

(Como digo na página de apresentação do curso de Visualização de Dados, a maioria dos gráficos publicados foram feitos em Vega, exatamente por este motivo: poder mais tarde usá-los em Deneb dentro do Power BI.)

💡
Este ficheiro de Power BI com os dados e o gráfico estará disponível esta semana para os subscritores do curso. Uma versão em Excel será publicada em breve.

Para além de mais de 100 lições no curso de Visualização de Dados, a Academia Wisevis é constantemente atualizada com novos conteúdos. Em breve estarão disponíveis novos cursos sobre Excel para análise de dados e gráficos em Excel!

Sim! Quero subscrever os cursos da Academia Wisevis!