Pirâmides etárias 1950-2100

Estas pirâmides etárias interativas mostram a estrutura da população por idade em grupos de cinco anos, para quase todos os países, e a sua evolução entre 1950–2100. Pode escolher o país, ver Total/Homens/Mulheres (as percentagens são sempre relativas ao total), e definir um intervalo de anos para observar a evolução com escala fixa. Os dados são das Nações Unidas e as projeções 2024-2100 correspondem à variante média.
A origem do desenho
Publiquei a primeira versão destas pirâmides etárias há alguns anos. De vez em quando gosto de revê-las, atualizar os dados, experimentar novas paletas de cores e testar a sua implementação em outras ferramentas.
Esta nova versão foi feita em Vega e é a primeira versão interativa que publiquei. Também escolhi um esquema de cores divergentes para facilitar a observação da alteração na estrutura da população entre 1950 e 2100 na maioria dos países.
Embora tenha feito a primeira versão destas pirâmides etárias há muitos anos, o que me levou até elas foi um processo que não mudou muito ao longo dos anos: uma pergunta que leva ao reconhecimento de uma ineficiência na forma como essa pergunta é tradicionalmente respondida.
Neste caso, foi algo como "e se eu quisesse ter uma forma mais eficaz de comparação dos sexos?" e também "e se eu quisesse comparar a população ao longo do tempo?"
A solução para ambos os casos foi a substituição das barras tradicionais por linhas, e colocar todos os dados a comparar no mesmo lado do eixo.
Outra coisa que também gosto de fazer é a de aplicar pressão a um desenho: qual a sua capacidade para gerir um volume de dados que em princípio não será utilizado. Neste caso, tinha descoberto recentemente as estimativas e projeções demográficas das Nações Unidas, com um total de 150 anos. Decidi ir a pé juntos e usar todos os dados. Era evidente para mim que só podia usar a cor para diferenciar os anos, o que implicava criar 150 tons que exprimissem continuidade, devendo ser claro para o utilizador que uma certa gama de tons correspondia ao início da série e outra gama ao fim da série.
A aplicação da cor, associada à interpolação para suavizar a ligação entre pontos, criou algo que eu não tinha antecipado: linhas como que de um tecido diáfano suavemente embaladas pela brisa (desculpem, é assim que vejo estes gráficos).
Não sendo particularmente sensível à harmonia de cores e à sua escolha e uso mais sofisticados, sinto que estes gráficos têm um potencial estético que as minhas escolhas cromáticas não permitiram otimizar.



O design tradicional das pirâmides etárias
A pirâmide etária é provavelmente o gráfico específico de uma área de conhecimento mais reconhecível e popular. Qualquer um de nós pode lê-la com alguma facilidade. Algo que é menos familiar é a codificação de certos perfis: um formato de pirâmide ou um perfil de urna têm interpretações diferentes, e correspondem, em geral, ao que os demógrafos designam por transição demográfica.
Como surgiu o gráfico? Alguém, no século XIX, notou que, numa população típica, o número de homens e mulheres é semelhante, e que, na altura, o número de pessoas por idade tendia a diminuir, com muitos jovens e poucos idosos. A partir desta estrutura, é tentador criar um gráfico que se assemelhe a uma pirâmide:
- Colocar a população no eixo horizontal e as idades no eixo vertical permite criar o terceiro lado do triângulo.
- Separar os sexos, rodando o valor dos homens para a esquerda, cria a simetria.
O problema com o design tradicional
As opções de design das pirâmides etárias originais são pouco eficazes. Isto é um problema comum quando temos uma ideia pré-concebida de uma visualização e tentamos encaixar os dados nessa representação. Vemos o mesmo problema quando tentamos adaptar os dados organizacionais à imagem dos dashboards dos automóveis.
O que justifica essa degradação da eficácia? Aqui estão alguns motivos (veja a nota abaixo):
- Quando temos categorias ordenadas, como as idades, elas devem ser colocadas no eixo horizontal, com os dados quantitativos ao longo do eixo vertical. O uso do eixo vertical para categorias tende a ser mais usado para rankings.
- O lado esquerdo do eixo horizontal corresponde aos valores negativos. A pirâmide abriga-nos a pensar em valores absolutos (na maioria das aplicações, é necessário multiplicar o valor dos homens por -1, e a seguir remover o sinal negativo do rótulo dos eixos).
- O afastamento da representação dos dois sexos dificulta a interpretação do gráfico. Como em geral os valores são semelhantes, pequenas diferenças podem ser significativas, mas elas não são percebidas porque os valores de homens e mulheres estão afastados.
- A própria segmentação entre homens e mulheres é frequentemente irrelevante para a interpretação do perfil da população (mas há exceções: no gráfico interativo acima, selecione o Qatar e observe a diferença entre homens e mulheres).



O problema da herança
Apesar dos seus problemas, as pirâmides etárias tradicionais têm um lastro histórico e um reconhecimento que torna difícil ajustar o design a formas mais eficientes de representação. Penso que este é um exemplo em que a eficácia a todo o custo tem impacto mais negativo que positivo. No curso vemos vários exemplos disso, em particular quando falamos de Edward Tufte.
Assim, o que me parece razoável mudar é o que fiz neste caso: ter os dados apenas de um lado do eixo, e substituir as barras por linhas. A rotação dos eixos, com as idades ao longo do eixo horizontal cria, na minha opinião, uma disrupção excessiva e sem benefícios relevantes.



Power BI
O Power BI alia uma avançada gestão de dados com um medíocre motor de visualização de dados, e é desesperante navegar naquela muito básica, e com frequência errada, implementação de gráficos.
Estas pirâmides etárias não são particularmente complexas, e são fáceis de recriar na maioria dos programas. Em Power BI não há uma forma razoável de o fazer, porque não suporta linhas de ligação entre pontos num gráfico de dispersão.
A alternativa é usar o Deneb, que permite interpretar uma linguagem de programação (Vega) e relacionar o código com os dados geridos pelo Power BI. Na imagem abaixo, as linhas foram criadas em Deneb e o resto são visuais nativos de Power BI. O melhor de dois mundos, portanto.
(Como digo na página de apresentação do curso de Visualização de Dados, a maioria dos gráficos publicados foram feitos em Vega, exatamente por este motivo: poder mais tarde usá-los em Deneb dentro do Power BI.)

Para além de mais de 100 lições no curso de Visualização de Dados, a Academia Wisevis é constantemente atualizada com novos conteúdos. Em breve estarão disponíveis novos cursos sobre Excel para análise de dados e gráficos em Excel!