Diário de dados

Pensamentos e comentários mais longos que um tweet e mais curtos que um artigo sobre a vida com dados.

On this page

Design de Visualização
blog

Redesigning o RASI

Decidi fazer uma pausa e dedicar uma hora a refazer os gráficos (lado direito da imagem). Toda a página é um draft rápido em Excel (também para mostrar que o trabalho in-house não tem de ser... aquilo).

Redesigning o RASI

O RASI - Relatório Anual de Segurança Interna é a minha irritação de estimação. À esquerda da imagem mostro uma página que exemplifica o tipo de representação visual que o relatório privilegia. Fala de homicídios dolosos consumados, e mostra os gráficos que se veem. Tem a particularidade de não nos dizer quantos homicídios ocorreram (temos de ir à procura), o que é uma pequena irritação adicional.

Decidi fazer uma pausa e dedicar uma hora a refazer os gráficos (lado direito da imagem). Toda a página é um draft rápido em Excel (também para mostrar que o trabalho in-house não tem de ser... aquilo).

Há alguns fios condutores que podem ou não estar bem conseguidos nesta versão, mas que me parecem importantes:

  • uma referência (os 89 homicídios, mas está mal desenhada),
  • a clarificação da mensagem de cada gráfico,
  • a criação de uma sequência / narrativa,
  • a redução do tamanho do gráfico e libertação de espaço para colocação de texto analítico próximo.

Muitas vezes, o desafio na visualização de dados é menos a criação de um gráfico adequado e mais na criação de narrativas visuais com múltiplos objetos que sem sempre não gostam de ficar juntos. Este tipo de exercício é por isso muito recomendável. E, tendo em conta os relatórios publicados em Portugal, há muito por onde escolher.

Laboratório
blog

Pirâmides etárias animadas

A animação é útil para mostrar padrões temporais que seriam difíceis de representar de outra forma.

Pirâmides etárias animadas

Ontem publiquei vídeos de algumas pirâmides etárias. Falo da animação ⭐e de como ela é útil para mostrar padrões temporais que seriam difíceis de representar de outra forma. Também é necessário perceber os seus limites, em particular devido à forma como a animação esgota rapidamente a nossa capacidade de retenção, pelo que os padrões temporais devem ser simples e claros.

0:00
/0:18

+

Práticas
blog

Dados não temos

A ausência de dados em Portugal é algo extraordinário. Não há conferência, debate, em que a conclusão não se resuma a era giro fazer isto, mas não há dados.

Dados não temos

Numa das mais famosas cenas do cinema português, a analista de dados pede ao funcionário do INE: Dê-me dados sobre x. O funcionário responde: dados sobre x não temos. A analista: então dê-nos um pacotinho de opiniões sem fundamento. Isto repete-se até já não ser necessário dizer que "dados não temos".(OK, seria necessário fazer um pequeno ajustamento no papel do funcionário, mas percebem a ideia.)

A ausência de dados em Portugal é algo extraordinário. Não há conferência, debate, talvez mesmo a conversa de um grupo de bêbados às quatro da manhã em que a conclusão não se resuma a era giro fazer isto, mas não há dados.

Li algures que, nos debates na Assembleia Nacional nos anos 1950 que se dizia que era perigoso ensinar as pessoas a ler, porque poderiam ficar com ideias. Que o poder não gosta de pessoas com ideias é uma coisa universal. Aqui, vários dos fundamentos do salazarismo ainda se mantêm, apenas ajustados aos tempos.

Não temos uma cultura de dados. Temos uma cultura de opiniões que antigamente se concentrava no futebol e que agora importa todas as guerras culturais. Ninguém parece importar-se muito.

Escrevi que o RASI é inconcebível para um relatório sobre segurança interna. O ministro das finanças faz uns gráficos enganadores e poucos reclamam. Do estado dos dados abertos nem vale a pena falar. Tudo o que é mais interessante e detalhado é confidencial, se existir. O site que reporta o apuramento dos resultados eleitorais não quer que o comum dos mortais analise os dados. Os exemplos não têm fim.

Design de Visualização
blog

Os conhecidos que desconhecemos

Os conhecidos que desconhecemos

Ficou famosa uma citação do antigo secretário da defesa americano Donald Rumsfeld:

(...) como sabemos, há os “conhecidos conhecidos”: há coisas que sabemos que sabemos. Também sabemos que há “conhecidos desconhecidos”, ou seja, sabemos que há coisas que não sabemos. Mas também existem os “desconhecidos desconhecidos” — aqueles que não sabemos que não sabemos.

Faltou nesta lista os “desconhecidos conhecidos”, ou seja, aquilo que não sabemos que sabemos. O que de algum modo retrata, por exemplo, a burocracia do Estado, quando nos pede um documento que já tem.

Vem isto a propósito de um webinar com Alberto Cairo, excelente introdução à visualização de dados, o que não surpreende. Foi promovido pela Data Europa Academy da União Europeia (não conhecia, mas quem consegue conhecer todas as instituições da UE?). Os materiais do webinar podem ser encontrados aqui.

Em dado momento, Alberto Cairo nota que textos oblíquos ou verticais em etiquetas nos gráficos devem ser evitados e dá um exemplo semelhante a este. Depois mostra com a solução de bom senso, barras horizontais, em que o texto também é representado horizontalmente e tudo é mais fácil de ler.

Se forem X do Eurostat verão que não faltam gráficos com este formato. Aliás, este em concreto foi publicado no dia a seguir ao webinar.

O que é interessante, e liga com o desconhecido conhecido do início, é que não há falta de conhecimento sobre algumas práticas consensuais em visualização de dados no Eurostat. E nota-se que há pequenas mudanças. Há também alterações complexas que são difíceis de implementar numa máquina como UE. Mas este formato de gráfico, especificamente, não suscita qualquer controvérsia. Não entendo por que existe, para além da inércia.