Category: visualização
Dig it?
Displays of Evidence for Making Decisions – Pt. II
Displays of Evidence for Making Decisions – Pt. I
A 28 de Janeiro de 1986 o vai-vem espacial Challenger explodiu e sete astronautas morreram devido à erosão de dois anéis de borracha (O-rings, não sei a tradução). Estes anéis perderam resiliência porque o lançamento foi feito num dia muito frio.
No dia anterior, vendo as temperaturas previstas para o dia do lançamento, os engenheiros que construíram o vai-vem aconselharam a agência governamental responsável, NASA, a adiar a empreitada. Tinham diversas indicações de que este poderia correr mal: história da degradação do O-Ring em lançamentos anteriores, a física da resiliência, e dados experimentais. Estas informações foram enviadas por fax para a NASA em 13 tabelas.
Apesar de ser a única recomendação de cancelamento em 12 anos por parte do construtor do vai-vém, altos oficiais da NASA ficaram muito surpreendidos, apontaram muitas falhas nas tabelas enviadas, e sugeriram que a recomendação deveria ser reconsiderada.
E foi. Na manhã seguinte, o Challenger explodiu 73 segundos após ignição, efeito das baixas temperaturas nos O-Rings.
Tufte enumera uma série de erros nas 13 tabelas enviadas. Ora porque não tinham identificação, e era difícil de atribuir responsabilidade a alguém por aquela decisão, ora porque davam 3 nomes diferentes ao mesmo vai-vém. Podemos ver alguns exemplos em baixo. Muito pouco exemplificativos da tendência para erosão que já havia nos O-Rings em situações de baixas temperaturas.
A certo ponto, oficiais e engenheiros da NASA focaram-se não nos dados da erosão, mas nos dados do “blow-by” – outra tradução que me escapa, desculpem. E verificaram que no lançamento feito com a temperatura mais alta, verificou-se blow by, da mesma forma que no lançamento feito no dia mais frio. Os dados de blow-by, para este caso, eram irrelevantes, e desviaram a atenção do que era realmente crítico.
Estas 13 tabelas não conseguiram impedir o lançamento, mas quem os fez tinha razão: Estavam a pensar casualmente, mas não estavam a ilustrar casualmente.
Tufte recolheu informação presente nas tabelas e em relatórios posteriores, e organizou-a em função da temperatura, assim:
Deste modo vemos claramente que há mais casos de erosão quando as temperaturas são mais baixas.
Nesta matriz (também elaborada por Tufte), ainda é mais evidente esta relação: a temperatura prevista estava completamente fora dos dados acumulados e arquivados ao longo de 24 lançamentos.
Após o acidente, vieram as comissões presidenciais para as habituais investigações. As ilustrações elaboradas por elas cometiam o mesmo erro: faltam legendas, não é clara a relação causa-efeito e estão mal ordenadas.
Vejam só o que aconteceria se esta informação fosse ordenada por temperatura – a variável em questão – em vez de por data.
Será que alguém se atreveria a lançar o Challenger se os dados fossem apresentados de outra forma?
Although we often hear that data speak for themselves, their voices can be soft and sly.
– Frederick Mosteller, Stephen E. Fienberg, and Robert E.K. Rourke, Beginning statistics with Data Analysis (Reading, Massachusetts, 1983), 234
Displays of Evidence for Making Decisions – Pt. I
Como transmitir informação da melhor forma, tendo em conta limites que temos naturalmente (perceção, atenção, memória), e tendo o cuidado que esta seja limpa, transparente e principalmente, compreensível.
Neste caso, Tufte fala de duas situações para ilustrar uma boa e uma má utilização da informação: a epidemia de cólera de Londres em 1854 e o lançamento da shuttle Challenger em 1986.
No primeiro caso, John Snow fez um admirável trabalho de detetive ao tentar descobrir a origem da epidemia.
Segundo Tufte, colocou os dados num contexto adequado para retirar relações de causa e efeito: os dados originais listavam os nomes das vítimas ordenados por data de óbito. Isto poderia conduzir a displays baseados no tempo, cronologias da epidemia como os gráficos em baixo. Contudo, a passagem do tempo não é uma variável explanatória, inútil até, quando o objetivo é descobrir uma estratégia de intervenção.
O que John Snow fez foi marcar as mortes num mapa, onde sinalizava também a localização das 13 bombas de água da vizinhança (na imagem em baixo, os traços representam o número de mortos em cada casa, e as bombas de água são os círculos, vejam ali perto do D de Broad Street)
A associação entre cólera e a localização dos poços é evidente neste mapa, e permite-nos comparar este cenário com outros locais com bombas de água e sem mortes devido a cólera.
Além de analisar porque morriam as pessoas, Snow questionava-se também porque não morriam pessoas na mesma vizinhança, e falou do caso em concreto da cervejaria, a amarelo no mapa.
Yep.o diretor da cervejaria permitia que os funcionários bebessem um bocadinho de cerveja…e é claro que assim nenhum bebia água quando tinha sede.
Face às evidências, Snow sugere que se retire a bomba de água de Broad Street.
E aqui é que começam as manipulações de gráficos engraçadas.
Nesta quantificação diária de mortes, podemos ver que quando retiraram a bomba de água de Broad Street, já se verificava uma tendência para o número de mortes diminuir a cada dia. Isto porque rapidamente as pessoas fugiram à epidemia, ficando o bairro com cada vez menos pessoas. Portanto, não é claro se a diminuição de mortes se deveu exclusivamente à remoção da bomba de água.
E se os gráficos fossem construídos da seguinte forma?
Numa agregação por semana, parece mesmo que a diminuição de mortes se deveu à remoção da bomba de água.
A varíavel tempo é extremamente sensível à escolha de intervalos. E podemos ver aqui como é fácil manipular o display de modo a transmitir pontos de vista favoráveis…