Category: visualização

Dig it?

Anúncios

Displays of Evidence for Making Decisions – Pt. II

Displays of Evidence for Making Decisions – Pt. I

A 28 de Janeiro de 1986 o vai-vem espacial Challenger explodiu e sete astronautas morreram devido à erosão de dois anéis de borracha (O-rings, não sei a tradução). Estes anéis perderam resiliência porque o lançamento foi feito num dia muito frio.

untitled4

Autorização de lançamento

No dia anterior, vendo as temperaturas previstas para o dia do lançamento, os engenheiros que construíram o vai-vem aconselharam a agência governamental responsável, NASA,  a adiar a empreitada. Tinham diversas indicações de que este poderia correr mal: história da degradação do O-Ring em lançamentos anteriores, a física da resiliência, e dados experimentais. Estas informações foram enviadas por fax para a NASA em 13 tabelas.

Apesar de ser a única recomendação de cancelamento em 12 anos por parte do construtor do vai-vém, altos oficiais da NASA ficaram muito surpreendidos, apontaram muitas falhas nas tabelas enviadas, e sugeriram que a recomendação deveria ser reconsiderada.

E foi. Na manhã seguinte, o Challenger explodiu 73 segundos após ignição, efeito das baixas temperaturas nos O-Rings.

Explosão do Challenger, 73 segundos após ignição

Tufte enumera uma série de erros nas 13 tabelas enviadas. Ora porque não tinham identificação, e era difícil de atribuir responsabilidade a alguém por aquela decisão, ora porque davam 3 nomes diferentes ao mesmo vai-vém. Podemos ver alguns exemplos em baixo. Muito pouco exemplificativos da tendência para erosão que já havia nos O-Rings em situações de baixas temperaturas.

untitled3

Algumas das tabelas e informações enviadas para a NASA no dia anterior, a sugerir o cancelamento do lançamento do Challenger

A certo ponto, oficiais e engenheiros da NASA focaram-se não nos dados da erosão, mas nos dados do “blow-by” – outra tradução que me escapa, desculpem. E verificaram que no lançamento feito com a temperatura mais alta, verificou-se blow by, da mesma forma que no lançamento feito no dia mais frio. Os dados de blow-by, para este caso, eram irrelevantes, e desviaram a atenção do que era realmente crítico.

Estas 13 tabelas não conseguiram impedir o lançamento, mas quem os fez tinha razão: Estavam a pensar casualmente, mas não estavam a ilustrar casualmente.

Tufte recolheu informação presente nas tabelas e em relatórios posteriores, e organizou-a em função da temperatura, assim:

untitled7

Informação recolhida por Tufte e organizada em função da temperatura

Deste modo vemos claramente que há mais casos de erosão quando as temperaturas são mais baixas.

Nesta matriz (também elaborada por Tufte), ainda é mais evidente esta relação: a temperatura prevista estava completamente fora dos dados acumulados e arquivados ao longo de 24 lançamentos.

untitled8

A mesma informação, mas apresentada numa matriz

Após o acidente, vieram as comissões presidenciais para as habituais investigações. As ilustrações elaboradas por elas cometiam o mesmo erro:  faltam legendas, não é clara a relação causa-efeito e estão mal ordenadas.

untitled5

untitled6

Ilustrações elaboradas pela Comissão Presidencial que investigou o caso Challenger

Vejam só o que aconteceria se esta  informação fosse ordenada por temperatura – a variável em questão – em vez de por data.

untitled9

Mesma informação organizada por ordem de temperatura

Será que alguém se atreveria a lançar o Challenger se os dados fossem apresentados de outra forma?

Although we often hear that data speak for themselves, their voices can be soft and sly.

– Frederick Mosteller, Stephen E. Fienberg, and Robert E.K. Rourke, Beginning statistics with Data Analysis (Reading, Massachusetts, 1983), 234

Displays of Evidence for Making Decisions – Pt. I

Acabei de ler um capítulo de um livro de Edward R. Tufte (“Visual and Statistical Thinking: Displays of Evidence for Making Decisions”, capítulo 2 do livro “Visual Explanations: Images and Quantities, Evidence and Narrative”, publicado em 1997). A temática interessa-me muito e Tufte é o nome clássico da Visualização de Dados, da Informação e une duas coisas que sempre me despertaram a atenção: Design e Cognição.

Como transmitir informação da melhor forma, tendo em conta limites que temos naturalmente (perceção, atenção, memória), e tendo o cuidado que esta seja limpa, transparente e principalmente, compreensível.

Neste caso, Tufte fala de duas situações para ilustrar uma boa e uma má utilização da informação: a epidemia de cólera de Londres em 1854 e o lançamento da shuttle Challenger em 1986.

No primeiro caso, John Snow fez um admirável trabalho de detetive ao tentar descobrir a origem da epidemia.

Segundo Tufte, colocou os dados num contexto adequado para retirar relações de causa e efeito: os dados originais listavam os nomes das vítimas ordenados por data de óbito. Isto poderia conduzir a displays baseados no tempo, cronologias da epidemia como os gráficos em baixo. Contudo, a passagem do tempo não é uma variável explanatória, inútil até, quando o objetivo é descobrir uma estratégia de intervenção.

Nova imagem

O que John Snow fez foi marcar as mortes num mapa, onde sinalizava também a localização das 13 bombas de água da vizinhança (na imagem em baixo, os traços representam o número de mortos em cada casa, e as bombas de água são os círculos, vejam ali perto do D de Broad Street)

Registo das mortes resultantes da Epidemia de Cólera em Londres (John Snow, 1854)

A associação entre cólera e a localização dos poços é evidente neste mapa, e permite-nos comparar este cenário com outros locais com bombas de água e sem mortes devido a cólera.

Além de analisar porque morriam as pessoas, Snow questionava-se também porque não morriam pessoas na mesma vizinhança, e falou do caso em concreto da cervejaria, a amarelo no mapa.

Yep.o diretor da cervejaria permitia que os funcionários bebessem um bocadinho de cerveja…e é claro que assim nenhum bebia água quando tinha sede.

Face às evidências, Snow sugere que se retire a bomba de água de Broad Street.

E aqui é que começam as manipulações de gráficos engraçadas.

untitled

Nesta quantificação diária de mortes, podemos ver que quando retiraram a bomba de água de Broad Street, já se verificava uma tendência para o número de mortes diminuir a cada dia. Isto porque rapidamente as pessoas fugiram à epidemia, ficando o bairro com cada vez menos pessoas. Portanto, não é claro se a diminuição de mortes se deveu exclusivamente à remoção da bomba de água.

E se os gráficos fossem construídos da seguinte forma?

untitled2

Numa agregação por semana, parece mesmo que a diminuição de mortes se deveu à remoção da bomba de água.

A varíavel tempo é extremamente sensível à escolha de intervalos. E podemos ver aqui como é fácil manipular o display de modo a transmitir pontos de vista favoráveis…