domingo, 17 de octubre de 2010

La Tierra Media de las Redes Sociales

Además de ser una visualización maravillosa con nombres desopilantes e inteligentes, xkcd publicó la imagen que se ve a la izquierda asociando el tamaño de cada comunidad con un dato tan útil como el total de actividad social que tiene, tal como está expresado en la leyenda del mapa.
Esta información, si bien no totalmente precisa, puede resultar de utilidad para todos los que quieran explotar los datos de las redes sociales. Puede servir de puntapié inicial si se piensa en hacer opinion mining, o cualquier investigación que involucre estudiar lo publicado por los usuarios/clientes acerca de cualquier tema/marca.
Cuando se mira el tamaño de Facebook en este mapa es imposible retener al Gollum interno gritando "datos! datos!". Analizar los datos de FB no es una idea nueva, naturalmente. Ya existen estudios bajo el nombre de "facebook mining" e iniciativas como http://fanpageanalytics.com/, que tiene esta app para explorar los perfiles por paises: http://fanpageanalytics.com/countryprofiles.html.
En relación con el pánico que genera todo el tema de la privacidad de los datos, me gustó mucho esta frase del autor de fanpageanalytics, Pete Warden, publicada en livescience.com:
"Si se mira a los datos de los perfiles de usuarios en su conjunto, es como mirar una pintura. Cada punto de la pintura (un perfil individual) no es interesante, pero cuando das un paso atrás y miras los patrones que existen en millones de perfiles, se empiezan a ver formas muy interesantes que van emergiendo de la pintura".
Desde mi punto de vista (subjetivo, tecnófilo, minero y despreocupado), lo interesante no es lo que puede saberse acerca de las individualidades de las personas sino acerca del conjunto. Me gusta esa analogía de pararme frente a los datos como frente a una pintura y tratar de entender lo que los datos me dicen. Encontrar esas 'formas interesantes' de las que habla Warden.
En el blog lifeanalytics pueden verse muchísimos ejemplos de mining en twitter y hace poco MH me envió este artículo acerca de una empresa que se dedica a analizar tweets.
En este mundo de análisis de las redes sociales hay muchísimo por hacer. Si es cierto que 'el futuro queda hacia adelante' entonces para mi caminar hacia 'adelante' es caminar en esta dirección.

domingo, 10 de octubre de 2010

Comentarios a partir de "Journalism in the Age of Data"

El famoso gráfico de Minard
La Universidad de Stanford realizó este video acerca del uso de visualizaciones en el campo periodístico. Cuenta con figuras del mundo de la visualización de información que ya conocía como Fernanda Viegas (Many Eyes), Martin Wattenberg (Many Eyes), Ben Fry o Jeff Heer (flare y protovis); y me permitió conocer a otros tantos como Amanda Cox, del New York Times, de quien se dice es la "Reina del Infovis".
El video dura 54 minutos y presenta algunas opiniones encontradas acerca de, por ejemplo, el famoso gráfico del flujo de películas y sus ganancias por taquilla, publicado en el NY Times hace un par de años.
Personalmente pienso que el tema de las visualizaciones tiene un componente subjetivo muy importante. Se requiere una explicación de, en promedio, 8 minutos, para entender el gráfico más conocido de Minard (ver imagen) y sin embargo los que tenemos la suerte de conocerlo (y entenderlo) lo consideramos una genialidad. Pero, no se supone que las visualizaciones buscan ahorrar palabras y permitirnos entender los fenómenos más fácilmente? Por qué tanta explicación para poder entender un gráfico? Supongo que las respuestas no son exactas y dan para futuros posts.
Como programadora Actionscript, me pareció muy interesante también la importancia que se le da a este lenguaje para la construcción de visualizaciones. Sigo pensando que si no logra tener un buen rendimiento en plataformas móviles está en riesgo de muerte, pero fue reconfortante saberlo tan poderoso en este mundo.
Listo para los interesados algunas de las páginas interesantes nombradas en el video, clasificadas según sean herramientas para explorar, construir visualizaciones o de programación (para infoviz).
Para exploración de datos:
- http://www.google.com/publicdata/home. Vale la pena pasarse un par de horas mirando estos datos.
Herramientas de visualización on line:
- Many Eyes (http://manyeyes.alphaworks.ibm.com): Una de mis adicciones confesas.
- Swilvel: Se supone que está en swivel.com pero, al menos momentáneamente, está caido.
Herramientas para crear visualizaciones mediante programación:
- Protovis (http://vis.stanford.edu/protovis/): La hizo Jeff Heer y es para Javascript (qué le vamos a hacer).
- Flare (http://flare.prefuse.org/): También de Jeff Heer. Son librerías para Flex.
- The Javascript Infovis Toolkit (http://thejit.org/): La verdad es que esta no la nombraron en el video, pero me pareció apropiado incluirla :P
Blogs:
- Information Aesthetics (http://infosthetics.com/)
- Visual Complexity (http://www.visualcomplexity.com/vc/)
- Flowing Data (http://flowingdata.com/)
Un detalle de color del video es que, sin hacer ninguna referencia para nada, incluyeron este gráfico de xkcd, que es absolutamente genial. Justamente esta semana me lo había mencionado JK.