Teórico 12. Redes: el lado oscuro de los datos

Lamentablemente la versión en vivo de este teórico se vio afectada por motivos ajenos a la cátedra, no obstante algunos compañeros tuvieron la posibilidad de participar de la conversación que Mario Kiektik sostuvo con el profesor Sergio Guerrero, especialista en análisis de redes sociales y miembro del grupo Antropocaos, un equipo de investigación en ciencias sociales originado en  la carrera de Antropología de la Universidad de Buenos Aires. Lo que sigue es la desgrabación de la charla y el trabajo que realizamos sobre un usuario de Foursquare.

(Queremos hacer mención muy brevemente a la Ley N° 25.326 a partir de la cual se ha creado la Dirección Nacional de Protección de Datos Personales   que tiene como tarea controlar las bases de datos personales, un tema que deben tener siempre en cuenta en cualquier investigación social).

 

Bien, siguiendo con la conversación de la semana pasada vamos a trabajar hoy de un modo práctico con una red social concreta, en este caso le agradecemos a Valentín Muro que nos facilitó su ID en Foursquare, el que usamos como “semilla” para construir la red. Luego discutiremos sobre la importancia de los hallazgos obtenidos en el “laboratorio” de datos.

 

Lo que hacemos primero es pedirle a la API de la plataforma 4SQ que nos devuelva todos los usuarios conectados con Valentin Muro, linkiados con él, es decir los “amigos” de Valentin. Luego repetimos el procedimiento, tomando a cada uno de sus amigos como un semilla, de ese modo podremos recolectar a todos los usuario “amigos de los amigos” de Valentin.

 

Cuando repetimos el procedimiento podremos conocer a todos los “amigos de los amigos de los amigos” de Valentín, es decir un círculo de amistades de tres links. Realizado el procedimiento obtenemos de la recolección de usuarios conectados con Valentin Muro como usuario semilla 10 contactos directos o primarios, 72 secundarios, 573 terciarios como se ven en los gráficos de abajo,asimismo obtenemos los “enlaces” que cada uno de los 573 usuarios mantiene con el resto.

 

Podríamos seguir recolectando usuarios (o “nodos”) pero por ahora esto es suficiente a los efectos de poder comentar lo que nos interesa, a saber: que ademas de los datos, cuando hablamos de Bigdata, puede ser de mucha utilidad saber como los datos están relacionados íntimamente, es decir, que de algún modo nos interesa la trabécula de vínculos sobre la que se agregan los datos, en este caso los usuario y sus atributos en foursquare, ya que la topología que organiza la data es una data en sí misma, clave en cualquier procedimiento analítico que se realice sobre grandes números.

 

Abajo pueden ver los gráficos obtenidos a traves del programa gephi:

Fig 1: Amigos de Valetin, que aparece en el centro del grafo

Fig 2: Amigos de amigos de Valentin

Fig 3: Amigos de amigos de amigos de Valentín.

 

Fíjense que a medida que aumenta la cantidad de nodos tiende a crecer aún más la cantidad de enlaces entre los mismos. Qué características les llaman la atención de estas figuras? Reconocen algún patrón que insista a medida que crece la red? Si tuvieran que enviar un mensaje a esa red: ¿Que nodos creen que serían los más eficientes para difundir esa información? ¿Como justificarían su elección?

No es el objetivo de esta charla avanzar mucho más sobre las características topológicas de las redes sociales, pero en todo caso los interesados en este fascinante asunto pueden  revisar la enorme cantidad de artículos, encuentros, tesis doctorales y conversaciones de interesados disponibles en la Revista Hispana para el análisis de redes sociales y en Journal of Social Structure http://www.cmu.edu/joss/ , pueden buscar programas de computación específicamente diseñados para su estudio http://www.insna.org y bancos de datos con información específica para el ARS del http://www.data.gov/ que presenta información sobre Web 3.0.

El concepto de redes sociales fue desarrollado a partir de la sociometría de Moreno, aunque hubo muchos trabajos que lo precedieron. De todos modos,  existen dos corrientes en el análisis de redes sociales: el heredado de la sociométrica, de Moreno, que intenta explicar las propiedades de un grupo de conexiones existentes entre un grupo de nodos definidos; y la corriente de la Escuela de Manchester, representada por el antropólogo John Barnes, entre otros, que se interesó en la estructura global de la sociedad y su influencia en el comportamiento de cada individuo de la red.

Dando cuenta del sistema relacional que posee un individuo insertado en un sistema en particular, la red es el resultado de la relación de los grupos humanos que se sostienen  con el propósito de ayudarse mutuamente, realizar negocios, o llevar a cabo cualquier actividad articulada con sus intereses. El concepto de “red social” ha experimentado avances relevantes en los últimos 20 años gracias al poder de cómputo del software específico y ha sido empleado frecuentemente en varias disciplinas; entre ellas, se destacan la sociología y la antropología y más recientemente las ciencias de la comunicación.

Con esta perspectiva se puede trabajar tanto con fenómenos sociales “micro” y “meso”, es decir, aquellos fenómenos que derivan de los actores sociales en los que se presentan simultáneamente interacciones individuales, instituciones y estructuras sociales observables empíricamente, porque cuando uno dice “nodo” puede ahi colocar cualquier tipo de agente.

El conjunto relacional establece patrones autoorganizados que pueden relevarse mediante las herramientas “big data” o minería de datos. Con las redes podemos observar interacciones institucionalizadas (procesos de negociación, cooperación, subordinación), así como develar conflictos, manifestaciones culturales y estrategias de solidaridad, amistad y familiares, en el marco de estructuras sociales diferenciadas que los influyen, condicionan o permiten.

Una de las claves para trabajar bigdata es que las bases de datos estructuradas son sólo una parte: los datos correspondientes a los nodos y sus atributos son generalmente un tercio del volumen, sus relaciones el resto. Desde la aparición de Internet con los links y especialmente con las redes sociales, las configuraciones de enlaces es generada por los mismos usuarios en su navegación e interacción con otros usuarios. Las conductas online entonces pueden medirse, y las métricas arrojan información valiosa para el análisis (y diseño?) de los comportamientos y sus mutaciones.

Como una nueva especie biológica que encuentra, luego de una mutación, terreno fértil para reproducirse y prosperar, los nuevos medios se despliegan en una dinámica que no parece tener retroceso posible, apuntalados en las transformaciones cognitivas que adquieren las nuevas generaciones. Estamos viviendo un quinto paradigma en la historia del desarrollo de Internet en el cual el usuario es la web, el cual se inauguró en 2004 cuando Tim O’Reilly utilizó por primera vez el término web 2.0 en referencia a una segunda generación web basada en los usuarios y las folcsonomías. Las redes sociales son quizás las grandes protagonistas de ésta nueva generación, siendo Facebook el caso paradigmático aunque Twitter, la red de microblogging, posee una relación más afinada con los servicios de telefonía móvil, ya que permite el acceso no sólo vía web desde un smartphone y aun el envío de mensajes por SMS. Ambas plataformas ofrecen, entre otros, el servicio de geolocalización, mientras que Foursquare, fue diseñada específicamente en base a esa función.

Una última reflexión. El impacto del poder de cálculo se ha distribuido de un modo aún irregular entre las distintas disciplinas, por ejemplo la biología molecular se ha visto revolucionada por la bioinformática: ramas como la metabolómica, fluxomica, regulomica, signalómica, o la fisiómica van derivando hacia lo que es/será la conectómica; que se propone como la simulación completa y predictiva de las operaciones del sistema nervioso.

Las ciencias «ómicas» serían entonces las que trabajan con bigdata a partir de lo cual obtienen patrones informacionales más o menos autoorganizados.  En ciencias sociales se suele utilizar «Nomía” (como «culturonomía») que tiene que ver más con gobernanza, es decir con la insistencia de regularidades. En base a esto se podría decir que la culturómica, tal como la proponemos entender, (y de lo que se trata en definitiva estas ideas), se emparenta más con la vieja inducción, en tanto culturonomía estaría del otro lado, junto a su complemento también problemático: la deducción.

Comentarios

Deja un comentario