tablatablet-to-tabletmoretti-génerosmoretti-grafico-2tablamoretti-distant-readingmoretti-periodizacion-lit-siglo19moretti- literature-map-borgesmoretti-hamletliterature-mapmorettimoretti.mapdrucaroff-librodrucaroff-fotola-literatura-vista-desde-lejos-morettimoretti-stanfordmoretti-stnfordFranco_Morettimoretti-ngramfallo-camarainfluenciadoreshastagsword-cloud1mapa76

6. «Distant Reading», teoría y práctica (17/09/2013)

En este teórico revisamos el concepto de «lectura distante» acuñado por Franco Moretti  en el laboratorio de literatura de Stanford, que consiste en el estudio de grandes corpus de textos literarios a partir de su cuantificación y visualización en gráficos, mapas y árboles. En la segunda parte los invitados Damián Silvani y Macos Vanetta, de HackHackersBA, mostraron aplicaciones de análisis textual que llevan el concepto de «lectura distante» a un plano más cotidiano y práctico. Te preguntamos entonces ¿en qué reside para vos la importancia del concepto de lectura distante y cómo lo aplicarías en tu proyecto de Datos o a tus propios intereses? Dejá tu respuesta en la sección» comentarios».

Primera parte: La lectura distante de Franco Moretti

Comenzamos nuestra clase con un poco de humor, pasando uno de nuestros videos favoritos: un monje medieval aprende a usar un códice, pero como no lo logra, otro monje con más experiencia le sirve de “Help desktop” (ayuda de escritorio).

Entendemos que la práctica de la lectura se construye históricamente, y que a medida que varían los dispositivos textuales, varían las maneras de acceder a ellos y también de construir sentido frente a ellos.

tablet-to-tabletFranco_MorettiCreemos que los recientes hallazgos de Franco Moretti respecto de la “lectura distante” deben ser leídos en un momento de cambio en las prácticas de la lectura. Tanto el crecimiento exponencial de la cantidad de información como la variación de los soportes de lectura como los dispositivos de producción, almacenamiento y circulación textual demandan un cambio en el modo de leer propio de la imprenta, al que Moretti denomina “close reading” (lectura cercana) ¿Será la “lectura distante”, es decir, el viraje de la interpretación del texto a la interpretación de mediaciones cuantificadoras el cambio de modo de leer que exige este momento? Nosotros nos encontramos un poco como el monje del video. Expertos en lecturas cercanas, nos consideramos completamente ignorantes en las lides de la lectura distante. Así que comencemos con nuestra re-alfabetización.

Franco Moretti es un catedrático italiano, especialista en literatura, que tiene su centro de trabajo en la Universidad de Stanford (http://litlab.stanford.edu/). Nacido en Roma en 1959 y hermano del famoso director Nanni Moretti, se mudó a Estados Unidos luego de haber brindado un par de conferencias que dejaron sorprendidos a sus pares americanos. Siendo sus antecedentes recientes pero impresionantes, N-gram lo muestra en un nivel de citaciones muy bajo respecto de otros grandes referentes de la crítica literaria como Roland Barthes y Terry Eagleton , pero es el único de los tres cuya referencia asciende y no desciende, lo que resulta significativo.

moretti-ngramAdemás de haber escrito el libro al que hoy nos referimos “La literatura vista desde lejos”, es autor de varios más, entre ellos “Distant Reading”, de reciente aparición. Es precisamente este concepto, el de “lectura distante”, el que hoy reclama nuestra atención, es decir, tomar distancia del objeto como si una cámara de cine se alejara para pasar de un plano detalle a un plano general, de un plano cerrado a otro abierto. O como se suele decir, dejar de mirar el árbol para ver el bosque.
No podemos negar que la idea de tomar distancia para poder examinar un gran corpus de información nos es sumamente atractiva. Y si bien Franco Moretti sitúa sus indagaciones centralmente en el terreno literario, nos interesa más que nada como una nueva forma de leer, muy acorde a los tiempos que corren. La idea de Moretti es muy simple: cuantitivizar la literatura, y leerla en base a tres nuevas disposiciones, provenientes, además, de otras ciencias: la historia cuantitativa, la geografía y la teoría evolutiva. Estas son los gráficos, los mapas y los árboles. Con lo cual, los textos en sí mismos dejan de ser el objeto de la lectura, sino que pasan a serlo estas tres abstracciones, construidas a veces artesanalmente, y a veces con la ayuda del procesamiento informático.

Este cuadro pone en contraste las características de la lectura distante, versus la lectura cercana.

Lectura cercana Lectura distante
Objeto texto modelo
Cantidad limitada abarcadora
Búsqueda original, único recurrencia
Corpus canon totalidad
Actitud del crítico lee, juzga? periodiza, agrupa, relaciona

 

Cuando realizó el Atlas de la literatura europea, Moretti se hizo la siguiente pregunta: ¿cómo desarrollar la tarea del crítico si durante el siglo XIX se publicaron en Europa entre 20.00 y 30.000 novelas? ¿Cuántas podría leer un crítico de ese total? ¿Tal vez unas dos mil? ¿ Qué queda dentro y qué queda fuera de ese corpus? ¿No se define así un tema de poder en el abordaje sesgado de un corpus?

drucaroff-libro

No siempre lo acompañaron a Moretti los programas informáticos. Los primeros gráficos y mapas los hizo a mano. Más tarde incorporó programas de procesamiento textual. ¿Qué busca entonces Moretti en sus gráficos, mapas y árboles?  Busca recurrencias: periodizaciones, distancias, relaciones, agrupamientos. Qué busca el crítico tradicional: originalidades. Por eso su tarea incluye el juicio de valor: buscar la diferencia, lo que se distingue de la masa.  Estos nuevos interrogantes desde ya ponen en tela de juicio el lugar del crítico. ¿Qué deber hacer el crítico hoy en día? ¿Formular juicios de valor que abran o cierren las puertas institucionales de la literatura? ¿O buscar patrones, recurrencias, temáticas e interpretarlas, por ejemplo en relación a un período histórico, o al surgimiento de un nuevo género literario? ´Cómo hará el crítico para dar cuenta de un período de manera cabal si sólo es capaz de leer, mediante el close reading, no más del 1% de su producción?

drucaroff-foto

Un ejemplo local es bastante ilustrativo. La crítica literaria Elsa Drucaroff tardó cinco años en escribir su libro “Los prisioneros de la torre” , donde revisa la producción textual del período de la post-dictadura en Argentina, o sea, la literatura más recientemente producida. Para ello, leyó trescientos libros y consultó quinientos publicados en Argentina entre 2001 y 2007, contó con la colaboración de lectores externos y decidió abrir su libro a todos los escritores, sin establecer jerarquías ni juicios de valor. Aún así, y recibiendo críticas de sus pares por no haber ejercido el juicio de valor ni la canonización que se espera de un crítico clásico, Drucaroff no alcanzó a leer sino un pequeñísimo porcentaje de la narrativa argentina publicada en esos años. Es difícil hacer una cuantificación, pero si en 2012 el 14% de las novedades publicadas pertenecían a la categoría “Literatura argentina”, y suponiendo que en 2007 este porcentaje fuera el mismo, sólo en 2007 se publicaron más de 2000 libros que entran en esa categoría, con lo cual el descomunal esfuerzo de Drucaroff sólo puede cubrir un porcentaje pequeñísimo de la producción del período.

moretti-géneros

El trabajo de Moretti  ya tiene varios años, y sus proyectos abarcan tanto temáticas literarias como informativas. Sus primeros proyectos abarcaron los temas clásicos de la historia de la literatura: periodizaciones y surgimiento de nuevos géneros  en la novela inglesa europea y burguesa del siglo XIX, el estudio de las obras de Shakeaspeare, la melodía en la poesía alemana, y así. Por ejemplo, para  estudiar las obras de Shakespeare usó un programa llamado Docuscope , desarrollado por la Universidad de Carnegie Mellon (desde 1998). Este software puede reconocer más de cuarenta patrones de uso del idioma inglés y agruparlo en más de cien categorías retóricas.

moretti-grafico-2

La metodología de la   lectura distante  permite hacer una lectura de la totalidad de la producción literaria de un período dado, y no simplemente de una parte (que puede ser la mejor, la consagrada, la clásica). Se basa en la construcción de tres tipos de dispositivos: gráficos, mapas y árboles. A partir de ellos Moretti puede hacer tres tipos de operaciones: periodizar (gráficos) y describir ciclos,  localizar y relacionar  (mapas)  y agrupar  o” clusterizar” (árboles) relaciones entre personajes, palabras de alta frecuencia que permiten identificar los sentimientos, colores, lugares mayormente referenciados por todas las novelas de un período.

moretti.map

influenciadores

Aunque la labor literaria de Moretti nos resulta sumamente fascinante, últimamente estamos pensando en una lectura distante personal, viable y cotidiana de  grandes conjuntos textuales trascendentes socialmente o comunicacionalmente empleando los principios de la lectura distante. Por ejemplo, hicimos algunas incursiones en el uso del programa voyant-tools  , un analizador de textos simple basado en la Web para hacer un estudio muy superficial de todo el Martín Fierro (Fierro dice 906 veces “no”, y 14 veces “mujer”, y estas cuantificaciones coinciden en mucho con su enojo social y su soledad). Lu

fallo-camara

ego nos interesó observar el movimiento del #hashtag AudienciaLSCA, que agrupó los twits emitidos durante los dos días de la Audiencia Pública de la Ley de Medios a través del programa Twit Archivist, y por último ensayamos también una nube de palabras del Fallo de Cámara sobre la LSCA.

En consecuencia con esta lectura distante de documentos cercanos y no ficcionales, con significación cultural o social, los HackHackers Damián Silvani y Marcos Vanetta continuaron con su taller de procesamiento de texto bajo las aplicaciones del proyecto Mapa76.info.

 

Segunda Parte: Silvani y Vanetta. Taller de Mapa76.info

mapa76El taller que dieron Silvani y Vanetta consistió en mostrar un proceso para convertir automáticamente  textos desestructurados (lo que nosotros conocemos con el nombre de “texto”) en datos estructurados (lo que nosotros conocemos con el nombre de “tabla”), a fin de generar una visualización de los mismos.

Los programadores trabajaron  en la plataforma mapa76.info usando primero una plataforma de análisis semántico que reconoce determinadas entidades , sea por contexto o por la incorporación de tablas de datos. Como esta aplicación la diseñaron para trabajar con los juicios por la Verdad y la Justicia, las entidades que reconocen están vinculadas a esa demanda. Por ejemplo, nombres de personas, direcciones, algunos verbos “ad hoc” (los más que lamentables “secuestrar”, “matar”, “torturar”).

La aplicación entonces analiza el texto y entrega una tabla de datos estructurados que luego se pasa por la aplicación Open Refine, que limpia la tabla de caracteres erróneos o “typos” y los agrupa en términos similares. Finalmente, el resultado de Open Refine lo subieron a la aplicación Fusion Tables de Google para generar un mapa llamado “gráfico de gravedades”. El que mostraron en clase vinculaba pertenencia a agrupaciones militantes con permanencias en centro de detención. Tiene por objeto averiguar si los militantes de una misma agrupación eran llevados a un mismo centro clandestino de detención.

Actualmente la aplicación está abierta a todos los usuarios al procesamiento de otros documentos, no necesariamente vinculados a los Juicios, aunque con las limitaciones de que las entidades han sido diseñadas para tal fin. Los proyectos futuros incluyen la flexibilidad de las entidades a fin de que cada usuario pueda definir las propias.  Agradecemos muchísimo a los expertos habernos mostrado  sus desarrollos.

Comentarios

  1. InterLink Headline News 2.0

    […] EDIORIAL “DISTANT READING”, TEORÍA Y PRÁCTICA. Editorialista invitada Gabriela Sued .Post original […]

  2. Martín Ríos

    Un teórico con muchos contenidos para desarrollar y practicar. Me gustaron las aplicaciones para agrupar, periodizar. También los mapas y árboles, está bueno ver como la lectura distante simplifica montones de cantidades de datos, antes incontables.

  3. vanina vera- lu 17 a 19hs

    estuve viendo la herramienta mapa76.info, aunque no me registre y la puse en funcionamiento me parece genial que a partir de algunos datos puedan ser volcadas en un gráfico y ordena la info que estamos buscando. Debo confesar que estás herramientas que estamos conociendo me resultan un poco irreal. Pero de todas formas vemos en los medios a veces el impacto de ciertas noticias a nivel mundial así solamente ocurran en argentina.
    Respecto de la lectura distante tiene que ver con una perspectiva o metodología cuantitativa? y en ese caso es posible hacer una comparación con la lectura cercana? si en realidad se parte a partir de datos y no de una experiencia cercana de leer y juzgar. este tipo de lectura de interpretación (matemática en mi opinión) de gráficos y variables , totalizante, me resulta un nivel de abstracción al que me cuesta ingresar.

  4. Maite Varela - Comisión 13

    La lectura distante no sólo es una interesante metodología de análisis, sino que además es necesaria para poder concebir una aproximación del contenido y las variables de las publicaciones de los tiempos actuales, en los que abarcar la totalidad de la información circulante es una tarea imposible de llevar a cabo por un individuo. Considero que la lectura del crítico actual debe ser distante y no de otra forma para que su resultado no se vea afectado por los casos puntuales, nimios entre tanta cantidad de información.

  5. Nahuel Placanica

    Para el análisis de la monumental cantidad de información circulante la lectura distante resulta más que útil. En cada clase, el trabajo alrededor del concepto va ampliando los horizontes de aplicación.

    En ese sentido, el proyecto Mapa76 presentado permitió ilustrar con un ejemplo concreto el concepto (y su yso), además de vincular su utilización no sólo en el procesamiento de datos con fines académicos y/o empresariales sino también en el ámbito social/político

  6. Ana Speier

    El concepto de «Distant Reading» lo veo principalmente como una serie de herramientas metodológicas muy útiles para el análisis de comportamientos o temáticas que son difícilmente abarcables. En mi caso particular, como emprendedora desde hace algunos años y con futuros proyectos independientes, las herramientas me parecen muy útiles para analizar los intereses en una determinada sociedad, la demanda, las tendencias y demás cuestiones que pueden ser significativas a la hora de presentar un producto, ofrecer un servicio y darle una forma que resulte atractiva en determinado momento y lugar.

  7. NAARA CRUZ

    Primero con el trabajo en prácticos de N-Gram y luego con el teórico de Gabriela, uno se da cuenta que aplica el Distant Reading en muchos aspectos y áreas de la vida. A veces no tenemos idea de la cantidad de información y datos a los que estamos expuestos y que luego, se transforman en nuestra base para el análisis de ciertas cuestiones.

    Respecto a la exposición de Mapa 76, hubiera ayudado contar con una conexión a internet que permitiera observar cómo funcionan las herramientas porque hubo varias cosas que no quedaron claras. Sobre todo porque el trabajo de los chicos me parece genial y espero que sea útil, jurídicamente hablando, ya que la información con la que trabajan puede responder muchas preguntas. Me gustaría saber si los datos, además de mostrar el movimiento de los presos, pueden llegar a aplicarse para el rastreo de los hijos nacidos en cautiverio. Eso sería de una gran ayuda para sus familiares.

  8. Nazareno Berríos

    El concepto de lectura distante me pareció interesante ya que uno lo aplica cotidianamente y lo tiene incorporado de una manera tan naturalizada, que analizarlo se vuelve una tarea fascinante. Lo destacado me pareció esta noción de no buscar la originalidad sino un cierto patrón de recurrencia y pensar cuantas obras quedan por fuera expulsadas por los mecanismos de poder y dominación en términos de Moretti. Consideré pertinente esta idea planteada de abrir la mente y simplemente entender que las nuevas generaciones leen de otra manera, no es que no leen, sino que tienen otros intereses, propios de lo hegemónico y generacional.
    En la segunda parte, el pasaje texto-dato resalta la importancia de las nuevas herramientas tecnológicas y maneras de comunicar ideas para expandir el conocimiento y ponerlo al servicio de una determinada causa.

Deja un comentario