El canon de Google.

(Texto elaborado en 2008). Google, el buscador de Internet más utilizado del mundo, va a permitirnos establecer el índice de relevancia de un grupo de autores que, en este caso concreto,  se limita a los narradores en lengua española que estaban vivos en 1980. Cuando un usuario introduce un término en Google, un motor de búsqueda rastrea unas ocho mil millones de páginas Web y ofrece en forma de lista de enlaces todas y cada una de las páginas donde el término aparece, así como el número aproximado de las páginas implicadas. La cifra en sí misma es un cuantificador incontestable de la abundancia en Internet de un concepto, por tanto, de su importancia como contenido en la Red. De la comparación de la cifra relativa a cada miembro de un grupo, resulta una lista que ordena a esos miembros, del más importante- el más abundante-, al más secundario, es decir, escaso.

Lo que aquí se ha hecho ha sido anotar el número de apariciones en Google del nombre exacto de 2070 escritores en lengua española de todos los tiempos. La lista de autores ha sido extraída de Wikipedia, una enciclopedia libre on line que en su versión española cuenta con 184.250 artículos. La elección de la fuente no es fortuita. Wikipedia es un proyecto de creación colectiva donde cualquiera puede redactar un nuevo artículo para su publicación, o bien modificar uno existente. Eso quiere decir que cualquier omisión importante es rápidamente detectada y subsanada y, teniendo en cuenta que lo que aquí se pretende es extraer de la larga lista exclusivamente a los 75 escritores más relevantes, no importa tanto que ésta sea incompleta como que no haya ausencias significativas en los niveles superiores. Precisamente por su forma de creación, esto último queda descartado.

Realizamos la búsqueda y se nos muestra a los escritores ordenados por el número de veces que su nombre aparece en la parte de Internet que indexa Google, que es la gran mayoría. De entre ellos, se selecciona a los 75 con mayor número de entradas, los vivos en 1980 cuya dedicación fundamental sea la prosa literaria, ya sea en forma de narrativa o ensayo. Con ello se pretende proponer un canon: escritores en lengua española de prosa literaria de la actualidad (últimos 25 años). Como es lógico, cualquier otro corte hubiera sido posible como, por ejemplo, poetas españoles de los últimos cien años, escritores ingleses de la última década, etc.

La lista resultante es la siguiente:

Autores                                        nº entradas  

Gabriel García Márquez

2010000

Jorge Luís Borges

1780000

Isabel Allende

1550000

Mario Vargas Llosa

1340000

Julio Cortázar

1240000

Octavio Paz

1170000

Alejandro Jodorowsky

1120000

Carlos Ruiz Zafón

1020000

Carlos Fuentes

1010000

Camilo José Cela

906000

Arturo Pérez-Reverte

864000

Mario Benedetti

744000

Juan Rulfo

615000

Alejo Carpentier

497000

Ernesto Sabato

397000

Fernando Savater

375000

Javier Marías

365000

Eduardo Mendoza

345000

María Zambrano

344000

Manuel Vázquez Montalbán

310000

Roberto Bolaño

307000

Miguel Delibes

307000

Laura Esquivel

296000

Antonio Gala

294000

Juan Goytisolo

282000

Francisco Ayala

267000

Elena Poniatowska

265000

Rosa Montero

255000

Manuel Rivas

249000

Carlos Monsiváis

240000

Francisco Umbral

230000

Jorge Bucay

228000

Manuel Puig

228000

Juan José Millás

227000

Adolfo Bioy Casares

223000

Álvaro Pombo

209000

Reinaldo Arenas

205000

Almudena Grandes

189000

Antonio Muñoz Molina

188000

Tomás Eloy Martínez

182000

Carmen Martín Gaite

175000

Juan Carlos Onetti

174000

Álvaro Mutis

172000

Guillermo Cabrera Infante

162000

Juan Marsé

160000

Zoé Valdés

159000

Juan Manuel de Prada

155000

Augusto Monterroso

154000

Enrique Vila-Matas

153000

Elvira Lindo

141000

José Donoso

138000

Carmen Posadas

134000

Alfredo Bryce Echenique

133000

Félix de Azúa

131000

José Antonio Marina

129000

José Luis Sampedro

129000

Alberto Fuguet

123000

Fernando Vallejo

121000

Ana María Matute

120000

Álvaro Cunqueiro

116000

Miguel Serrano

116000

Gregorio Martínez

115000

Gonzalo Torrente Ballester

110000

José Emilio Pacheco

109000

Juan José Arreola

106000

Mempo Giardinelli

106000

Ray Loriga

101000

Ramón J. Sender

98600

Lorenzo Silva

94900

Luis Antonio de Villena

91900

Osvaldo Soriano

91800

Jorge Volpi

91600

Francisco Coloane

90600

Manuel Vicent

90500

Juan Villoro

90400

Antes de tomar en cuenta estos datos como un canon objetivo, conviene señalar algunas de las características y limitaciones del procedimiento. La objeción principal es técnica y se fundamenta en lo que se llama “ruido” de la búsqueda. Por ruido entendemos, entre otras cosas, todas las veces que Google indexa una página que contiene el término exacto de la búsqueda, pero dicho término alude a un referente diferente al deseado. En otras palabras; si buscamos “Juan Ruiz”, nombre de un hipotético escritor, Google indexa todas la veces que aparece “Juan Ruiz” en Internet, sin que exista posibilidad de discernir entre los “Juan Ruiz” escritor y los otros cientos de miles de “Juan Ruiz” que aparezcan en Internet como nombre de otras personas. Cuanto más vulgar sea el nombre de un escritor, más distorsionada al alza quedará la cifra que aquí se tiene en cuenta. “Ruido” para nuestros propósitos son también las veces que un escritor aparece por labores no estrictamente literarias. Si, por ejemplo, Mario Vargas Llosa hubiera ganado unas elecciones, su número de apariciones en Internet aumentaría masivamente al ser citado, además de cómo escritor, como presidente de Perú en su legislatura. Para solventar este handicap se ha depurado la lista de algunos nombres cuya posición era altamente sospechosa por esta o la otra razón. Es innegable que en todas y cada una de las búsquedas hay un porcentaje de ruido, lo que obliga a tomar con cautela la posición de cada autor en la lista, no tanto su presencia. La precisión jerárquica disminuye cuanto menor sea el número de búsquedas que distancian a un escritor del adyacente, y por lo mismo, resulta muy fiable cuanto mayor. Cuando comparamos las entradas de Jorge Luís Borges con las de Carlos Fuentes, y nos encontramos una diferencia de 700.000 entradas entre uno y otro, no hay posibilidad de error. No así con, pongamos por caso, Ray Loriga y Gonzalo Torrente Ballester, cuya diferencia de entradas es demasiado pequeña para ser tenida en cuenta. Una convención extremadamente prudente sería fijar las 100000 entradas como diferencia a partir de la cual puede afirmarse la preeminencia en Internet de un escritor respecto a otro, y tratar en bloque a grupos o parejas de autores cuyas diferencias recíprocas fueran inferiores. Por todo ello puede decirse que tanto la posición como la presencia de los autores de la parte más inferior de la lista es más cuestionable que la del resto, y que tanto la presencia como la posición de los autores en la parte superior es irrebatible. En conjunto se trata una gama de datos que necesitan interpretación. En la vida diaria aceptamos que un personaje es tanto más importante cuanto más se hable de él. En la Teoría, cuánto más se cite, cuánta más crítica genere a su alrededor. Eso es exactamente lo que aquí se está midiendo. Internet no es más que un gigantesco corpus de datos cuyos elementos pueden ser rastreados e inventariados. Aún reconociendo todas las imprecisiones, quedan al descubierto ciertas verdades gruesas que merecen nuestra atención.

La lógica invita a pensar que un escritor es tanto más importante cuanto más se hable de él (no, desde luego, cuánto más se le lea, o los más importantes serían los autores de best-sellers y libros de auto ayuda). Pero ¿Qué significa ser importante en Internet? Desde luego, no significa ser importante para la humanidad. Los autores más importantes de Google no son aquellos cuya obra tiene el valor de ejercer la influencia más positiva y benigna a los que los leen. Sin desmerecer necesariamente en lo anterior, estos escritores se diferencian del resto por aparecer más, literalmente, por estar más presentes y poseer en consecuencia mayor capacidad de influencia. Otras definiciones de importancia son subjetivas y, por tanto, no pueden ser cuantificadas. A efectos reales, y para lo que aquí nos ocupa, carecen de valor, pues cualquier canon se impone desde la cantidad; desde la cantidad de agentes que lo respalda, desde la cantidad de copias de un determinado texto que son asimiladas positivamente, etc, ya sea por imposición o de forma libre y espontánea. El Canon con mayúsculas de una nación o corriente es el que más se difunde, en el que se implican mayor número de agentes culturales y receptores. Dicha difusión y participación deja un rastro textual cuya porción accesible a Google forma parte de la estadística en la que aquí nos basamos. Al indexar no uno, ni varios, sino todos esos rastros textuales, el resultado es un auténtico canon de cánones, que resultaría incuestionable si pudieran salvarse las imprecisiones arriba señaladas.

Algunas estadísticas interesantes:

El canon de Google por países

Renta per cápita de los países aludidos

(Si hacemos caso a estos datos, hay una relación inequívoca entre la situación económica de un país y el peso cuantitativo de su cultura en Internet. No es de extrañar si tenemos en cuenta que Internet exige una infraestructura estatal, empresarial y doméstica, y cuanto más desarrollada está la infraestructura, mayor número de ciudadanos accede Internet y tanto más se incrementan los contenidos y servicios a los que éstos son adeptos. El canon de Google se revela entonces no como una consulta democrática, donde cada participante cuenta con un voto, sino más bien como una oferta pública de compra de acciones, donde las carteras con más liquidez se aseguran una mayor participación y, por tanto, influencia, en la empresa global que podemos llamar Cultura)

El canon de Google por edades (los números de la barra horizontal marcan la década del siglo XX en la que han nacido los escritores)

El canon de Google por sexo (el color azul representa a los hombres, y el púrpura a las mujeres)

Esta entrada fue publicada el 13/02/2012 a las 11:20 am. Se guardó como Crítica, Otros medios y etiquetado como , , , , , , , , , , . Añadir a marcadores el enlace permanente. Sigue todos los comentarios aquí gracias a la fuente RSS para esta entrada.

2 pensamientos en “El canon de Google.

  1. Hola. No se puede desechar los resultados de búsquedas de Google como datos antropológicos o sociológicos pero, en mi opinión, un canon se construye con crítica, es decir, es un discurso sobre discursos. El discurso establece categorías y un buscador en internet es incapaz de hacerlo. Las verdades que pone de manifiesto son, como dices, gruesas, porque es obvio que unos autores se buscan por unas razones y otros por otras. Apuesto que la mayoría de las búsquedas sobre Juan Ruiz, Manrique o Cervantes sirven como ayuda en trabajos académicos y no están tan motivadas por el placer de la literatura.
    Te envío un saludo.

    • Gracias por tu lectura y comentario, Afrendes. Estoy contigo en que un canon no se establece por criterios cuantitativos, sino cualitativos. De hecho, para mí “el canon de Google” no deja de tener ciertas connotaciones poco prestigiosas, en cuanto a que es un canon de mera popularidad documental, de la masa textual que tiene indexado este monstruo de la información que es Google. Con todo, creo que más estudios como este podrían ser interesantes.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: