Un algoritmo es capaz de predecir si una novela será un éxito o un fracaso
Todos los escritores y periodistas (y también muchos de los que no lo son) conocen perfectamente el llamado síndrome de la página en blanco, esa especie de vértigo que se siente al sentarse a escribir cuando no se sabe por dónde empezar y la ausencia de texto resulta amenazadora. Pero una vez terminado el trabajo, no desaparece de todo la sensación de ansiedad. ¿Gustará mi escrito? Al ser la literatura algo tan personal, resulta imposible predecir el éxito, más allá de la intuición de los editores veteranos, que tras muchos años de manejar manuscritos, se las saben todas.
Pero esos sabios del mundo editorial podrían tener a partir de ahora competencia, o, si lo vemos de otra forma, una nueva herramienta de trabajo. Un estudio de la Stony Brook University, en Nueva York, y que ha contado con el apoyo de Google, ha desarrollado un algoritmo que puede predecir la popularidad de un libro utilizando una técnica denominada estilometría estadística, es decir, un análisis matemático de su léxico y su gramática.
“Predecir el éxito de un trabajo literario es un dilema tanto para los editores como para los aspirantes a escritor”, explica la profesora Yejin Choi, directora del estudio. “Lo que hemos hecho es analizar la conexión cuantitativa entre el estilo de escritura y el éxito literario”.
¿Puede la estadística predecir un éxito de ventas?
Basándose en novelas de distintos géneros, han investigado cuál es el potencial de la estadística para distinguir los trabajos que fueron efectivamente un éxito y también qué elementos estilísticos eran más comunes en ellos.
La lógica indica que entre los factores a tener en cuenta están el interés del libro, su novedad, el estilo de escritura así como lo adictiva que resulte la historia (si engancha o no engancha), aunque hay cuestiones ajenas al propio libro, como reconocen los autores del estudio, como el contexto social o la suerte, que tienen tanto o más peso como las cuestiones internas. Una explicación a por qué, a veces, libros literariamente mediocres son un éxito popular.
Para llevar a cabo su análisis, descargaron 800 títulos de Proyecto Gutenberg, una de las mayores colecciones de ebooks gratuitos que se puede encontrar en internet, incluyendo títulos de los siguientes ocho géneros: aventura, misterio, ficción histórica, ficción, ciencia ficción, romántica, novela breve y poesía.
En el intento por hacer su análisis extensivo a todas las novelas, también incluyeron algunas obras que no se encuentran dentro de Gutenberg, como Don Quijote de la Mancha, de Miguel de Cervantes (y que ocupa el primer puesto entre las novelas de éxito), El viejo y el mar, de Ernest Hemingway, Historia de dos ciudades, de Charles Dickens o El símbolo perdido, de Dan Brown.
Un acierto del 84% en la predicción de éxito
De cada novela, los investigadores analizaron las primeras mil frases, y realizaron un análisis sistemático de su léxico y propiedades sintácticas, algo que se hace en lingüística computacional para determinar, por ejemplo, la autoría de un texto en casos de demandas por plagio, cuál es el sexo del autor o si escribe o no en su lengua materna.
Determinaron el éxito de cada novela creando un algoritmo que asignaba valores según si el escritor había utilizado frases cortas o se decantaba por las subordinadas con conectores, si predominaban las expresiones positivas o negativas, los lugares comunes, o del tipo de sintaxis, y luego compararon el resultado con la popularidad real de cada uno de los títulos, determinada a partir del número de descargas de cada título, así como si habían recibido premios importantes, como un Pulitzer o un Nobel. Incluyeron también guiones cinematográficos, en cuyo caso el éxito se definía por el número de reseñas positivas recibidas en la página web especializada IMDB.
Según el estudio publicado, el acierto del algoritmo para predecir la popularidad de los títulos era del 84%. Cuando lo analizado era un guión de una película, el acierto aumentaba hasta el 89% de los casos.
Fuera tópicos y el exceso de verbos
Ya que el análisis estadístico parece poder predecir si una novela será o no un éxito, ¿algún consejo para los escritores? No parece que un análisis computacional sea el mejor consejero literario, pero por si alguien quiere algunas claves, estas son algunas de las conclusiones que sacó el equipo de Choi.
Por ejemplo, el estudio asegura que las novelas consideradas exitosas tienden a emplear frases subordinadas, con conectores como “y” o “pero”, así como más determinantes, pronombres, nombres y adjetivos, mientras que las que se encuentran entre las menos populares utilizan más verbos y adverbios, así como un mayor número de palabras extranjeras.
Estas últimas también tiran más de palabras tópicas y clichés (“amor”), expresiones más extremas (“sin palabras”) y de significado negativo (“herido”).
Otra de sus conclusiones es que los verbos que describen directamente acciones y emociones (como “coger”, “prometer”, “llorar” o “reír”) son más habituales en las novelas con menos éxito, mientras los que describen el proceso de pensar (como “recordar” o “reconocer”) son más habituales en las de gran popularidad.
Sin embargo, si hay algún escritor en potencia leyendo este artículo, que se tome todos estos trucos con cautela, puesto que el análisis se realizó sobre novelas escritas en inglés y no hay que olvidar que cada idioma y cada literatura tienen su propio estilo.
No hay comentarios:
Publicar un comentario