lunes, septiembre 27, 2010

Sobre la Ley de Zipf

Esta fórmula sirve para saber la frecuencia con la que una palabra aparece en un texto. Algo que puede ser muy útil en literatura.

Como una rama más de la hermenéutica, la Ley de Zipf sirve, básicamente, para contar palabras. Fue formulada en la década de los cuarenta por el lingüista de Harvard George Kingsley Zipf (1902-1950), y afirma que un pequeño número de palabras son utilizadas con mucha frecuencia, mientras que frecuentemente ocurre que un gran número de palabras son poco empleadas.

Para usarla debemos coger un texto con más de 5.000 palabras y, entonces, se calcula cuántas veces aparece una palabra concreta. Se ordena la tabla de palabras de más a menos frecuente. El orden en que aparece cada palabra en esta lista ordenada se llama “rango”.


En el idioma español, por ejemplo, las palabras que encabezan este rango siempre son artículos y preposiciones. En un texto en inglés, la palabra que casi siempre estará en el podium será “the”. Si “La” tiene rango 1, palabras como “oxímoron” o “escible” tendrán un rango altísimo (sobre todo “escible”, que según la RAE es una palabra ya en desuso). No importa lo pedante que seas, esas palabras siempre tendrán rango alto en un texto coherente de más de 5.000 palabras.

En términos matemáticos, la ley se expresa del siguiente modo: el número Y de veces que aparece una palabra es inversamente proporcional a su rango X de forma que Pn= 1/ n elevado a “a”. Otra forma de calcular la Ley de Zipf es contar cuantas veces aparece una palabra y dividirla entre el número total de palabras del texto.

Pero esto no ha hecho más que empezar. Gracias a la digitalización de contenidos, en pocos años es más que posible que dispongamos en Internet de todos los libros y textos que aparezcan en el mercado, como una gigantesca y multiforme Biblioteca de Alejandría formada de ceros y unos.

Cuando esto suceda, se podrá aplicar la ley de Zipf de manera global, idioma por idioma, y generar toda clase de estadísticas. Y más aún: se podrán formular nuevas leyes. Por ejemplo, una ley para calcular la frecuencia de repetición de metáforas, frases, expresiones y hasta, por qué no, grado de creatividad.

Y entonces es posible que descubramos algo asombroso. Algo que cambiará toda la estructura de la literatura, basada en la adjudicación de X texto a X autor, de manera individual. Descubriremos que la originalidad es una entelequia, que la creatividad sólo es la recombinación de cosas ya escritas, que la voz propia sólo es plagio que pasa inadvertido, que los autores individuales no existen, que los derechos de autor no tienen sentido… que la literatura, en suma, es una composición multicapa de memes que los llamados escritores agitan y agitan en sus devaneos posturales incansablemente estéticos.

Al tiempo.

Y así también podremos averiguar qué autores han seguido los consejos y directrices de maestros anteriores, como por ejemplo George Orwell, que sugería esta lista de normas en cualquier texto literario en su Why I write (Por qué escribo):

1. Nunca utilices una metáfora, un símil u otra figura literaria que veas habitualmente en los medios impresos.
2. Nunca utilices una palabra larga cuando una corta sirve igualmente.
3. Si es posible borrar una palabra, bórrala.
4. Nunca uses la voz pasiva si puedes usar la activa.
5. Nunca utilices una frase extranjera, un término científico o jerga si puedes pensar en un término habitual equivalente.
6. Rompe cualquiera de las normas anteriores antes de escribir una barbaridad.


Fuente:
papelenblanco.com

Related Posts Plugin for WordPress, Blogger...