martes, enero 24, 2012

Una imagen vale más que 500 mil millones de palabras

Erez Lieberman Aiden y Jean-Baptiste Michel son dos profesores de la Universidad de Harvard fundadores del proyecto Cultoromics. Un estudio de la lexicología computacional que se interesa en el comportamiento humano y las tendencias culturales a través del análisis de textos digitalizados.


Gracias a los 15 millones de libros escaneados por Google Books y de la adictiva herramienta "n-gramas de Google Labs" que te permite buscar palabras en una base de datos del aproximadamente 4% de todos los libros publicados, Aiden y Michel nos muestran en esta charla TED algunas de los datos sorprendentes que podemos aprender partiendo de 500.000 millones de palabras:





Michel y Aiden ayudaron a crear el Visor Ngram, un modelo n-gram que analiza en los libros de la biblioteca digital de Google los patrones culturales de la lengua a lo largo de 200 años. Herramienta que sirvió para investigaciones que fueron capaces de predecir el efecto de la Primavera Árabe y de calcular el lugar donde se ocultaba Bin Laden con un error de apenas 200 km.

Fuente:
elzo-meridianos.blogspot.com

Related Posts Plugin for WordPress, Blogger...