martes, 6 de noviembre de 2012

El “Twext” mining



La minería de texto es la búsqueda, en el profundo mundo de la información, de aquella que cuente con mayor calidad. Como decía el filósofo alemán Friederich Nietzsche,  “larga es la experiencia de los pozos profundos, se tarda mucho tiempo en saber qué cayó en sus profundidades”[1], y de lo que se trata es de averiguarlo a la mayor brevedad, porque en twitter el tiempo va casi más rápido que en la vida real. Las noticias se suceden vertiginosamente, las tendencias cambian sin parar, siendo en cada punto del planeta completamente equidistantes y para los profesionales de la información recuperar de entre tanto ruido algo puede resultar harto difícil.  Para solucionarlo se recurre, como casi siempre, a la ciencia y a la creación de patrones estadísticos que buscan, como bien dice el artículo de Fernando Santamaría en su blog[2],  a partir de tres aspectos: relevancia, novedad e interés. Originariamente, se buscaba únicamente por palabras, pero con la evolución de las tecnologías es posible buscar por el contenido, por la información en sí. En conclusión, que cada vez es más fácil llegar al meollo de este pozo.


[1] NIETZSCHE, F., Así habló Zaratustra. Madrid, cátedra, 2009.
[2] http://fernandosantamaria.com/blog/2012/01/mineria-de-texto-el-auge-por-el-analisis-textual-y-la-analitica-de-las-interacciones-sociales/

No hay comentarios:

Publicar un comentario