STEMMING EN ESPAÑOL PARA DOCUMENTOS RECUPERADOS DE LA WEB

Cargando...
Miniatura

Fecha

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Mariana
Compartir

Resumen

Descripción

La recuperación de información en internet, hoy en día se ha convertido en una importante área de investigación, debido al crecimiento acelerado de las fuentes de información que en la web se encuentran. La investigación en este campo se ha centrado en crear mecanismos, métodos y herramientas como los algoritmos de stemming y los meta-buscadores, que optimizan la precisión en este tipo de tareas, mejorando así los resultados retornados al usuario que utiliza el sistema. En este artículo se presenta y describe a nivel general, los componentes de un algoritmo denominado Filtro Español, que permite rea-lizar stemming a documentos escritos en español en un sistema de búsqueda web. Este se diseña, con el fin de ampliar automáticamente la búsqueda a todas las variaciones morfológicas de las palabras digitadas por los usuarios en las consultas y el contenido de los documentos. Para validar la eficiencia del analizador, se realizó un cálculo de similitud entre los documentos, aplicando el método de n-gramas. La evaluación contempla la precisión del filtro donde los resultados de la primera valoración son interesantes.

Palabras clave

Búsqueda web, stemming en español, evaluación n-gramas, Web search, stemming in spanish, evaluation n-grams

Citación

URI

Colecciones

Aprobación

Revisión

Complementado por

Referenciado por