VISITAS:

martes, 9 de junio de 2009

Búsquedas conceptuales utilizando WordNet

1.Introducción
Cuando se realiza una búsqueda en un motor de búsqueda tradicional se introducen una serie de palabras clave (cadena de búsqueda) y el motor nos devuelve una gran cantidad de páginas como resultado. Estas páginas están ordenadas según su relevancia (cada motor tiene su propio algoritmo para determinar la relevancia de cada página resultado).
Hay dos problemas con los buscadores tradicionales:



  1. algunas páginas resultado no son relevantes (no interesan al usuario)

  2. las páginas no se agrupan por contenidos similares


El primer problema se puede resolver extendiendo la cadena de búsqueda, para que los resultados tengan mayor precisión, es decir, se acerquen más a lo que está buscando el usuario.



El segundo problema se puede resolver analizando los resultados obtenidos y calsificándolos según la ocurrencia o no de términos relevantes.



Para ambos problemas podemos utilizar WordNet. WordNet es una base de datos de conceptos. Cada concepto contiene la palabra o palabras con las que se expresa el concepto. Además, los conceptos se relacionan entre sí mediante relaciones conceptuales (herencia, composición, etc.). Cuando una palabra tiene múltiples significados, aparecerá asociada a múltiples conceptos.



2.Búsqueda inteligente



Con la información disponible en WordNet podemos mejorar los resultados de los buscadores tradicionales de dos modos:




  1. antes de la búsqueda: especificando el concepto exacto que se quiere buscar (en lugar de especificar la palabra)

  2. después de la búsqueda: clasificando los resultados obtenidos (agrupando los resultados en función del concepto del que se habla)


2.1 Mejora antes de la búsqueda

Cuando el usuario escribe una palabra a buscar, el sistema le presenta la opción de elegir entre todos los conceptos asociados a esa palabra (utilizando los conceptos asociados a una palabra en WordNet). Se muestra para cada concepto su definición y un ejemplo de uso, para facilitar su elección. El usuario puede elegir uno de estos conceptos o bien buscar todos los sentidos.


Cuando el usuario elige un concepto determinado, la cadena de búsqueda se expande utilizando la información que almacena WordNet. La cadena de búsqueda extendida se envía al buscador para que retorne únicamente resultados que están asociados al concepto seleccionado.

Para extender la cadena de búsqueda se añaden las palabras asociadas al mismo concepto (sinónimos), después se añaden las palabras asociadas a los conceptos hipónimos (conceptos hijos en herencia). Si no existieran conceptos hipónimos, se utilizarían las palabras de los conceptos hipérnimos (conceptos padre en herencia).

2.2 Mejora después de la búsqueda
Cuando el usuario no selecciona ningún concepto antes de la búsqueda, la cadena de búsqueda original se lanza como tal al motor de búsqueda. Los resultados se clasificarán según la información disponible en WordNet.
Junto a los resultados de la búsqueda, se mostrarán los conceptos asociados a la palabra buscada.

Pinchando sobre uno de esos conceptos, se expandirá la búsqueda para filtrar por dicho concepto.

No hay comentarios:

Publicar un comentario