jueves, 20 de noviembre de 2008

Modelo booleano



En este modelo de recuperación de información se consideran los documentos descritos por un conjunto de términos de indexación, y una consulta puede ser cualquier expresión del álgebra booleana sobre los términos de indexación. El conjunto de documentos recuperados por el sistema serán aquellos documentos cuyos términos de indexación cumplen la consulta.
Veámoslo por medio de un ejemplo. Sea la consulta que intenta recuperar los documentos que contienen el término ka y el término kb o que no contienen a kc. Según el modelo booleano, todos los documentos que cumplan esta condición serán devueltos al usuario con el mismo grado de relevancia. Si hay algún documento que cumpla esta condición de forma parcial, por ejemplo que contenga el término ka pero no cumpla ninguna de las otras dos propiedades, no aparecerá en la respuesta. Igualmente independientemente de si cumplen la condición kb o la o ambas, todos los documentos de la respuesta tendrán la misma relevancia.
Este modelo ha sido muy utilizado porque es muy sencillo de implementar sobre un índice de términos. Su principal desventaja además de que no calcula un grado de relevancia para los documentos de la respuesta, es que puede llevar a formular consultas que devuelven muy pocos (demasiadas operaciones
AND) o demasiados documentos (demasiadas operaciones OR o mala utilización de la negación). Por ejemplo, la consulta devolvería todos los documentos almacenados menos los que contienen el término ka. Lógicamente esta consulta no se puede evaluar.

No hay comentarios: