Medidas de Evaluación de los Sistemas Recuperación de Información web


La EXHAUSTIVIDAD o Recall

   

 Webs Relacionadas...



 Para saber más...







 Nº Visitas
Contador de visitas









RSS

RSS

Validador de paginas web

 

En qué contexto se halla la Exhaustividad o Recall ?

La Exhaustividad o Recall, se encaja dentro de la Recuperacion de información, como medida y tasa de medición del rendimiento de los buscadores, en la recuperación de información.

Qué es la Exhaustividad o Recall ?

La Exhaustividad: es la cualidad de un sistema de información para recuperar la totalidad de los documentos relevantes respecto al total de los existentes en el sistema, conforme a los requerimientos establecidos en la estrategia de búsqueda.

Es una herramienta, además de una medida de rendimiento, de los sistemas de recuperación de información (buscadores), para ofrecer respuestas lo mas pertinentes, precisas, oportunas, encajadas y relevantes, a la búsqueda de información, a la necesidad de información que el usuario plantea.

Y también la definiremos, como el cálculo de la relevancia que hacen los buscadores y servidores para ordenar los documentos recuperados, se representa mediante una formula matemática Recall=r/R x 100 = %, donde el número total de documentos relevantes que contiene el sistema, recuperados o no, es "R", y el número de documentos relevantes recuperados es "r",por 100 porque es una medida expresada en %.

Qué más podemos saber relacionado a la Exhaustividad o Recall ?

También nos interesa saber cómo y cuándo es un documento relevante, pertinente, exhaustiva, para los buscadores y servidores, respondiendo con esa requerida exhaustividad a la pregunta realizada por el usuario. Aquello que hace que entre otros factores aparezca entre los primeros resultados, el enlace, web o documento, que necesitamos como información. También si hacemos una web, nos interesa conocer qué factores influyen para que un buscador nos encuentre y nos posicionemos bien, como resultados exhaustivos, a la demanda informativa.

Los buscadores valoran como documentos o webs relevantes, aquellos que:

  1. contienen en la URL, las palabras de búsqueda
  2. contienen en el título, las palabras de búsqueda
  3. contienen en el su contenido, las palabras de búsqueda
  4. contienen las palabras de la búsqueda, en las etiquetas meta, o keywords
  5. son páginas con interfaces claras, buenos textos, actualizadas, con credibilidad, usabilidad, visibles y accesibles
  6. contienen enlaces interesantes, utiles y que funcionan
  7. que no contienen contraseñas, ficheros no procesables, redireccionamientos, flash...
  8. están apuntados desde muchas otras webs, que tienen un buen Pagerank
  9. pero ante todo, valorarán a aquellos que responden con mayor exhaustividad y pertinencia, a la pregunta formulada

La medida Recall suele ir acompañada para la recuperación de información, de otra medida como es la "Precision" = (r/r+n) x 100 = %, donde "r" es el número de documentos relevantes recuperados, y el de no relevantes pero recuperados, es "n". Y aunque en Internet es imposible saber cuantos documentos son relevantes a la pregunta que establecemos, por la inmensa cantidad de ellos que existen en la red de redes, una sola medida precision-recall medirá la calidad del algoritmo de recuperación. Ambos se representarán mediante gráficos de Precisión Recall.

Algunas Conclusiones.........

  1. Existen distintas y variadas técnicas y medidas de evaluación de un sistema de recuperación de información, de un buscador.
  2. Es necesario que para evaluar un sistema de recuperación (y en este caso, su exhaustividad) las técnicas y medidas, estén estandarizadas, ellos ayudará que las distintas medidas llevadas a cabo por distintos evaluadores sean lo mas parejas y concurrentes.
  3. El conjunto de métricas para la evaluación de sistemas de recuperación por muchos expertos dice ser:
    1. El Retardo = Intervalo de tiempo transcurrido desde que se hace la demanda hasta que se da la respuesta.
    2. La Presentación = El formato físico de la salida del sistema.
    3. El Esfuerzo del usuario = El esfuerzo, intelectual o físico que se demanda del usuario.
    4. Y por supuesto valoradas como entre las más importantes,
      La Exhaustividad = Capacidad del sistema de presentar todos los ítems relevantes.
    5. Y La Precisión = Capacidad del sistema de ocultar ítems que no sean relevantes.
    6. Y por último, mencionar que la exhaustividad, viene relacionada también a conceptos como son la pertinencia, el ruido y el silencio, en la busqueda y recuperación de información, como factores claves para el exito en las mismas. y está ligada a otros aspectos relacionados, como son la exhaustividad relativa o el esfuerzo en la recuperación de información.

Es interesante conocer acerca de todas estas cosas de las que te hablo, por ello si quieres puedes consultar los enlaces webs que te propongo....



Elaborado por

Laura Iglesias de Paz

lauraip10@yahoo.es

 

Mi página web sobre la Exhaustividad en la Recuperación de Información, al igual que las webs que enlazo, forman parte de una especie de wikipedia, para la asignatura Sistemas Avanzados de Recuperación de Información, del 2º curso de la Licenciatura en Documentación, en la Universidad Carlos III de Madrid

Universidad Carlos III de Madrid