Precision

PrEciSi贸N: Medida de Recuperaci贸n de informaci贸n

La recuperaci贸n de informaci贸n La precisi贸n Origen de la precisi贸n Enlaces de interés

LA RECUPERACI脫N DE INFORMACI脫N

El funcionamiento de un sistema de recuperaci贸n de informaci贸n est谩 condicionado por su eficacia y por el grado en que satisface las necesidades de sus usuarios.

En una operaci贸n de recuperaci贸n de informaci贸n, un usuario recupera un conjunto de documentos, de los cuales unos le van a ser relevantes y otros no. El usuario adem谩s dejar谩 de recuperar otro conjunto de documentos relevantes y otro conjunto de documentos irrelevantes.

Uno de los problemas que surgen en la recuperaci贸n de informaci贸n es la abundancia o carencia de informaci贸n, cuando lo que recuperamos es mucho o poco. Dependiendo del tipo de b煤squeda se pueden recuperar multitud de documentos o simplemente un n煤mero muy reducido.
A estos fen贸menos se les denomina Silencio (documentos relevantes no recuperados) o Ruido (documentos no relevantes recuperados) documental.

Para conocer en qu茅 medida el sistema de recuperaci贸n responde a las peticiones de sus usuarios se utilizan medidas de recuperaci贸n de informaci贸n:

  • La EXHAUSTIVIDAD o RECALL
  • La PRECISI脫N

La utilizaci贸n conjunta de estas dos medidas muestra la capacidad de filtro del sistema y da una idea amplia de la eficacia del mismo.

LA PRECISI脫N

La precisi贸n (Precision) refleja la eficacia de las b煤squedas, es una medida basada en la relevancia. Se puede definir como la capacidad que tiene el sistema de b煤squeda en coordinar la ecuaci贸n con los documentos m谩s relevantes, es decir, los documentos relevantes recuperados.

Para calcular esta medida se utiliza la raz贸n o tasa de precisi贸n, coeficiente que surge de dividir el n锟絤ero de documentos relevantes recuperados, sobre el n煤mero total de documentos de la colecci贸n. Esta medida es mucho m谩s sencilla que la exhaustividad o recall ya que en la exhaustividad el usuario desconoce el n煤mero total de documentos relevantes que tiene la colecci贸n o base de datos.

Esta medida es inversamente proporcional a la exhaustividad. Emp铆ricamente se ha demostrado (Ley de Cleverdon) que ambas medidas, exhaustividad y precisi贸n tienden a relacionarse inversamente. Si se intenta aumentar el valor de una, el de la otra disminuye lo que quiere decir que ninguna medida puede ser considerada dependiente de otra, ambas dependen del propio proceso de recuperaci贸n. El punto de equilibrio deseable depende de las necesidades del usuario

Tasa de precision

C锟絣culo de la Tasa de Precisi锟絥

La precisi贸n suele expresarse en un rango que oscila entre 0 y 1, aunque tambi茅n podr铆an expresarse en tanto por ciento. Los valores de la precisi贸n en la recuperaci贸n de informaci贸n variar谩n seg煤n los par谩metros del sistema como pueden ser la cualificaci贸n del documentalista que interroga la base de datos, la calidad del lenguaje documental, la sofisticaci贸n del programa inform谩tico

ORIGEN DE LA PRECISI脫N

Esta medida fue originalmente propuesta en 1955 por Kent como Factor de pertinencia, entendiendo por pertinencia la medida de c贸mo un documento se ajusta a una necesidad informativa.

Para otros autores:

  • Salton:la precisi贸n es la proporci贸n de material recuperado realmente relevante, del total de los documentos recuperados.
  • Frakes: a帽ade que el resultado de esta operaci贸n est谩 entre 0 y 1. As铆,la recuperaci贸n perfecta es en la que 煤nicamente se recuperan los documentos relevantes y por lo tanto tiene un valor de 1.
  • En 1983 Salton y MacGill, sugirieron un m茅todo para la evaluaci贸n del sistema proponiendo salidas ordenadas de los documentos en las respuestas. De este modo, la precisi贸n y la exhaustividad depend铆an del valor de corte, es decir, del punto a partir del cual se considera que al usuario ya no le interesan los documentos.
  • Este criterio Blair lo denomina punto de futilidad. La precisi贸n y la exhaustividad se calcula para cada posici贸n en la lista de documentos recuperados.

La recuperaci贸n de informaci贸n La precisi贸n Origen de la precisi贸n


Enlaces de inter茅s

Introducci贸n al posicionamiento Bombing Posicionamiento web
"DMOZ" Optimizaci锟絥 web
Exhaustividad Informaci贸n sobre accesibilidad para ciegos
Agente de b锟絪quedas Guia XML


Esta p谩gina ha sido realizada por Elena Ponce de Landaburu para la asignatura de Sistemas Avanzados de Recuperaci贸n de Informaci贸n (SARI), asignatura impartida en la Licenciatura de Documentaci贸n de la Universidad Carlos III de Madrid

脷ltima actualizaci贸n a fecha de 5 de Junio de 2008

Comentarios y sugerencias

Universidad Carlos III Contador Valid HTML 4.01 Transitional
Mi curriculum Vitae
Google