Tipos de investigación de información

Tipos de investigación de información

Los diferentes tipos de investigación de información

Trabajamos en una sociedad del conocimiento. Los registros, hechos e informaciones son mucho más importantes que hace medio siglo. Al mismo tiempo hay más y más información disponible, gracias a Internet. Sin embargo, esta información todavía tiene que ser recuperada, y es aquí donde entran los motores de búsqueda. ¿Pero cómo obtienen los datos que generan a su vez? Eso se llama investigación de la información y existen varios tipos de investigación de información. El análisis de datos, también conocido como recuperación de datos, es una disciplina distinta de la informática y la tecnología de la información y es de gran importancia para los motores de búsqueda. Utilizando sistemas de recuperación de información relativamente sofisticados, definen los motivos de tales palabras de búsqueda y localizan los datos apropiados en la consulta de búsqueda. ¿Pero cuáles son estos tipos de investigación de información? Eso es lo que veremos en este artículo.

¿Qué es la investigación de información?

El objetivo de la Recuperación de Información (IR) es hacer automáticamente que los datos almacenados puedan ser buscados. Al igual que la minería de datos, que se utiliza para recuperar estructuras de los conjuntos de datos, la IR se ocupa de extraer otra información de un conjunto de datos. Un motor de búsqueda en Internet es un campo de desarrollo estándar. Allí, los sistemas de gestión de los conocimientos resuelven dos cuestiones fundamentales. En primer lugar, las consultas de los usuarios suelen ser imprecisas y el término de búsqueda introducido está abierto a la interpretación. Por ejemplo, si se busca la palabra “banco”, es posible que se necesite información bancaria general o indicaciones para llegar a la institución financiera más cercana. 

La cuestión se complica porque los propios consumidores no saben exactamente qué tipo de conocimiento quieren utilizar. 

En segundo lugar, el dispositivo no es plenamente consciente de la calidad de la información almacenada. Esto da como resultado resultados erróneos. Ese es el caso, por ejemplo, de los nombres de los nombres o las palabras polisémicas. Además, el sistema de procesamiento de la información también debe revisar la información para proporcionar al usuario un conjunto de datos. Lo ideal, sin embargo, es que la primera prueba tenga la respuesta adecuada a la pregunta del usuario. 

¿Cuáles son los diferentes tipos de investigación de información?

Hay diferentes modelos de búsqueda de conocimiento. No se mezclan automáticamente, pero se podrían combinar. Hoy en día, hay muchos modelos de este tipo, algunos de los cuales difieren sólo en los detalles. Sin embargo, pueden ser separados en tres categorías específicas.

Tipos de investigación de información

Modelo booleano

Los motores de búsqueda más conocidos de la web se basan en el principio booleano. Son enlaces lógicos que permiten a los usuarios refinar la búsqueda. Con Y, O o NO (AND, OR, O, NOT) o los símbolos correspondientes ∧, ∨ o ¬ se puede especificar una consulta, por ejemplo, si ambos términos deben aparecer en el resultado, o si el contenido con un determinado término debe ser ocultado. Este principio también es seguido por los operadores de Google. La desventaja de este sistema es que no proporciona ninguna clasificación de los resultados. Un orden según la utilidad tiene sentido, pero el método proporciona un orden aleatorio.

Modelo espacial vectorial

En un enfoque matemático, el contenido también puede ser representado como vectores. En el modelo de vectores espaciales, los términos están mapeados como ejes de coordenadas. Los documentos y las consultas de búsqueda reciben valores específicos en relación con el término y, por lo tanto, pueden visualizarse como puntos o vectores en el espacio vectorial. Los dos vectores se comparan entonces entre sí. El vector (es decir, el contenido) que más se asemeje al de la consulta de búsqueda debe aparecer en primer lugar en la clasificación de los resultados. La desventaja aquí es que ningún término puede ser excluido sin los operadores booleanos.

Modelo probabilístico

El modelo probabilístico se basa en la teoría de la probabilidad. Se asigna un valor de probabilidad a cada contenido. Los resultados se clasifican según la probabilidad con la que corresponden a la intención de la investigación. El modelo utiliza lo que se denomina retroalimentación de relevancia para determinar la probabilidad de que un determinado contenido cumpla los deseos del usuario. Por ejemplo, se pide a los usuarios que evalúen los resultados manualmente. En la siguiente consulta idéntica, la plantilla muestra una lista diferente (y posiblemente mejor) de resultados. La desventaja de este procedimiento es que se basa en dos condiciones que no son seguras. Por un lado, el modelo supone que los usuarios están dispuestos a participar en el sistema a través de su retroalimentación. Por otra parte, la teoría supone que los usuarios ven los resultados independientemente unos de otros, es decir, evalúan cada contenido como si fuera el primero que leen en relación con la consulta de búsqueda. Sin embargo, en la práctica, los investigadores siempre evalúan la utilidad de la información basándose en el contenido que ya ha sido consultado.