IPS est Objectif et fonctions des systèmes de recherche d'informations

Table des matières:

IPS est Objectif et fonctions des systèmes de recherche d'informations
IPS est Objectif et fonctions des systèmes de recherche d'informations

Vidéo: IPS est Objectif et fonctions des systèmes de recherche d'informations

Vidéo: IPS est Objectif et fonctions des systèmes de recherche d'informations
Vidéo: Recyclage des trains : une activité rentable 2024, Avril
Anonim

Il est difficile pour une personne moderne d'imaginer la vie sans Internet et sans accès quasi instantané aux sources d'information. L'utilisateur réfléchit rarement à la manière dont la recherche du contenu souhaité sur le réseau est effectuée. Mais c'est très intéressant.

Un système de recherche d'informations (IPS) est un système logiciel et matériel complexe qui sélectionne des informations à la demande de l'utilisateur. Les informations sont stockées sur des serveurs sous forme numérique, comme les livres étaient autrefois sur les étagères des bibliothèques. Le système se compose de plusieurs sous-systèmes. Chacun accomplit sa tâche en traitant la demande de l'utilisateur et en lui fournissant des informations sous forme textuelle ou sonore. La multiplicité des tâches à résoudre détermine la complexité de l'architecture des systèmes modernes de recherche d'information (abréviation de Information Retrieval System). Une sorte de "boîte noire": à l'entrée - le texte de la demande, ce qu'il y a à l'intérieur - est inconnu, à la sortie - des informations complètes.

Fichier de cartes dans la vraie vie
Fichier de cartes dans la vraie vie

Flux d'entrée

Demandes d'informations qu'une personne forme sous forme de texte sur l'écran de son gadget,constituent une petite partie des requêtes traitées par le moteur de recherche. Les principaux tableaux de requêtes de recherche sont formés par des robots qui acceptent une demande humaine et effectuent une recherche en plusieurs étapes et un retour d'information avec l'utilisateur. Les systèmes de récupération d'informations incluent Google, Yandex et d'autres bien connus, traitant des millions de demandes quotidiennement.

Objets de recherche source

L'ensemble des objets initiaux d'intérêt pour la recherche sont des documents, des enregistrements, des vidéos, des images et plus encore. Ils sont créés en dehors de l'IPS. Le système général de stockage et de recherche d'informations devrait avoir un système bibliographique intégré - une sorte de catalogue qui vous permet de rechercher n'importe quel type d'objets.

Les objets ou leurs transformations numériques deviennent une "ressource d'entrée" dans l'IPS. C'est parmi elles que sont sélectionnées les informations dont l'utilisateur a besoin.

Rechercher une information
Rechercher une information

Sources externes

La vue de sélection d'informations utilise des sources de connaissances externes. Ce sont les informations que l'utilisateur recherche. Le titre du film, une citation du livre, et plus encore. Pour une recherche informatique, ces informations doivent être traduites en une requête dans un langage algorithmique. Dans l'IPS, cela se fait à l'aide du bloc de création, d'indexation et de développement de requêtes.

Idéalement, ces trois processus (représentation, indexation et développement de requêtes) devraient s'appuyer sur des sources de connaissances identiques, mais en pratique, cela n'est pas réalisable.

Les sources de connaissances doivent être constamment revues et mises à jour, et la mise à jour doit être identique etsynchronisé. Et une source externe de connaissance précède toujours chronologiquement son utilisation dans les moteurs de recherche pour une requête, parfois de plusieurs années.

Système de recherche d'informations
Système de recherche d'informations

Performances

Les représentations des objets d'origine sont constituées de données d'entrée dans une certaine combinaison ou transformées conformément aux règles et algorithmes d'un système de recherche d'informations particulier.

Les vues sont des copies plus ou moins transformées de l'objet de recherche d'origine. Dans la collection de textes intégraux inédits, chaque texte est sa propre représentation. Dans la collection d'objets d'expositions de musée et d'artefacts, la représentation peut être une description transformée de l'objet avec son image. Dans certains cas, la représentation peut être en partie dérivée de l'objet original et en partie de la description: dans les moteurs de recherche bibliographiques, les représentations sont dérivées de l'objet - par exemple, le titre, le nom de l'auteur seront combinés avec l'annotation de l'œuvre.

Trouver ce dont vous avez besoin
Trouver ce dont vous avez besoin

Index consultable

Étant donné que les informations dans les systèmes de recherche d'informations sont stockées sous la forme d'une représentation, il est logique de supposer que la recherche est effectuée en fonction de la représentation et, après sélection, est donnée à l'utilisateur. En pratique, ce n'est pas le cas. Par exemple, les catalogues de bibliothèques en ligne actuels limitent généralement les recherches à quelques champs: auteur, titre et sous-titres dans une vue qui contient d'autres champs qui ne sont pas recherchés. C'est une raison suffisante pour qu'il faille distinguerune vue et un index de recherche, qui est la partie recherche de la vue. Il définit tout ce qui doit être consultable. Un index consultable, comme la vue et l'objet source, peut être divisé en sous-index distincts pour fournir des recherches ciblées plus précises

Les moteurs de recherche ont généralement une structure synthétique en interne pour faire correspondre les résultats de recherche valides. Cette structure est le deuxième composant de l'index de recherche.

Procéduralement, le processus d'indexation peut être mis en œuvre de différentes manières: un index consultable peut être obtenu par:

  • copier littéralement une représentation interrogeable;
  • en copiant les détails de la vue. Il peut s'agir d'une partie ou de la totalité des vues qui n'existent physiquement que sous forme de fragments, distribués selon les règles de création d'un index de recherche, qui seront collectés si nécessaire.
Gestion de la recherche
Gestion de la recherche

Règles de conception des demandes et demandes formelles

L'ingénierie des requêtes est une fonction qui sert d'intermédiaire entre une requête utilisateur et une requête formelle. Il transforme la requête de l'utilisateur en la faisant correspondre aux dictionnaires de commandes de récupération, à la spécification d'index et à l'index avant la récupération. A l'aube du développement d'IPS, ce rôle était traditionnellement confié à des informaticiens qualifiés.

Le développement de requêtes informatiques pouvant faire correspondre des requêtes de dictionnaire dans un système d'indexation interrogeable est communément appelé le module "d'entrée de dictionnaire". L'automatisation de cette fonction est prometteuse et offre des opportunités pour des méthodes de recherche expertes et probabilistes.

Une requête formelle devient une requête formelle une fois que la requête de l'utilisateur a été convertie. Des exemples de telles transformations formelles incluent la troncature, la substitution, la normalisation, la vectorisation et d'autres transformations de la représentation "externe" en représentations "internes" de l'ordinateur IPS (décryptage - système de recherche d'informations).

Ensembles de liens de documents extraits

L'ensemble de sources d'information résultant est logiquement un sous-ensemble des vues créées par les règles de correspondance appliquées à la requête formelle par un index interrogeable.

Habituellement, mais pas nécessairement, il existe un processus de tri séparé pour l'ensemble d'informations récupéré. Les catalogues de bibliothèques en ligne réorganisent généralement les ensembles reçus par ordre alphabétique d'auteur avant de les afficher. Dans les systèmes de recherche d'informations qui produisent des classements stricts, l'ordre de classement précède toute réorganisation.

L'analyse des données
L'analyse des données

Flux de sortie

La sortie des résultats de la recherche se fait traditionnellement sur l'écran, le plus souvent sous la forme d'un flux d'objets à utiliser ailleurs ou à d'autres fins, complète la boucle de recherche principale. Ces flux peuvent être envoyés à des dispositifs de visualisation, stockage pour un traitement ultérieur ou utilisation comme flux d'entrée vers d'autres services de sélection.

Les systèmes de recherche d'informations permettent un retour d'informationsrésultat de tout processus de sélection. La sortie de tout processus peut être une rétroaction vers d'autres processus. Les commentaires peuvent fournir la base d'un jugement d'expert à n'importe quelle étape.

Conseillé: