Maison / Travailler sur Internet / Utilisé pour rechercher des informations sur Internet. Conseils efficaces pour trouver des informations sur Internet. Le concept de moteur de recherche

Utilisé pour rechercher des informations sur Internet. Conseils efficaces pour trouver des informations sur Internet. Le concept de moteur de recherche

RECHERCHE PROFESSIONNELLE D'INFORMATIONS SUR INTERNET

La recherche sur Internet est un élément important du travail sur le Web. Le nombre exact de ressources Web internet moderne presque personne ne le sait avec certitude. Dans tous les cas, la facture se chiffre en milliards. Afin de pouvoir utiliser l'information dont on a besoin à ce moment précis, que ce soit à des fins professionnelles ou de divertissement, il faut d'abord la trouver dans cet océan de ressources constamment renouvelé.

Pour qu'une recherche sur Internet aboutisse, deux conditions doivent être remplies : les requêtes doivent être bien formulées et elles doivent être posées aux endroits appropriés. En d'autres termes, l'utilisateur doit, d'une part, pouvoir traduire ses intérêts de recherche dans la langue de la requête de recherche, et d'autre part, bonne connaissance les moteurs de recherche, les outils de recherche disponibles, leurs avantages et leurs inconvénients, ce qui vous permettra de choisir les outils de recherche les plus appropriés dans chaque cas spécifique.

À l'heure actuelle, aucune ressource ne satisfait à toutes les exigences de la recherche sur Internet. Par conséquent, avec une approche sérieuse de la recherche, vous devez inévitablement utiliser différents outils, en utilisant chacun dans le cas le plus approprié.

Principal outils de recherche internetpeuvent être divisés en groupes principaux suivants :

moteurs de recherche;

répertoires Web;

Ressources de référence ;

Programmes locaux pour effectuer des recherches sur Internet.

Le moteur de recherche le plus populaire estmoteurs de recherche- les soi-disant moteurs de recherche Internet (Search Engines). Les trois premiers leaders à l'échelle mondiale sont assez stables - ce sont Google, Yahoo! et Bing. De nombreux pays ajoutent à cette liste leurs propres moteurs de recherche locaux optimisés pour le contenu local. Avec leur aide, en théorie, vous pouvez trouver n'importe quel mot spécifique sur les pages de plusieurs millions de sites. Du point de vue de l'utilisateur, le principal inconvénient des moteurs de recherche est la présence inévitablebruit d'informationdans les résultats. C'est ainsi qu'il est d'usage d'appeler des résultats qui, pour une raison ou une autre, sont inclus dans la liste des résultats qui ne correspondent pas à la requête.

Malgré de nombreuses différences, tous les moteurs de recherche Internet fonctionnent sur des principes similaires et, d'un point de vue technique, sont constitués de sous-systèmes similaires. La première partie structurelle du moteur de recherche est constituée de programmes spéciaux utilisés pour recherche automatique et l'indexation ultérieure des pages Web. Ces programmes sont généralement appelés spiders ou bots. Ils regardent le code des pages Web, trouvent des liens qui s'y trouvent et découvrent ainsi de nouvelles pages Web. Il y a aussi manière alternative inclusion du site dans l'index. De nombreux moteurs de recherche offrent aux propriétaires de ressources la possibilité d'ajouter eux-mêmes un site à leur base de données. Quoi qu'il en soit, les pages Web sont téléchargées, analysées et indexées. Ils se démarquent éléments structurels, des mots-clés sont trouvés, leurs liens avec d'autres sites et pages web sont déterminés. D'autres opérations sont également effectuées, dont le résultat est la formation de la base d'indexation du moteur de recherche. Cette base est le deuxième élément principal de tout moteur de recherche. Actuellement, il n'existe aucune base de données d'index absolument complète qui contiendrait des informations sur tout le contenu d'Internet. Étant donné que différents moteurs de recherche utilisent différents programmes de recherche de pages Web et construisent leur index à l'aide d'algorithmes différents, les bases d'index des moteurs de recherche peuvent varier considérablement. Certains sites sont indexés par plusieurs moteurs de recherche, mais il y a toujours un certain pourcentage de ressources incluses dans la base de données d'un seul moteur de recherche. Le fait que chaque moteur de recherche ait une partie de l'index aussi originale et non chevauchante vous permet de faire une conclusion pratique importante : si vous n'utilisez qu'un seul moteur de recherche, même le plus grand, vous perdrez certainement un certain pourcentage de liens utiles. .

La partie suivante du moteur de recherche Internet est le programme de recherche et de tri proprement dit. Ces programmes résolvent deux tâches principales : premièrement, ils trouvent des pages et des fichiers dans la base de données qui correspondent à la requête entrante, puis ils trient le tableau de données résultant selon divers critères. Le succès dans la réalisation des objectifs de la recherche dépend en grande partie de l'efficacité de leur travail.

Le dernier élément d'un moteur de recherche sur Internet est l'interface utilisateur. Outre les exigences habituelles d'esthétique et de praticité pour tout site, les interfaces des moteurs de recherche ont une autre exigence importante : elles doivent proposer divers outils de compilation et d'affinement des requêtes, ainsi que de tri et de filtrage des résultats. Les avantages des moteurs de recherche sont une excellente couverture des sources, une mise à jour relativement rapide du contenu de la base de données et un bon choix caractéristiques supplémentaires.

L'outil principal pour travailler avec les moteurs de recherche est une requête.

Les recherches sur Internet sont également utilisées applications spéciales installé sur ordinateur local. Ça pourrait être comme programmes simples, et des complexes assez complexes de recherche et d'analyse de données. Les plug-ins de navigateur les plus courants sont les plug-ins de navigateur, les panneaux de navigateur conçus pour fonctionner avec un service de recherche spécifique et les packages de métarecherche dotés de capacités d'analyse des résultats.

Annuaires Web - ce sont des ressources dans lesquelles les sites sont répartis par catégories thématiques. Si l'utilisateur travaille avec les moteurs de recherche uniquement par le biais de requêtes, le catalogue a la possibilité de visualiser l'intégralité des sections thématiques. Deuxième différence fondamentale catalogues des moteurs de recherche automatiques est que dans leur contenu, en règle générale, les personnes qui consultent les ressources et classent le site dans une catégorie ou une autre sont directement impliquées. Les répertoires Web sont généralement divisés en universels et thématiques. Universal essaie de couvrir autant de sujets que possible. Vous pouvez y trouver de tout : des sites sur la poésie aux ressources informatiques. En d'autres termes, ils ont la largeur de recherche maximale. Les annuaires thématiques, quant à eux, se spécialisent dans un certain sujet, offrant une profondeur de recherche maximale en réduisant l'étendue de la couverture des ressources.

Avantages des catalogues - comparativement haute qualité ressources, puisque chaque site qu'il contient est visualisé et sélectionné par une personne. Le regroupement thématique de sites vous permet de localiser facilement des sites de sujets similaires. Ce mode de fonctionnement est bon pour découvrir de nouveaux sites pour vous sur un sujet qui vous intéresse - il est plus précis que d'utiliser un moteur de recherche. Il est recommandé d'utiliser des annuaires Web pour la première connaissance de n'importe quel domaine, ainsi que de rechercher des requêtes floues - vous aurez la possibilité de « flâner » dans les sections de l'annuaire et de déterminer plus précisément ce dont vous avez besoin.

Les inconvénients des annuaires Web sont connus. Tout d'abord, il s'agit d'un réapprovisionnement lent de la base de données, car l'inclusion d'un site dans le catalogue nécessite la participation d'une personne. En termes d'efficacité, l'annuaire web n'est pas un rival des moteurs de recherche. De plus, les annuaires Web sont nettement inférieurs aux moteurs de recherche en termes de taille de base de données.

Lorsqu'on parle de recherche sur Internet, on ne peut ignorer un certain nombre de termes qui sont étroitement liés à ce domaine et qui sont souvent utilisés pour décrire et évaluer les moteurs de recherche. Par exemple: largeur et profondeur recherche Internet. Une recherche large est une recherche qui capture autant de sources d'informations que possible. Dans le même temps, au moins une mention d'un site particulier qui correspond à la requête est considérée comme suffisante. La profondeur de recherche fait référence aux détails de l'indexation et de la recherche ultérieure de chaque ressource spécifique. Par exemple, de nombreux moteurs de recherche ont des approches différentes pour indexer différents sites. Les sites volumineux et populaires sont indexés au maximum, les robots essaient de ne pas manquer une seule page d'une telle ressource. Dans le même temps, sur d'autres sites, seules la page principale et quelques pages de contenu peuvent être indexées. Ces circonstances, bien sûr, affectent la recherche ultérieure. La recherche approfondie fonctionne sur le principe "il est préférable d'inclure des informations redondantes dans les résultats que de passer à côté de toutes les données pertinentes pour le sujet de recherche".

Il est assez courant de rencontrer des concepts tels que mondial et local recherche Internet. La recherche locale sur Internet tient compte de l'emplacement géographique de l'utilisateur et donne la préférence aux résultats qui sont liés d'une manière ou d'une autre à un pays ou à une localité en particulier. Une recherche globale ignore ces informations et recherche toutes les ressources disponibles.

Lors de la compilation d'une requête sur les moteurs de recherche Internet, divers modes recherche. Les modes de recherche typiques trouvés sur la plupart des machines Internet incluent simple et avancé recherche. La recherche simple vous permet de spécifier une seule fonction de recherche dans une requête. La recherche avancée permet de créer une requête à partir de plusieurs conditions en les liant avec des opérateurs logiques.

Être sûr Requêtes de recherche divers filtres . Les filtres sont appelés ceux ou d'autres moyens auxiliaires de compilation d'une requête qui ne concernent pas le côté contenu des conditions de requête, mais limitent les résultats de la recherche à un signe formel. Ainsi, par exemple, lors de l'application d'un filtre de type de fichier lors de la recherche, l'utilisateur ne fournit pas au système d'informations relatives au sujet de sa demande, mais limite simplement les résultats obtenus à un type de fichier spécifique spécifié dans les conditions de sa demande.

Pour la plupart des utilisateurs, les moteurs de recherche universels sont le principal et souvent le seul moyen de recherche sur Internet. Ils offrent une bonne couverture des sources, ainsi qu'un ensemble d'outils suffisants pour les tâches de recherche de base.

Le marché des moteurs de recherche universels est assez vaste. Nous avons essayé d'analyser les moteurs de recherche les plus connus, et les résultats sont présentés sous la forme du tableau 1.

Lors du choix d'un moteur de recherche universel, la qualité des ressources trouvées avec son aide joue un rôle important. Vous pouvez déterminer le moteur de recherche préféré pour des tâches spécifiques en utilisant la « méthode du marqueur ». Son essence réside dans le fait qu'une certaine requête de recherche thématique est d'abord compilée, après quoi un groupe de personnes - des experts dans ce domaine est interrogé pour identifier les meilleures ressources Internet, à leur avis, sur le sujet choisi. Sur la base des données de l'enquête, une liste de sites marqueurs est formée, qui sont garantis pertinents pour la requête et contiennent des informations de haute qualité. Ensuite, la requête est envoyée aux moteurs de recherche testés. La logique d'évaluation est simple : plus les sites marqueurs sont situés haut dans les résultats de recherche, plus une ressource particulière est adaptée pour trouver des informations sur un sujet de test.


La recherche efficace d'informations à l'aide d'un ordinateur est une tâche urgente qui se pose non seulement pour les débutants, mais aussi pour les internautes expérimentés, car celui qui possède les données possède le monde, comme le dit le dicton bien connu. Aujourd'hui, nous allons analyser moyens de trouver rapidement le nécessaire et une information important sur Internet russe. Sur ce moment Il n'en existe que trois types :

  • Recherche d'informations via un lien direct sur le web
  • Rechercher en surfant sur Internet
  • Règles de recherche d'informations sur Internet
  1. en indiquant l'adresse directe du site où se trouvent les données nécessaires et les informations nécessaires ;
  2. lien surf avec ordinateur personnel sur Internet;
  3. en utilisant des moteurs de recherche (machines) sur Internet.

Examinons plus en détail toutes les manières de rechercher des informations à jour sur le réseau à l'aide d'un ordinateur.

Recherche d'informations via un lien direct sur le web

Si vous savez déjà à quelle adresse sur Internet se trouvent les informations dont vous avez besoin, la recherche à l'aide d'un ordinateur est nettement plus facile: entrez simplement l'adresse du site dans la ligne du navigateur et familiarisez-vous avec les données proposées. Si vous avez ouvert un texte volumineux sur une page de site Web sur Internet et que vous n'êtes intéressé que par quelques lignes cachées dans une "tonne" de caractères imprimés, vous pouvez utiliser la recherche dans la page. Pour ce faire, appuyez sur la combinaison de touches Ctrl et F (de n'importe quelle disposition de clavier d'ordinateur), et dans la colonne "Rechercher" proposée, tapez la phrase ou le mot qui est exactement contenu dans le paragraphe avec les informations que vous recherchez, et puis appuyez sur "Entrée".

Le navigateur mettra en surbrillance dans une couleur différente tous les mots mentionnés sur la page qui sont similaires au mot que vous recherchez. Cependant, il arrive souvent que nous ne nous souvenions pas ou que nous ne connaissions pas les liens avec la localisation des informations sur Internet. Dans ce cas, il est plus pratique de recourir aux deux autres types de recherche de données à l'aide d'un ordinateur.

Rechercher en surfant sur Internet

La navigation sur Internet est une recherche dans laquelle une transition séquentielle est effectuée par des liens d'un site thématique à un autre jusqu'à ce que la source des données nécessaires soit trouvée. L'avantage de cette méthode de recherche de données sur Internet réside dans sa fascination et sa capacité à maîtriser de manière cohérente et approfondie une grande quantité d'informations provenant de différents sites. Parmi les inconvénients de ce type de recherche, il y a sa durée, ainsi que le fait que vous devez également vous rendre d'une manière ou d'une autre au site d'origine à partir duquel vous commencez à surfer. Et si vous ne disposez pas de l'adresse du site à partir duquel vous allez commencer à surfer, vous devrez ici recourir à l'aide d'une méthode de recherche telle que les moteurs de recherche.

Méthodes de recherche d'informations sur le Web à l'aide de moteurs de recherche

Aujourd'hui, des moteurs de recherche tels que Yandex.ru, Rambler.ru, Google.ru sont largement connus du public Runet. Ces sites vous permettent de rechercher des données sur la requête d'entrée sur tous les sites Internet. Selon le principe de fonctionnement, les moteurs de recherche sont de deux types : les index de recherche et les répertoires de recherche :

  • répertoires de recherche. Ces sites fournissent une aide à la recherche de données sur un sujet spécifique sur Internet : les informations contenues dans ces catalogues sont clairement structurées en groupes et en sujets, ce qui permet de trouver rapidement le résultat. Dans chaque rubrique, l'utilisateur se voit proposer un certain nombre de liens vers des sites où l'on peut trouver les connaissances qui l'intéressent.
  • Index de recherche. Il s'agit de sites pointeurs dans lesquels, lors de la saisie d'un mot-clé dans la barre de recherche, l'utilisateur reçoit une série de liens vers des pages Internet contenant le mot ou la phrase demandée. Les index de recherche effectuent des recherches à l'aide de programmes spéciaux appelés "araignées" qui analysent les pages des sites sur Internet à la recherche de leurs sujets. Après une telle analyse, le moteur de recherche les entre dans sa base de données, à partir de laquelle les informations sont ensuite «obtenues» lorsque l'utilisateur entre une demande dans la période de recherche.

Règles de recherche d'informations sur Internet

Considérons maintenant les règles de base, mais importantes pour la recherche efficace d'informations à jour dans Réseau de langue russe Internet à l'aide d'un ordinateur.

  1. Formez la phrase clé correcte pour adresser le moteur de recherche. Vous ne pouvez pas utiliser un seul mot de recherche si vous souhaitez obtenir des résultats vraiment utiles, et vous ne devez pas non plus saisir de phrases trop longues. La taille de requête de recherche optimale est de 2 à 4 mots. Si le moteur de recherche a trouvé trop peu de résultats dans les résultats de la recherche, vous devez essayer de reformuler la phrase saisie, en remplaçant certains mots par des synonymes, et également vérifier les fautes d'orthographe dans les mots. Rappelez-vous: il n'y a pas de telles informations qui ne se trouvent pas sur Internet. Choisissez simplement les bons mots, suivez les règles et vous trouverez ce que vous cherchez.
  2. Utilisez des opérateurs spéciaux. Une recherche moderne, efficace et rapide de toute information nécessaire via un moteur de recherche et à l'aide d'un ordinateur personnel implique la connaissance et l'application de certaines astuces, qui sont des abréviations et des caractères d'opérateur spéciaux. Les opérateurs sont des icônes utilisées pour former une requête dans un moteur de recherche et faciliter la recherche des données nécessaires. Considérez les opérateurs les plus courants et leurs significations, qui peuvent être utiles dans la pratique.
  3. Un espace ou un signe & - signifie que vous souhaitez rechercher des documents contenant la phrase requise dans une phrase. Exemple de saisie chaîne de recherche: recette miam ou miam & recette.
  4. && - signifie la nécessité de rechercher une page sur laquelle des mots individuels de la phrase seront mentionnés dans l'ensemble du texte, et pas seulement une phrase. Exemple : délicieuse && recette.
  5. | - il vous sera proposé des articles dans lesquels seul 1 des mots saisis sera utilisé. Exemple : mariage | inconvénient | défaut.
  6. + - signifie rechercher du texte avec une combinaison obligatoire de mots consécutifs entrés entre le signe "+". Exemple : délicieux + recette.
  7. " " - rechercher une chaîne de mots sans la diviser en mots séparés. Exemple : "Bonbons Krasnaya Polyana".

En suivant ces règles simples lors de la recherche de données à l'aide d'un ordinateur et d'Internet, vous vous faciliterez la tâche et vous pourrez toujours trouver rapidement les informations dont vous avez besoin à tout moment.

Dans l'Internet mondial, vous pouvez trouver des informations sur n'importe quel sujet d'intérêt. Mais le plus difficile dans l'utilisation d'Internet est de trouver l'information dont vous avez besoin. Étant donné qu'Internet n'a pas de structure centralisée claire, qu'il se développe de manière chaotique et que de plus en plus de nouveaux serveurs apparaissent dans le monde, les problèmes de recherche d'informations deviennent très pertinents.

Moteurs de recherche facilitent grandement le travail sur Internet et nous aident à trouver rapidement les informations dont nous avons besoin dans une vaste gamme de serveurs Internet. Il existe plusieurs milliers de moteurs de recherche sur le World Wide Web, parmi lesquels il y a des moteurs bien établis et des moteurs moins connus.

Moteurs de recherche les plus populaires

  • Yandex- remède recherche en texte intégral des informations tenant compte de la morphologie de la langue russe ; rechercher sur des sites, votre catalogue, des actualités, des produits, des cartes, des dictionnaires, des blogs, des photos, Documents Microsoft Office et adobe acrobat PDF
    • Yandex
  • Randonneur(OJSC "Rambler Internet Holding") — recherche du site en tenant compte de la morphologie des langues russe et anglaise ; Il dispose également d'un système de recherche dans le catalogue.
    • Rambler Lite : moteur de recherche- une version courte de la page de recherche
  • Service de recherche Spoutnik(JSC "Rostelecom") - recherche sur des sites, des services publics, etc. ; Recherche sécurisée
  • NIGMa - moteur de recherche intelligent(Université d'État Lomonossov de Moscou et Université de Stanford) - rechercher des documents, des images, des livres, des actualités via Google, Yahoo, MSN, Yandex, Rambler, altavista, Aport; le système fournit également une recherche unique par formules chimiques et réactions
  • Google — recherche par sites (il est possible de rechercher des sites en langue russe); rechercher des documents au format PDF adobe acrobat, Microsoft Office, PostScript, Corel WordPerfect, Lotus 1-2-3, etc. ; rechercher des images, des vidéos, des actualités, rechercher des cartes ; la possibilité de rechercher sur des sites en russe et en russe; il existe un système de traduction de texte dans d'autres langues (49 langues)
  • bing(Microsoft Corp.) - recherche de sites, d'images et de vidéos ; la possibilité de rechercher sur des sites en russe et en russe; il existe un système de traduction de texte dans d'autres langues (22 langues)
  • Yahoo!(Yahoo) - recherche de sites, d'adresses e-mail, etc.

Chacun des moteurs de recherche a ses propres avantages et inconvénients, qui sont déterminés par le principe de fonctionnement du moteur de recherche, sa facilité d'utilisation, sa conception, la complexité du langage de requête, la présence de diverses fonctions avancées (contrôle du format et classement des informations de sortie, correction des fautes d'orthographe et des dispositions de clavier erronées dans l'eau mots clés, traduction de la page dans d'autres langues, etc.), rapidité de travail et autres paramètres. Le choix du moteur de recherche pour une application particulière est déterminé par le but de la recherche, la nature des informations recherchées, le format de sortie souhaité et l'étendue des adresses de serveur traçables dans le monde Internet.

Recherche par mot clé. Langage de requête du moteur de recherche

Le moteur de recherche dispose généralement d'un champ de saisie de mots-clés, grâce auquel il trouve les documents contenant ces mots-clés. Plus la requête au moteur de recherche est bonne (de meilleure qualité), plus le nombre total de documents trouvés est faible, et plus il s'agit de documents qui correspondent à ce dont vous avez besoin. Si la requête est très simple ou analphabète, alors le moteur de recherche peut vous donner plusieurs millions de documents que vous ne parcourrez pas de toute votre vie.

Utilisation d'un langage de requête contenant opérations logiques(Opérateurs logiques ET, ou PAS, parenthèses, etc.), préfixes de présence obligatoire de mots-clés dans le document «+» Et «-» (lors de la recherche de termes très spécialisés, il est préférable de l'utiliser), l'emplacement des mots-clés dans un document à proximité ou à une certaine distance, etc.) et d'autres éléments, ainsi qu'un plus grand nombre de mots-clés connexes, peuvent considérablement affiner la recherche zone et mieux composer la demande au serveur de recherche. Il convient de garder à l'esprit que différents moteurs de recherche peuvent avoir à la fois des langages de requête différents et des langages très similaires.

Certains moteurs de recherche ont en plus une fonction Recherche Avancée, permettant à l'utilisateur de décrire plus précisément ce dont il a spécifiquement besoin sans connaître le langage de requête. La fonction de recherche avancée est, par exemple, les moteurs de recherche Yandex et Google.

Les principaux types de moteurs de recherche. Quel moteur de recherche utiliser

Il existe 2 grands types de moteurs de recherche sur Internet : l'index et le classement (catalogue). Moteurs de recherche d'index (par exemple, Yandex, Rambler, Sputnik, Google, Bing et autres), travaillant dans mode automatique mettre à jour leurs informations, visualiser le contenu des serveurs sur Internet, indexer les informations qu'ils contiennent et entrer des informations sur l'emplacement des mots sur les pages du site dans leurs bases de données. Les moteurs de recherche d'annuaires (par exemple, Rambler, Yahoo!, etc.) contiennent un catalogue de serveurs structuré par thème et sont le plus souvent réapprovisionnés manuellement. Typiquement, la page WWW du moteur de recherche de classement contient également un champ de saisie de mots-clés pour la recherche dans sa propre base de données. Dans le système de recherche du catalogue, vous pouvez, en commençant par une rubrique thématique plus large, et en descendant progressivement le long des rubriques, arriver à un lien vers le site dont vous avez besoin. Dans certains cas, il est plus pratique d'utiliser le premier type de moteurs de recherche, dans d'autres - le second. Il existe des moteurs de recherche qui combinent les deux principes de travail. En particulier, de nombreux moteurs de recherche d'index disposent également d'un système de recherche par catalogue. En outre, les moteurs de recherche peuvent utiliser d'autres principes de méthodes de recherche.

De nombreux moteurs de recherche se sont transformés en portails Internet qui combinent un grand nombre de ressources et services. Sur les pages de ces portails, vous pouvez lire les actualités, vous familiariser avec le programme télévisé, vous renseigner sur la météo, les taux de change, utiliser le service de cartographie, etc. autres

Les moteurs de recherche russes les plus populaires ont des capacités de recherche qui tiennent compte des particularités de la langue russe.

Pour rechercher simultanément dans plusieurs moteurs de recherche, vous pouvez utiliser les soi-disant métamachines de recherche qui accèdent à plusieurs moteurs de recherche à la fois, par exemple, NIGMa.

Il existe également des moteurs de recherche spécialisés dans la recherche sur un seul sujet (par exemple, sur informatique, musique, ressources naturelles, etc.)

Trouver la bonne information sur Internet est souvent assez difficile. Internet se développe de manière chaotique, il n'a pas de structure clairement définie. Personne ne peut garantir que sur un domaine, il n'y aura que des informations sur un certain sujet, et sur l'autre - des informations sur un sujet différent, mais également clairement défini. Par exemple, sur les domaines .com, vous pouvez trouver non seulement des informations commerciales, mais, par exemple, diverses documentations sur produits logiciels ou même des blagues.

Si la structure du domaine était similaire à la structure du répertoire, par exemple, dans le domaine ru.comp.os.linux (comme dans le système de nouvelles), il y aurait toutes les informations sur le fonctionnement Système Linux en russe et une organisation modératrice s'est assurée que les informations sur Linux n'étaient pas publiées dans d'autres domaines, la recherche serait alors beaucoup plus facile. Après tout, nous saurions où chercher. Vous ouvrez un navigateur, entrez ru.comp.os.linux et vous obtenez... des millions de liens différents vers des articles, des documents HOWTO et d'autres informations liées à Linux d'une manière ou d'une autre.

Performances de recherche

    Les performances de recherche dépendent de nombreux facteurs :
  • De l'information elle-même - il peut y avoir beaucoup d'informations sur un sujet, mais peu sur un autre. Parfois, vous pouvez trouver beaucoup d'informations sur un sujet donné, mais l'efficacité de cette recherche sera proche de 0,0 %, et vous ne pourrez trouver que 3-4 liens, et ce sera exactement ce dont vous avez besoin. Cela inclut également la capacité du webmaster à soumettre correctement les informations afin que les moteurs de recherche eux-mêmes puissent les trouver. Supposons que quelque part très loin se trouvent les informations dont vous avez besoin, mais que le moteur de recherche n'en sache rien. Peut-être que l'information vient d'être publiée ou que le webmaster qui a publié l'information ne soupçonne même pas l'existence de moteurs de recherche. Vous recherchez des informations à l'aide d'un moteur de recherche. Si elle ne "connaît" pas les informations dont vous avez besoin, vous ne saurez donc rien d'elle non plus.
  • Du moteur de recherche - il existe de nombreux moteurs de recherche et ils sont tous différents. Même s'ils sont du même type (nous parlerons des types de moteurs de recherche un peu plus tard), bien sûr, chacun d'eux aura son propre algorithme. Si vous ne trouvez pas d'informations avec un moteur de recherche, essayez de les rechercher avec un autre. Ne vous attardez pas sur un moteur de recherche, peu importe à quel point vous l'aimez.
  • Beaucoup dépend de la capacité à utiliser un moteur de recherche - comment vous savez comment utiliser un moteur de recherche. Si vous ne savez pas comment utiliser un moteur de recherche, votre recherche a peu de chances d'être efficace.

Comment rechercher des informations

Étant donné que le plus souvent vous ne sélectionnez pas le site dont vous avez besoin dans l'annuaire du moteur de recherche, mais entrez un mot-clé spécifique (ou plusieurs mots-clés), vous devez spécifier ce même mot-clé le plus précisément possible. Plus vous définissez précisément le sujet de la recherche, plus le résultat sera précis. Le moteur de recherche ne peut pas deviner vos pensées, vous devez lui indiquer clairement ce que vous recherchez.

Chaque moteur de recherche a sa propre syntaxe que vous devez connaître. Ce chapitre décrira la syntaxe des moteurs de recherche Google, Yandex et Rambler. Si vous souhaitez utiliser un autre moteur de recherche, vous pouvez trouver sa syntaxe sur son site Web (généralement, il est décrit en détail).

Moteurs de recherche Internet

Parlons maintenant des moteurs de recherche eux-mêmes.

Sur le territoire de l'ex-CEI, les moteurs de recherche suivants sont les plus populaires, selon SpyLog (Openstat) :

  • 1. Yandex (www.yandex.ru) ;
  • 2. Google (www.google.com) ;
  • 3. [email protected] (go.mail.ru);
  • 3. Rambler (www.rambler.ru) ;
  • 5 Yahoo! (www.yahoo.com);
  • 6. Altavista (www.altavista.com);
  • 7. Bing (www.bing.com).

Les moteurs de recherche sont classés par ordre décroissant de popularité. Comme vous pouvez le voir, notre moteur de recherche le plus populaire est Yandex.

Types de moteurs de recherche

    Il existe deux principaux types de moteurs de recherche :
  • index - Google, AltaVista, Rambler, HotBot, Yandex, etc. ;
  • classification (catalogue) - Rambler, Yahoo! et etc.

Ne soyez pas surpris que le moteur de recherche Rambler soit répertorié deux fois - il était à la fois index et classement. Nous y reviendrons plus tard, mais pour l'instant parlons des différences entre ces deux systèmes.

Comment fonctionne un moteur de recherche d'index ? Le moteur de recherche se lance programme spécial, qui parcourt le contenu des serveurs web, indexe les informations : il entre dans sa base de données les mots-clés d'une page web particulière, certaines informations d'une page web.

Une brève histoire de Google

Commençons par le titre. Google est une version légèrement modifiée du mot googol (on l'appelle souvent "Google" pour une raison). À son tour, ce mot a été introduit par Milton Sirota, neveu du célèbre mathématicien Edward Kasner, puis a été popularisé dans le livre de Kasner et Newman, Mathematics and Imagination. Le mot "googol" affiche le nombre sous la forme d'un 1 suivi de 100 zéros. Le nom "Google" reflète une tentative d'organiser la grande quantité d'informations sur le Web.

Alors, commençons par le tout début. Les futurs développeurs de Google, Sergey Brin et Larry Page, se sont rencontrés en 1999 à l'université de Stanford. Ensuite, Larry avait 24 ans et Sergey - 23. Larry était alors étudiant à l'Université du Michigan et est venu à Stanford pendant quelques jours. Sergei faisait partie d'un groupe d'étudiants censés familiariser les invités avec l'université. Dès la première rencontre, Sergey et Larry, pour ne pas dire plus, ne s'aimaient pas - ils se disputaient sur tout ce qui pouvait être discuté. Même si cela s'est finalement avéré être une chose positive, puisque leurs opinions différentes ont conduit à la création d'un algorithme pour résoudre l'un des problèmes informatiques les plus urgents : trouver la bonne information parmi une énorme quantité de données. En janvier 1996, Larry et Sergey ont commencé à travailler sur le moteur de recherche BackRub, censé analyser les liens "en retour" pointant vers ce site Web. Le travail sur ce serveur a été effectué dans un manque constant de fonds - après tout, à cette époque, Sergey et Larry étaient des étudiants diplômés de l'université - vous comprenez vous-même que les étudiants diplômés n'ont pas beaucoup d'argent. Soit dit en passant, Larry a participé pour la première fois à un projet aussi sérieux, et avant cela, il était engagé dans toutes sortes de projets "frivoles", voire parfois anecdotiques, par exemple, il a construit une imprimante fonctionnelle à partir d'un constructeur Lego.

Algorithmes de recherche Google

L'interface de Google frappe par sa simplicité : un champ de saisie et deux boutons. Comme on dit, tout ce qui est ingénieux est simple.

Syntaxe spéciale (étendue) de Google

En plus de la logique Opérateurs Google vous fournit les modificateurs de recherche répertoriés dans le tableau. Les modificateurs de recherche sont appelés syntaxe Google spéciale. Prenez ce tableau au sérieux : une fois que vous essayez de rechercher quelque chose à l'aide de modificateurs, vous ne les refuserez pas.

Modificateur Google inurl

Le modificateur inurl est utilisé pour rechercher l'URL spécifiée. Et contrairement au modificateur de site qui permet de rechercher des informations sur un seul site ou domaine, le modificateur inurl permet de rechercher des informations dans des sous-répertoires du site, par exemple :

inurl: siteskype-zvonim-free

Le modificateur inurl vous permet d'utiliser le caractère * pour spécifier un domaine, par exemple :
inurl : "*.redhat.com"

Il est préférable d'utiliser inurl avec site. La requête suivante recherchera des informations dans le domaine gidmir.ru, sur tous ses sous-domaines à l'exception de www :
site: gidmir.ru inurl: "*.gidmir" -inurl: "www.gidmir.ru"

Langue de recherche Google

Google autorise la syntaxe mixte, c'est-à-dire une syntaxe qui utilise plusieurs modificateurs de recherche spéciaux dans une requête. Cela vous permet d'obtenir le meilleur résultat.

Voici l'exemple le plus simple de syntaxe mixte :
site: ru inurl: disque

Dans ce cas, la recherche sera effectuée sur les sites de domaine, et l'URL doit contenir le mot disque.

Voici un autre exemple :
site : ru -inurl : org.ua

La recherche sera effectuée sur les sites du domaine ru, mais les résultats de la recherche ne contiendront pas de pages situées sur org.ua.

Termes de recherche sur Google

Pour la plupart des utilisateurs ordinaires de Google, la limite de 10 mots clés n'est pas perceptible. Mais les amateurs de longues requêtes ont sans doute remarqué que Google ne prend en compte que les 10 premiers mots-clés, et tout le reste est tout bonnement ignoré.

Pourquoi rechercher des phrases longues ? Dans la plupart des cas, il s'agit d'extraits d'œuvres. Supposons que nous recherchions l'œuvre "Maître et Marguerite". Il convient de noter que phrase clé devrait ressembler à "Maître Marguerite" car les mots et, ou, et, de, ou, je, un, le et quelques autres sont ignorés par le moteur de recherche. Si vous souhaitez forcer l'un de ces mots à être inclus dans votre recherche, faites précéder le mot d'un signe "+", tel que +le.

Le dépassement de la limite de 10 mots permet la construction correcte de la requête. Les recommandations suivantes vous aideront non seulement à réduire la longueur de la requête, mais également à améliorer l'efficacité de votre recherche en général.

Recherche Google avancée

Nous tapons dans la ligne de saisie du navigateur l'adresse - www.google.ru/advanced_search et allons à la recherche avancée de Google.

Avec la recherche avancée, vous pouvez rechercher des informations de manière presque aussi flexible qu'avec les modificateurs de recherche. Pourquoi "presque" ? L'interface de recherche avancée ne donne pas accès à tous les modificateurs de recherche.

Définition des propriétés de recherche Google dans les cookies du navigateur

Je ne veux pas vous embêter avec des détails techniques, donc je vais dire brièvement ce que sont les cookies et non, avec quoi ils ne sont pas mangés, mais comment ils doivent être travaillés.

Imaginons que nous ayons la tâche suivante : nous devons rédiger un rapport de visite individuel pour chaque client du site Web de notre entreprise. Autrement dit, pour que l'utilisateur ne voie pas le nombre total de visites, sache combien de fois il a été sur notre site. Pour chaque adresse IP, nous devons conserver des enregistrements dans une table, qui est susceptible d'être volumineuse, et il s'ensuit que nous utilisons de manière irrationnelle le temps processeur et l'espace disque. Il serait beaucoup plus correct de notre part d'utiliser cet espace avec plus d'avantages.

Résultat de recherche Google

Résultat recherche Google n'est pas qu'un ensemble de liens correspondant à conditions spécifiées recherche. C'est quelque chose de plus qui mérite une considération séparée. Entrez le mot "rusopen" et cliquez sur le bouton Recherche Google.

En haut, on voit le nombre total de résultats (883 000 000) et le temps total de la recherche, à savoir 0,34 seconde.

    Dans la plupart des cas, le résultat est présenté comme suit :
  • Nom de la page;
  • Description de la page;
  • L'URL de la page;
  • taille de la page;
  • date de la dernière indexation de la page ;

Recherche d'images Google

Le service Google Images vous permet de trouver diverses images sur le Web. Alors que les images elles-mêmes ne peuvent pas être indexées, les pages qui contiennent ces images sont indexées. Entrez une description pour l'image et vous obtiendrez de très nombreux liens, ainsi que les images elles-mêmes présentées sous forme de galerie.

    Pour une recherche d'images plus efficace, vous devez utiliser les modificateurs de recherche suivants :
  • intitle : - recherche dans le titre de la page ;
  • filetype : - permet de spécifier le type d'image, vous pouvez spécifier les types suivants : JPEG et GIF, pas BMP, PNG, les images d'autres types ne sont pas indexées ;
  • inurl : - recherche l'URL spécifiée, par exemple inurl : www.gidmir.ru ;
  • site : recherche sur le domaine ou le site spécifié, par exemple, site : com.

ServicesGoogle

Google est un puissant moteur de recherche avec plus de 3 milliards de pages. En plus des pages Web classiques, Google indexe les fichiers dans Formats de mots, Excel, PowerPoint, PDF et RTF. Google peut également être utilisé pour rechercher des images et des numéros de téléphone : Google Images et Phonebook sont conçus pour cela, respectivement. Dans cet article, nous parlerons des services Google Ad Hoc.

E-mail Google

Essayez d'utiliser le courrier de Google. Il convient de noter qu'il ne s'agit pas d'un webmail tout à fait ordinaire.

    Parmi les fonctionnalités de Gmail, il convient de souligner les suivantes :
  • énorme taille de boîte aux lettres - plus de 7 Go;
  • au lieu de supprimer des lettres, vous pouvez les archiver - vous disposerez alors de suffisamment d'espace pour longtemps et vous pourrez restaurer les lettres que vous avez reçues ou envoyées il y a plusieurs années;
  • la possibilité de rechercher par boites aux lettres avec l'efficacité de Google ;
  • organisation pratique des lettres et des réponses : toutes les lettres et réponses forment une chaîne facile à suivre ;
  • bonne protection des spams ;
  • adresse mémorable [email protected] ;
  • interface conviviale.

Moteur de recherche Rambler (Rambler)

Histoire de Rambler

Tout a commencé en 1991 dans la ville de Pushchino, dans la région de Moscou. Au cours de cette année lointaine, un groupe de personnes partageant les mêmes idées s'est réuni, parmi lesquelles Dmitry Kryukov, Sergey Lysakov, Viktor Voronkov, Vladimir Samoilov, Yuri Ershov. L'intérêt commun de ce groupe était Internet. Probablement, en 1991, aucun des futurs développeurs de Rambler n'imaginait même qu'ils deviendraient les créateurs de l'un des moteurs de recherche les plus importants et les plus célèbres du Runet. Après tout, avant cela, ils servaient tous des appareils radio à l'Institut de biochimie et de physiologie des micro-organismes de l'Académie des sciences de Russie. En 1992, la société "Stack" a été créée, dirigée par Sergei Lysakov. Profil de l'entreprise - réseaux locaux et Internet. En fait, la société "Stack" était un fournisseur d'accès Internet. La société a créé un réseau intra-urbain, puis a connecté Pushchino à Moscou et, à travers lui, à Internet. Soit dit en passant, c'était le premier canal IP qui allait au-delà de Moscou. Et c'est en 1992 ! Maintenant, la pose d'un canal est assez problématique - il y a toujours beaucoup de nuances, puis les câbles ont dû être posés indépendamment, manuellement, sous terre, et tout cela a été fait en hiver.

Comment la recherche Rambler a fonctionné

Internet est en constante évolution : le nombre de sites et leur taille augmentent chaque jour. Après tout, imaginez : les grands sites sont mis à jour tous les jours, même si le volume des mises à jour est de 1024 octets (1 Ko), alors si nous supposons qu'il y a 10 000 sites de ce type, chaque jour le moteur de recherche doit traiter (indexer) 10 000 Informations en Ko (en gros, 10 Mo ). Le nombre 10 000 est tiré "du plafond" - à titre d'exemple. Il peut être supérieur ou inférieur - après tout, même les grands sites ne sont pas mis à jour tous les jours. La taille de la mise à niveau est également artificielle. Imaginez un site d'information et d'analyse où de nouveaux articles sont publiés presque chaque jour ou des documents sont réimprimés à partir d'autres sites. Dans ce cas, la taille des mises à jour sera loin d'être de 1 Ko, mais d'au moins 10. Ajoutez à tout cela plus de nouvelles et d'autres informations, et il s'avère qu'avec le nombre de sites mis à jour de 10 000, le moteur de recherche devrait indexer 120 Mo du texte. Et avec tout cela, le moteur de recherche doit non seulement afficher avec précision les résultats de la recherche, mais aussi le faire le plus rapidement possible afin que l'utilisateur soit à l'aise de travailler avec. Qui veut attendre 10 minutes pour les résultats de recherche ? J'exagère, bien sûr, mais personnellement, je n'attendrais pas plus de 30 secondes pour les résultats de recherche (à partir du moment où vous cliquez sur le bouton Rechercher jusqu'à ce que les dix premiers résultats apparaissent). Il s'avère que les développeurs du moteur de recherche doivent constamment maintenir au bon niveau non seulement le matériel, qui doit être capable de traiter des quantités d'informations sans cesse croissantes, mais vous ne pouvez pas non plus prendre les "mathématiques" avec un fer à repasser. Il est nécessaire d'améliorer constamment les algorithmes de recherche afin qu'avec une augmentation du volume de la base de recherche, le temps de recherche n'augmente pas (ce qui signifie une augmentation significative du temps - pour l'utilisateur, il n'y a aucune différence combien de temps la recherche sera de 2,5 secondes soit 2,0555 secondes, puisqu'il n'est pas en mesure d'estimer ce temps).

Requêtes Rambler, syntaxe Rambler

La demande à Rambler peut consister en un ou plusieurs mots, et la demande peut contenir des signes de ponctuation. Les développeurs de Rambler ont conçu leur moteur de recherche pour un maximum de confort d'utilisation. Rambler pourrait même utiliser utilisateur inexpérimenté, qui ne connaît pas du tout le langage de requête. Tout ce qu'il avait à faire était de saisir une demande composée de plusieurs mots (par exemple, une phrase) et sans signes de ponctuation - Rambler lui-même a trouvé les documents nécessaires et l'a fait aussi efficacement que possible. Bien sûr, si le langage de requête était utilisé correctement, l'efficacité augmentait considérablement, mais même avec une ignorance complète du langage de requête, l'efficacité de la recherche était à haut niveau. Comme déjà indiqué, la connaissance du langage de requête est dans votre propre intérêt, vous pouvez simplement trouver les informations dont vous avez besoin beaucoup plus rapidement.

Moteur de recherche Yandex (Yandex)

Référence historique

En 1990, la société Arcadia, dirigée par Arkady Borkovsky et Arkady Volozh, a commencé à développer une recherche logiciel. Six ans plus tard, le site Web Yandex est apparu. Mais que s'est-il passé pendant ces six années ?

Pendant deux ans, deux systèmes de recherche d'informations ont été créés - "Classification internationale des inventions" et "Classificateur des produits et services". Les deux systèmes fonctionnaient sous DOS et permettaient de rechercher un mot dans un dictionnaire donné à l'aide d'opérateurs logiques.

Arcadia est devenue une division de CompTek en 1993. Au cours de 1993-1994, les technologies de recherche se sont considérablement améliorées, par exemple, un dictionnaire qui permet de rechercher en tenant compte de la morphologie de la langue russe n'occupait que 300 Ko, ce qui signifie qu'il s'intègre librement dans RAM et cela a fonctionné très rapidement. Basé sur ceci nouvelle technologie en 1994, la "Bible Computer Reference" a été créée - un système de recherche d'informations qui fonctionne avec des traductions de l'Ancien et du Nouveau Testament.

Recherche de langue Yandex

Comment le moteur de recherche interprétera-t-il le mot que vous saisissez ?

    Maintenant on va parler de ça :
  • Règle 1. Il s'avère que le système l'interprète selon les règles de la langue russe. Exemple : si vous entrez le mot "voiture", vous obtiendrez également des résultats contenant les mots "voitures", "voiture", etc. De même, avec les verbes - pour la requête "go", vous recevrez des documents contenant les mots "go", "goes", "walked", "walked", etc. Comme vous pouvez le voir, le moteur de recherche est plus intelligent que vous ne le pensez - ce n'est pas seulement un outil pour rechercher un mot particulier dans une base de données.
  • Règle 2 Attention particulière donné aux mots en majuscules. Si un mot est en majuscule et n'est pas le premier mot d'une phrase, seuls les mots en majuscule seront trouvés. Sinon, les mots écrits à la fois avec des majuscules et des minuscules seront trouvés. Exemple : sur demande "Teckel A." les documents contenant à la fois "taxons" (taxe) et "taxons" (nom de famille) seront trouvés, puisque le mot "taxons" bien qu'en majuscule, mais il vient en premier dans la phrase. Mais la requête "A. Teckel" trouvera des documents contenant uniquement le mot "Teckel", écrit avec une majuscule.

Syntaxe Yandex

Par défaut, Yandex utilise l'opérateur logique AND. Cela signifie que si vous avez entré une requête " téléviseur samsung", vous obtiendrez des documents dans les résultats dans lesquels les mots "TV" et "Samsung" apparaîtront dans la même phrase. Si vous souhaitez spécifier explicitement l'opérateur ET, utilisez le symbole &. En d'autres termes, le La requête "Samsung TV" est similaire à la requête "TV & Samsung". Vous pouvez également utiliser la requête "TV + Samsung".

Si vous voulez l'effet inverse, c'est-à-dire Si vous souhaitez obtenir des documents contenant le mot "TV" séparément et le mot "Samsung" séparément, vous devez utiliser l'opérateur OU (|), par exemple : "TV | Samsung".

Syntaxe de requête Yandex

Tous les mots du texte d'un document sont numérotés par Yandex dans l'ordre. La distance entre les mots adjacents est de 1 (pas 0 !), et la distance entre les mots dans ordre inverse est égal à -1. Il en va de même pour les offres.

Pour indiquer la distance entre les mots, le signe / est mis, suivi immédiatement d'un nombre, ce qui signifie qu'il s'agit de la distance entre les mots. Par exemple, la requête "développeur /2 programmes" trouvera les documents contenant les mots "développeur" et "programmes", et la distance entre les mots ne doit pas dépasser deux mots, et tous ces mots doivent être dans une seule phrase. Dans ce cas, les documents contenant "développeur de programme d'application", "développeur de programme système", etc. seront trouvés.

Si nous connaissons exactement la distance et l'ordre des mots, nous pouvons utiliser la syntaxe / + n. Par exemple, la requête "chaperon rouge /+1" donnera le mot "casquette" immédiatement après le mot "rouge". La requête "le petit chaperon rouge" conduirait au même résultat.

Opérateurs de recherche Yandex

Les parenthèses sont utilisées pour représenter une expression entière dans une requête. Par exemple, la recherche "(histoire | technologies | programmes)/+1 Linux" trouvera des documents contenant l'une des phrases "histoire de Linux", "technologies Linux", " Programmes Linux".

Zones

Une zone est un endroit où trouver les informations dont vous avez besoin. Vous pouvez spécifier la zone dans laquelle vous souhaitez effectuer la recherche - titres (zone Titre), liens (ancres) ou adresse (Adresse). Vous pouvez également utiliser la zone tout - rechercher dans l'ensemble du document.

Syntaxe : requête $zone_name.

Par exemple : request $title "Microsoft" найдет все документы, в заголовках которых встречается точная фраза "Microsoft".!}

Options de recherche Yandex supplémentaires

Le moteur de recherche Google permettait de limiter l'emplacement de la recherche à une liste précise de serveurs ou, à l'inverse, d'exclure certains serveurs de la liste de recherche. Il existe exactement les mêmes opportunités dans le moteur de recherche Yandex. Vous pouvez également rechercher des documents liés à des URL ou des images spécifiques. Lors de la spécification d'un masque de fichier (par exemple, une image), vous pouvez utiliser le caractère *, ce qui signifie tous les caractères, par exemple : « audi-* ».

La syntaxe est : #element_name="value".

Cible: comprendre les principes de base de l'organisation de la recherche d'informations sur Internet.

Tâches:

Éducatif:

  • formation de compétences de recherche d'informations sur Internet;
  • utiliser la recherche et la sélection d'informations dans les activités pratiques et la vie quotidienne;

Développement:

  • développement de la pensée logique, de l'attention, de l'approche créative des affaires chez les écoliers;

Éducatif:

  • éducation chez les étudiants de responsabilité d'entreprise, d'intérêt pour l'informatique, le collectivisme et l'entraide.

Type de leçon: apprentissage de nouveau matériel.

Formes d'entraînement : Frontal, individuel, collectif.

Méthodes d'enseignement : Verbal, visuel, pratique, recherche.

Équipement:

  • Ordinateurs avec accès Internet, projecteur multimédia, bureau.
  • Présentation pour le cours <Презентация >
  • Test étudiant <Приложение 1 >
  • Cartes de tâches pour les groupes <Приложение 2 >
  • Opérateurs logiques <Приложение 3 >

Plan de cours:

  1. Moment d'organisation - 2 min.
  2. Techniques de recherche d'informations sur Internet - 18 min.
  3. Service Web mondial (WWW)
  4. répertoires de recherche.
  5. Moteurs de recherche.
  6. Formation de demandes de recherche d'informations.
  7. Travail de groupe sur la recherche d'informations sur Internet - 15 min.
  8. Exécution du test - 5 min.

Pendant les cours

1. Moment organisationnel.

2. Techniques de recherche d'informations sur Internet

Internet se développe à un rythme très rapide, il devient de plus en plus difficile de trouver l'information dont vous avez besoin parmi des centaines de milliards de pages Web et des centaines de millions de fichiers. Pour rechercher des informations, des moteurs de recherche spéciaux sont utilisés, qui contiennent des informations constamment mises à jour sur l'emplacement des pages Web et des fichiers sur des centaines de millions de serveurs Internet.

Avant d'envisager des systèmes de recherche d'informations, nous devons traiter des questions - Quoi nous pouvons rechercher et , et puis - Comment organiser une telle recherche.

Le stockage des informations se termine généralement par la recherche d'informations spécifiques pour une utilisation ultérieure. La recherche est organiquement liée à la procédure de stockage, elle n'est donc pas toujours pointée du doigt.

Service Web mondial (WWW)

C'est le service le plus populaire sur Internet aujourd'hui. C'est elle qui est souvent identifiée à Internet dans son ensemble, bien qu'il ne s'agisse en fait que d'un de ses nombreux services.

Définition WWW

Le fondateur du réseau Tim Bernes-Lee a donné cette définition.

WWW est un réseau de serveurs, un système multimédia d'information hétérogène distribué à usage collectif.

D'après la définition, il est clair à quel point l'environnement informatique joue un rôle énorme dans la société moderne. L'environnement WWW n'a pas de structure centralisée. Quiconque souhaite placer sur Internet des documents qui ne contredisent pas la loi peut le faire. Un document séparé sur le World Wide Web est appelé page web. En règle générale, il s'agit d'un document combiné pouvant contenir du texte, des graphiques, du multimédia et d'autres objets. Une caractéristique distinctive de l'environnement WWW est la disponibilité de moyens de transition d'un document à un autre, thématiquement associés à celui-ci, sans spécifier explicitement l'adresse. La communication entre les documents s'effectue à l'aide de liens hypertextes. Un grand nombre de documents électroniques hypertextes stockés sur des serveurs WWW forment une sorte d'hyperespace de documents entre lesquels il est possible de se déplacer.

La communication entre des centaines de millions de documents stockés sur les serveurs physiques d'Internet ne pourrait pas exister si chaque document de cet hyperespace n'avait pas sa propre adresse unique. Un fichier sur un seul ordinateur local a un nom complet unique, qui comprend son propre nom de fichier avec extension et le chemin d'accès au fichier, en commençant par le nom de l'appareil sur lequel il est stocké. Lors de la détermination de l'emplacement d'un fichier sur le World Wide Web, il est nécessaire d'étendre le concept d'un nom de fichier unique. L'adresse de tout fichier à l'échelle mondiale est déterminée localisateur de ressources uniforme - URL. Une URL est une chaîne de caractères normalisée qui spécifie l'emplacement d'une ressource, d'un document ou d'une partie de celui-ci sur Internet et se compose de trois parties.

  • nom du protocole d'accès au service Internet ;
  • le nom du serveur sur lequel la ressource est stockée et l'application serveur de service Internet est en cours d'exécution ;
  • le nom complet du fichier stocké sur le serveur.

Pour le fonctionnement du service Internet, un logiciel serveur et client est nécessaire. Le service World Wide Web est fourni par le serveur logiciel- Serveurs Web et programmes clients - Navigateurs Web.

Systèmes de recherche d'informations

Les services d'information définissent la technologie de stockage, de transmission objets d'information et, par conséquent, des algorithmes de recherche.

Les documents Web sont stockés sur des serveurs Web, les fichiers et les archives de fichiers sont stockés sur des serveurs de fichiers. A cet égard, l'ensemble des objets d'information disponibles à l'aide de chaque service peut être considéré comme un espace de recherche d'informations distinct.

sachant maintenant Quoi nous pouvons rechercher et Où, Regardons la question - Comment organiser une telle recherche.

Actuellement, pour rechercher des informations spécifiques, il existe ce qu'on appelle systèmes de recherche d'informations ou, comme on dit dans le jargon Internet, services de recherche. Le moteur de recherche est un site Web spécialisé. Le principe de fonctionnement de tels systèmes est simple : l'utilisateur doit expliquer au système ce qu'il doit obtenir, et la tâche du service de recherche est de trouver et d'afficher une liste d'hyperliens vers des pages qui mentionnent les informations pertinentes.

Classement des services de recherche :

  • selon la méthode d'organisation et de reconstitution de la base de données de documents sur le réseau pour les annuaires de recherche et les moteurs de recherche ;
  • par la profondeur de la couverture des ressources en global et local.

Fonctionnalités des répertoires de recherche

Les catalogues de recherche sont organisés sur le même principe que les catalogues thématiques des grandes bibliothèques. Les principes de travail avec les répertoires sont assez simples. Généralement, la page principale d'un site Web de catalogue contient une liste de catégories, ou titres, chacun étant représenté par un lien hypertexte.

Travailler avec des répertoires de recherche est intuitivement simple. En eux, la recherche d'informations se termine presque toujours plus ou moins fructueusement. Cependant, cette simplicité cache l'extrême complexité de la création et de la maintenance d'un catalogue.

La caractéristique la plus importante des annuaires est le volume de la base de données, c'est-à-dire le nombre de documents soumis. Pour les catalogues mondiaux, cette valeur est d'environ 1 à 2 millions de documents, soit environ 0,1 à 0,2 % de l'espace total du WWW, et le degré de couverture du volume total des ressources du WWW diminue continuellement en raison d'une augmentation fulgurante du ressources d'information dans réseau mondial. Par conséquent, l'utilisation de catalogues ne peut donner des résultats très complets.

Comparé aux moteurs de recherche, le taux de croissance des bases de données d'annuaires est assez lent. Le fait est que les répertoires de recherche sont créés manuellement par une équipe de rédacteurs hautement qualifiés, également appelés modérateurs. Cependant, cela peut également être considéré comme un avantage des moteurs de recherche, car la sélection manuelle améliore la précision de la recherche et la distribution des documents sous les rubriques appropriées.

Une autre caractéristique des annuaires est le nombre de catégories ou de rubriques dans l'annuaire. Naturellement, plus cette valeur est élevée, plus les résultats de la recherche sont précis. Pour les catalogues mondiaux, cette valeur se situe actuellement dans les dizaines de milliers.

Fonctionnalités du moteur de recherche

Dans les moteurs de recherche, les catalogues de ressources Web sont créés automatiquement par des programmes spéciaux appelés robots de recherche ou index de recherche (ainsi que « vers », « araignées », « chalutiers », « machines automatiques », « agents », etc.). Le facteur humain est exclu du processus de remplissage de la base de données des moteurs de recherche. Dans le même temps, la qualité des liens fournis par le système en fonction des résultats de recherche diminue, mais en même temps leur nombre augmente.

Le programme Search Robot analyse le Web afin d'identifier de nouveaux documents à inclure dans la base de données du moteur de recherche - indice. Le processus d'ajout d'informations sur un document à un index est appelé indexage.

Étapes du robot de recherche

  1. Collection de la base de données primaire.
  2. Indexation de la base de données.
  3. Création de la liste de liens résultante.

Formation de demandes de recherche d'informations

Lors de la recherche d'informations sur Internet, nous avons le droit de nous fier à l'exhaustivité, à l'exactitude et à la pertinence des résultats de la recherche. De plus, nous souhaitons recevoir les résultats le plus rapidement possible.

Certains des facteurs énumérés ne peuvent pas être influencés par l'utilisateur effectuant la recherche. Par exemple, la rapidité d'obtention des informations dépend des caractéristiques techniques et de la charge de travail des canaux de communication et des serveurs des services de recherche, ainsi que des caractéristiques des algorithmes mis en œuvre dans le moteur de recherche. Cependant, l'utilisateur peut affecter la qualité des résultats de la recherche si, lors de l'opération de recherche, il y aura :

  • faire un choix justifié de service de recherche d'informations ;
  • prendre en compte les caractéristiques du système de recherche d'informations ;
  • formuler correctement les demandes de recherche d'information.

La formation d'une requête est le processus d'expression d'un besoin d'information à l'aide de mots-clés et de combinaison de ces mots-clés à l'aide du langage de recherche d'informations du système.

La qualité d'une requête est affectée par trois facteurs : la connaissance par l'utilisateur des caractéristiques d'un langage naturel, la capacité à prendre en compte les caractéristiques linguistiques des documents et la connaissance de la structure et des caractéristiques d'un langage de recherche d'information.

Structures et caractéristiques du langage de recherche d'informations

Pour améliorer la précision des résultats de recherche, comme nous l'avons déjà noté, il est important de formuler correctement les demandes de recherche d'informations. Les langages de recherche d'informations fournissent à l'utilisateur un grand nombre d'opérateurs, c'est-à-dire mots de service utilisés pour combiner les mots-clés de la requête. Chaque moteur de recherche a son propre ensemble d'opérateurs, mais généralement ces opérateurs sont combinés en groupes communs à la plupart des systèmes.

Opérateurs de moteurs de recherche

Lorsque vous utilisez des langages de requête, vous devez tenir compte du fait qu'ils diffèrent considérablement d'un moteur de recherche à l'autre. Cela devient un gros problème lors de l'utilisation requêtes complexes dans les métamoteurs de recherche.

Opérateurs logiques

Les moteurs de recherche ont généralement trois opérateurs : "ET logique", "OU logique" et "NON logique". L'opérateur "ET logique" est indiqué entre les mots-clés s'il faut renvoyer des documents contenant tous les mots recherchés. Le « OU logique » est utilisé lorsqu'il est nécessaire de rechercher des documents contenant au moins un des mots-clés associés à cet opérateur. L'opérateur "NON logique" est nécessaire pour exclure de la liste des documents dans lesquels se trouve un mot précédé dans la requête par cet opérateur.

Une situation simple explique ce qui précède. La requête « bus et tram » ou « bus et tram » renverra uniquement les documents dans lesquels les mots bus et tram apparaissent en même temps.

La requête « bus ou tram » renverra trois types de documents : le document contient uniquement le mot bus, le document contient uniquement le mot tram et le document contient les mots bus et tram.

Le symbole "!", dans Yandex, par exemple, signifie réparer le boîtier. Si vous recherchez le nom du village "Ostrov", et non le concept géographique d'"île", vous devez écrire "!Ostrov". Lors de la recherche d'informations sur le film "The Island", il est préférable d'émettre une requête sous forme de citation : "le film The Island".

Opérateurs à distance

La plupart des moteurs de recherche offrent actuellement la possibilité d'utiliser des opérateurs dits de distance, qui fixent des limites à la distance entre les occurrences de mots-clés les unes des autres dans le texte du document. En règle générale, trois opérateurs de ce groupe sont distingués : un opérateur de recherche de phrase qui vous permet de trouver des occurrences exactes d'une séquence de mots spécifiée (une phrase est spécifiée entre guillemets), un opérateur qui définit la distance en mots et un opérateur qui définit la distance dans les phrases.

Autres opérateurs

En plus de ces deux groupes, il existe également des opérateurs :

  • en tenant compte des caractéristiques du langage naturel ;
  • sélectionner la partie du document à rechercher ;
  • sélectionner pour rechercher des pages écrites dans une langue particulière ;
  • limiter la recherche à un type de fichier spécifique ;
  • rechercher du texte dans les en-têtes de page ;
  • sélection d'un sous-ensemble de documents.

La composition de ces groupes dépend fortement du moteur de recherche.

Travail de groupe sur la recherche d'informations sur Internet - 15 min.

Des groupes d'étudiants reçoivent un devoir Annexe 2.

Exécution du test - 5 min.

Résumé de la leçon - 5 min.

Résumons notre travail. Vous parlez l'un après l'autre dans une phrase, en choisissant le début de la phrase sur l'écran réfléchissant.

  • Aujourd'hui j'ai découvert...
  • C'était difficile…
  • J'ai fait des devoirs...
  • J'ai appris…
  • J'ai acheté...
  • J'ai réalisé que...
  • C'etait intéressant…

Devoirs

1. Article 3.5. Répondez aux questions après le paragraphe.

2. Remplir par écrit. Une liste de différents moteurs de recherche a été proposée. Divisez-les en deux colonnes.

Système russe Système international

Littérature

  1. Informatique et TIC., N.D. Ugrinovich, 8e année