Maison / Tutoriels Windows / Quoi de neuf dans le moteur de recherche Yandex. "Yandex" a lancé une nouvelle recherche "intelligente". Comment l'utiliser? De Matrixnet aux réseaux de neurones

Quoi de neuf dans le moteur de recherche Yandex. "Yandex" a lancé une nouvelle recherche "intelligente". Comment l'utiliser? De Matrixnet aux réseaux de neurones

Yandex plaît à nouveau aux utilisateurs avec des innovations pour améliorer la qualité de la recherche d'informations. Aujourd'hui, les changements ont affecté les extraits - un bouton "En savoir plus" et une discussion avec l'entreprise sont apparus. Examinons de plus près ces mises à jour.

Un nouveau bouton "En savoir plus" est apparu dans la version de bureau de la recherche Yandex, avec son aide, l'utilisateur peut voir un extrait étendu du site. Lorsque vous cliquez sur le bouton, le texte explicatif associé à la demande apparaît.

Précédemment fonction donnéeétait disponible uniquement pour les appareils mobiles, mais maintenant il a été introduit dans la fonctionnalité de la version de bureau Résultats de recherche sur une base continue.

Dans un passé récent, un extrait Yandex affichait une quantité limitée d'informations - 240 caractères avec des espaces, environ 3 lignes. Souvent, l'utilisateur n'avait pas assez de ces informations et il était nécessaire d'aller sur le site à la recherche d'informations intéressantes.

Désormais, avec l'ajout de ce bouton, le processus de recherche d'informations pour l'utilisateur peut s'accélérer plusieurs fois.

Vue du nouvel extrait Yandex

À quoi ressemblait l'extrait Yandex auparavant :

Maintenant, l'extrait de code Yandex dans un état réduit ressemble à ceci

Ce type d'extrait a version mobile

Vue appropriée dans l'émission mobile.

Avantages et inconvénients de l'extrait de code étendu Yandex

Sur la base de ces informations, l'utilisateur peut faire un choix plus éclairé quant à l'utilité de la ressource. Et pour le propriétaire du site, un rich snippet est une opportunité d'en savoir plus trafic ciblé, améliorer facteurs comportementaux- par exemple, réduire le taux de rebond et augmenter le trafic de conversion.

Cependant, l'introduction de cette fonction peut également avoir un impact négatif sur le trafic de recherche du site, puisque cette description sera tout à fait suffisante pour que l'utilisateur obtienne l'information qu'il recherche sans se rendre sur le site.

En ce qui concerne la longueur de l'extrait présenté, les experts de Yandex disent ceci :

"Le principe est le suivant : l'extrait présenté ne peut pas être plus de 3 fois plus long que l'extrait actuel". Autrement dit, la longueur maximale de l'extrait de code sur ce moment peut contenir jusqu'à 9 lignes ou 650-700 caractères.

"En ce qui concerne l'origine des descriptions étendues, les mêmes règles s'appliquent ici que pour les extraits réguliers", expliquent les experts de Yandex. Le moteur de recherche génère un extrait conformément à la demande de l'utilisateur, et si les informations de la balise méta de description ne suffisent pas, Yandex prendra les informations de la page du site.

Vous pouvez en savoir plus sur les règles des extraits de code Yandex dans cet article.

Vous devez être prudent, il est possible que des informations sur le service entrent dans l'extrait de code étendu : texte des boutons de pagination, filtres, tri, etc., vous devez donc le fermer dans le code avec des balises..

Chat Jivosite dans les résultats de recherche Yandex

En outre, un chat est apparu dans l'extrait de code Yandex. Yandex et Jivosite ont ajouté un chat à la page des résultats de recherche. Depuis le 26 avril 2018, les clients peuvent contacter l'assistance d'un site sur lequel Jivosite Chat est installé sans se rendre sur le site.

Après avoir connecté le chat, vous pourrez :

  • activer ou désactiver le chat dans la recherche ;
  • ajouter une réponse automatique ;
  • ajouter des indices ;
  • ajouter une icône ;
  • spécifier les heures de travail de l'organisation et limiter le nombre de pages sur lesquelles le chat sera affiché.

Les instructions pour ajouter un chat à votre site sont présentées sur le site officiel du service Jivosite.

Affichage du chat dans les résultats de recherche

À quoi ressemble l'extrait "Chat with Company" dans la version de bureau :

Veuillez noter qu'il existe différentes icônes pour démarrer un chat pour les versions de bureau et mobiles.

Après avoir cliqué sur le bouton « Chatter avec l'entreprise », un formulaire de communication avec le support du site apparaît directement sur la page des résultats de recherche.

Dans la version mobile de la recherche, la fenêtre de discussion s'ouvre au-dessus de la fenêtre actuelle, mais pas dans un nouvel onglet.

Une caractéristique intéressante du chat est la conservation de l'historique de la correspondance d'un utilisateur autorisé avec le support du site à l'autre bout de Jivosite.

Après avoir envoyé la lettre, l'utilisateur a la possibilité de minimiser le chat et de continuer à rechercher des informations d'intérêt :

Une fois que le support du site a répondu à l'utilisateur, une nouvelle notification de message apparaîtra à droite :

Avantages et inconvénients du chat

Cet extrait vous permet de rendre plus accessible la communication de l'utilisateur avec l'organisation. L'utilisateur pourra effectuer un achat ou poser une question d'intérêt sans se rendre sur le site.

L'inconvénient est que si l'opérateur n'est pas en ligne et que le client a envoyé un message, l'opérateur ne recevra le message que lorsque le client sera en ligne la prochaine fois.

De plus, l'inconvénient est que le chat sur la page des résultats de recherche n'est pas synchronisé avec le chat sur le site lui-même. Imaginez une situation : un utilisateur il y a quelques jours a écrit à l'appui du site directement à partir des résultats de la recherche, et une semaine plus tard a décidé d'aller sur le site et de clarifier les informations sur son problème sur le site lui-même. Par conséquent, l'opérateur peut ne pas comprendre ce qui se passe et quel est le problème. Une situation délicate, n'est-ce pas ? Le client devra passer du temps à réexpliquer le problème, ou lui, ne voulant pas dupliquer l'appel, mettra complètement fin à la communication. Pour le moment, il n'y a pas de solution à cette situation, espérons qu'à l'avenir, les spécialistes de Yandex, avec Jivosite, trouveront une issue.

Conclusion

Yandex ne reste pas immobile et propose constamment quelque chose d'intéressant. Cette fois, nous avons ajouté fonctionnalités utiles, les extraits de Yandex ont acquis un nouveau look et de nouvelles fonctionnalités. Cela contribuera à améliorer la qualité des informations dans les résultats de recherche.

Si vous n'avez pas le temps, vous pouvez toujours nous contacter pour vous aider à installer cet outil.

Cette semaine, le 22 août, Yandex lancé une nouvelle version de la recherche avec l'algorithme "Korolev". Il s'appuie sur un réseau de neurones qui lui permet de faire correspondre le sens d'une requête et d'une page web et de répondre beaucoup plus précisément à des requêtes complexes et ambiguës. Pour former une nouvelle version de la recherche, des statistiques de recherche et des estimations de millions de personnes sont utilisées : il s'avère que non seulement les développeurs, mais tous les utilisateurs en général, contribuent au développement du système.
La présentation du "Korolyov" a eu lieu, ce qui est symbolique, au Planétarium de Moscou. Andrey Styskin, responsable de Yandex.Search, Alexander Safronov, responsable du service de pertinence Yandex.Search et Olga Megorskaya, responsable du département de traitement des données Yandex.Search se sont produits sur scène.

De Matrixnet aux réseaux de neurones

Les moteurs de recherche sont apparus au milieu des années 90 du siècle dernier, alors qu'Internet était très petit - seulement quelques milliers de sites. Au début, les moteurs de recherche compilaient simplement une liste de pages où se trouvaient des mots spécifiés sans problème, classés en fonction du degré de correspondance avec la requête. Plus les mots de la requête apparaissent souvent dans le document, mieux c'est. Il est clair qu'avec l'état actuel réseau mondial quelque chose comme ça ne fonctionnera plus.

Yandex a proposé Matrixnet pour traiter les demandes - une méthode d'apprentissage automatique qui a été utilisée pour créer la formule de classement de l'auteur. Cependant, la recherche a continué à s'appuyer sur des mots. Mais qu'en est-il des requêtes que les utilisateurs formulent de manière allégorique ou associative ? Ensuite, la page Web que vous recherchez ne doit pas nécessairement contenir strictement tous les mots de la requête. Mais comment expliquer cela à une machine ? Si seulement elle nous comprenait en tant que personne...




En fin de compte, les scientifiques ont proposé quelque chose à l'intersection de la technologie et de la biologie - un réseau de neurones artificiels (ANN). Selon le libellé de Wikipedia, il s'agit "d'un modèle mathématique, ainsi que de son implémentation logicielle ou matérielle, construit sur le principe de l'organisation et du fonctionnement des réseaux de neurones biologiques - réseaux de cellules nerveuses d'un organisme vivant". Les réseaux de neurones sont capables de traiter les informations comme nous le faisons et, surtout, d'apprendre et de perfectionner des compétences comme les êtres vivants. En fait, ils sont à la base d'une véritable intelligence artificielle, dont l'apparition est une question de temps.

L'année dernière, Yandex a introduit l'algorithme de recherche Palekh basé sur un réseau de neurones. Il a montré d'excellents résultats dans la résolution de problèmes qui n'étaient généralement possibles que pour les humains : il a fait un excellent travail de reconnaissance de la parole et des objets dans les images. "Palekh" a appris à convertir les requêtes de recherche et les titres de pages Web en groupes de nombres - des vecteurs sémantiques. Leur propriété importante est que les vecteurs peuvent être comparés entre eux : plus la similarité est forte, plus la requête et le titre ont un sens proche.




"Rois". qui comprend

L'étape suivante dans le développement d'un moteur de recherche basé sur des réseaux de neurones a été l'algorithme de Korolev, qui analyse non seulement le titre, mais la page entière ! Le nombre de pages dont la recherche compare le sens à la requête est passé de 150 documents à 200 000. Entre autres choses, Korolev a également commencé à prendre en compte le sens des autres requêtes par lesquelles les gens accèdent à la page qu'ils recherchent.

Le réseau de neurones apprend comme un enfant. Pour maîtriser cela, elle avait besoin d'un grand nombre d'exemples. En fait, tous les utilisateurs du service ont été engagés dans la formation spontanée de Korolev d'une manière ou d'une autre : des statistiques de recherche et des estimations de millions de personnes ont été utilisées. Yandex apprend progressivement à reconnaître de plus en plus précisément les connexions sémantiques, comme : [une image où le ciel se tord] concerne une peinture de Van Gogh, [un chat paresseux
de Mongolie] - manul.


La recherche est un système très complexe. Des milliers d'ingénieurs travaillent pour s'assurer qu'elle comprend une personne et aide à résoudre ses problèmes. À Korolev, nous avons combiné l'intelligence artificielle et les efforts de millions de personnes. Nos utilisateurs améliorent la recherche avec nous en posant des questions et en aidant à former nos algorithmes.
Andreï Styskin, responsable de la recherche Yandex.
En plus d'analyser la routine quotidienne, la formation du moteur de recherche nécessite des évaluations de la qualité des réponses. Plus le système est complexe, plus il faut d'évaluations. Si auparavant un groupe relativement restreint d'évaluateurs experts, membres de l'équipe Yandex, était engagé dans l'évaluation de la qualité de la recherche, il était maintenant nécessaire d'augmenter sérieusement le volume. C'est ainsi que le service est né. Yandex.Toloki(toloka est une forme d'entraide autrefois pratiquée par les villageois). Tout passionné intéressé par une petite récompense et, bien sûr, par le sentiment d'appartenir à quelque chose d'important, peut effectuer des tâches simples. Il y a maintenant plus d'un million de personnes avec de tels tolokers, et le nombre d'évaluations qu'ils ont données a dépassé les 2 milliards.




« La recherche moderne est basée sur des algorithmes complexes. Les algorithmes sont inventés par des développeurs et enseignés par des millions d'utilisateurs Yandex. Toute demande est un signal anonyme qui aide la machine à mieux comprendre les gens. Par conséquent, nous ne nous tromperons pas si nous disons : nouvelle recherche est une recherche que nous avons faite ensemble », lit-on dans l'entrée du blog Yandex.

Dans l'histoire de plus de deux ans de Yandex.Toloka, le participant le plus productif et le plus diligent a été identifié. Ils sont devenus Ilya Mikhalenko de Tcheliabinsk. Le gars est venu à la présentation de "Korolev" à Moscou pour recevoir un prix bien mérité des mains de l'équipe du moteur de recherche.




Nouvelle recherche en action

Quel est le moyen pratique d'améliorer le travail de notre Yandex ? Maintenant, vous pouvez lui parler presque comme un ami intelligent et érudit. (Même d'une voix.) Par exemple, que ferez-vous si vous devez vous souvenir du nom d'un film dont vous vous souvenez d'un passage, mais que les noms des acteurs et du réalisateur vous sortent de la tête ? Vous pouvez vous tourner vers des amis ou demander de l'aide sur un forum thématique. Et vous pouvez demander à la "Reine" !

La recherche d'images a été grandement améliorée. Avec eux, en règle générale, il y a toujours une sorte d '"enfer": soit le moteur de recherche donne inconsidérément toutes les images au nom desquelles les mots de la requête sont utilisés, soit prend en compte le texte de l'article qui l'image illustre. Si vous cherchez quelque chose qui répondrait aux vagues besoins de l'âme, alors préparez-vous à être déçu. "Korolev" analyse exactement ce qui est montré sur l'image, il est donc capable de plaire avec une approche non triviale.






À titre d'exemple, les tests n'ont pas reçu la demande la plus évidente - [un chat dans l'espace]. Les chiens étaient assez souvent en orbite, mais les conquérants disciplinés à moustaches rayées de l'espace n'ont pas fonctionné. Une seule tentative est connue avec certitude : en 1963, les Français lancent le chat Felicette en vol suborbital. Romantique, mais myope, - dès que les scientifiques ont ouvert l'écoutille de la capsule d'atterrissage, l'obscurité était comme ça. La séance photo n'a pas eu lieu.

Sur demande, le moteur de recherche donne non seulement des petits animaux en combinaisons spatiales et des crapauds photo surréalistes, mais aussi une photo d'un chat dans Machine à laver, qui est assez similaire à l'écoutille d'un vaisseau spatial. Mais ce n'est pas précisé dans le descriptif.

Pour le lancement solennel du nouveau moteur de recherche, toute l'équipe Yandex.Search est montée sur scène. Un petit compte à rebours et... c'est parti ! Désormais, tout le monde peut découvrir les capacités de la "reine" perspicace. L'essentiel est que ses capacités actuelles ne soient pas statiques, mais en constante évolution.

Pour terminer la soirée, les organisateurs ont préparé quelque chose de complètement inattendu - une session de communication avec de vrais astronautes en orbite. Ils ont personnellement répondu à certaines requêtes populaires utilisateurs des moteurs de recherche sur l'espace et répondu aux questions des personnes présentes.

Hier, certains habitants de notre pays ont soudainement découvert cela. Il a été temporairement bloqué par les fournisseurs TTK, Akado, Avaks et Sumtel sous la direction de Roskomnadzor. Mais une proportion importante d'abonnés de ces fournisseurs n'ont pas remarqué le blocage, car ils utilisent moteur de recherche.

À avril 2017 dans "Yandex" a cherché quelque chose 43 millions de personnes. Si vous êtes l'un d'entre eux, alors ce court article est pour vous.

PS Pour ceux qui préfèrent Google et DuckDuckGo, il y a des liens dans la dernière section.

1. Comment rechercher parmi les sites d'une ville, d'une région, d'un district fédéral ou d'un pays ?

C'est ainsi que vous pouvez trouver des informations sur la requête "bal des diplômés" parmi les sites de la ville de Bratsk :

chat de balle des anciens: 11000976

Pour connaître le numéro à composer après l'opérateur chat:, il faut ajouter à 1100000 code de région dans "Yandex.Catalog". Par exemple:

  • Moscou - 1100001 ;
  • Tchernihiv - 1100966;
  • Voronej - 1100193;
  • Région de la Volga - 1100040 ;
  • Kirghizistan - 1100207 ;
  • Pays de la CEI - 166.

Il y a déjà plus de 117 000 sites dans Yandex.Catalog. De même, vous ne pouvez rechercher quelque chose que parmi les ressources dédiées à un sujet particulier. Pour ce faire, au lieu des codes de région, vous devez utiliser codes thématiques et ajoutez-leur 9000000 au lieu de 1100000.

2. Comment tromper Yandex sur votre emplacement ?

Utilisation de l'extension Chrome Géolocalisation manuelle vous pouvez marquer n'importe quel point sur la carte et le moteur de recherche pensera que vous êtes exactement là et ajustera les résultats de la recherche en fonction de ces données. Par exemple, vous pouvez rechercher des objets situés près de chez vous à Saint-Pétersbourg, mais en même temps situés à Moscou. Pratique lors de la planification de voyages.

Cet élément est pertinent pour tous les sites qui utilisent vos données de localisation.

3. Comment rechercher des pages dans une zone de domaine spécifique et dans une langue spécifique ?

Voici comment vous pouvez trouver ce que les sites ukrainiens écrivent sur les zèbres (dans la zone de domaine ua) en ukrainien :

zèbre domaine:ua lang:uk

De même, vous pouvez connaître l'opinion des sites d'autres États sur diverses questions. Codes de langue pour Yandex :

  • russe (russe);
  • Ukrainien (Royaume-Uni);
  • biélorusse (être);
  • anglais (en);
  • français (fr);
  • allemand (de);
  • Kazakh (kk);
  • tatar (tt);
  • Turc (tr).

4. Comment rechercher des pages sur un site spécifique ?

Voici comment vous pouvez rechercher des pages uniquement sur le site site :

site des zèbres : site

De cette façon, vous pouvez rechercher uniquement parmi les articles d'une certaine catégorie. Par exemple, parmi les questions de Site de sauvetage:

URL des messages :site Web/iNotes/q/*

Et voici comment obtenir une liste de toutes les balises utilisées sur le site :

5. Comment rechercher des pages créées à une date précise ?

Voici comment vous pouvez trouver des pages créées un jour précis :

date d'emploi de steve : 20170617

Et comme ça entre deux rendez-vous :

date d'emploi de steve : 20170610..20170617

Et avec l'opérateur je sors avec: vous pouvez rechercher des pages en fonction de la date de la dernière indexation.

6. Comment rechercher des fichiers d'un type spécifique ?

Recherche de livres dans Format PDFà télécharger dans iBooks :

fleurs pour algernon mime:pdf

Et c'est ainsi que vous pouvez trouver tous les documents MS Word avec la mention du mot "déclaration" sur le site du Service fédéral des impôts :

déclaration mime:docx site:nalog.ru

Types de documents indexés par Yandex :

  • html ;
  • docx;
  • xlsx ;
  • pptx ;

7. Comment rechercher uniquement dans les titres des pages ?

Avec cet opérateur :

C'est très pratique lorsque vous avez besoin de trouver un article par le titre exact.

8. Comment rechercher par nom de fichier image ?


Vous avez enregistré une image sur votre ordinateur, vous souhaitez l'utiliser avec la source, mais vous ne vous souvenez pas d'où elle vient ? L'opérateur de recherche du nom exact de l'image vous aidera :

Opérateurs de recherche par valeurs d'attributs de balises HTML :

applet :– code de la balise applet ;
scénario:- src de la balise de script ;
objet:– tous les attributs d'objet;
action:– action de la balise form ;
profil:– profil de la balise de tête.

9. Comment trouver des liens vers une page spécifique ?

Yandex dispose d'un opérateur pour rechercher les mentions d'une requête à l'intérieur des liens. De cette façon, vous pouvez trouver des liens vers une page spécifique.

lien entrant : "www.website/iNotes/533552"

10. Comment utiliser les widgets et les astuces ?

Si vous saisissez l'un des quatre mots ci-dessous dans la recherche, des mini-applications apparaîtront sous la barre de recherche :

  • "Calculatrice";
  • "Convertisseur de devises" ;
  • "Convertisseur";
  • "Traduction".

Et pour certaines demandes, les réponses s'affichent directement dans ligne de recherche. Exemples.


Yandex a lancé une nouvelle version de la recherche. Il est basé sur l'algorithme de recherche "Korolev". L'algorithme utilise un réseau de neurones pour faire correspondre la signification des demandes et des pages Web - cela permet à Yandex de répondre plus précisément aux requêtes complexes. Les statistiques de recherche et les évaluations de millions de personnes sont utilisées pour former la nouvelle version de la recherche. Ainsi, non seulement les développeurs, mais également tous les utilisateurs de Yandex contribuent au développement de la recherche.

Mots et sens

Avant de parler du présent et du futur de la recherche, rappelons son passé. Les premiers moteurs de recherche sont apparus au milieu des années 1990, alors qu'Internet était très petit - le nombre de sites s'élevait à des milliers. Pour aider une personne à trouver la bonne, il suffisait de faire une liste de pages Web où se trouvent des mots de la requête de recherche. Il n'a pas été question de classement complexe, c'est-à-dire de classement des pages en fonction du degré de conformité à la demande. On pensait que plus les mots de la requête apparaissaient souvent dans le document, mieux il convenait.

L'Internet s'est développé rapidement et des critères de sélection supplémentaires étaient nécessaires. Les moteurs de recherche ont commencé à prendre en compte les liens vers les documents, ont appris à déterminer la région d'où provenait la demande et ont commencé à prêter attention au comportement des utilisateurs.

À un moment donné, il y avait tellement de facteurs de classement - des signes par lesquels vous pouvez déterminer dans quelle mesure une page répond à une demande - qu'il est devenu clair qu'il était impossible de tous les écrire sous forme d'instructions. Il vaut mieux apprendre à la machine à prendre des décisions par elle-même : quelles fonctionnalités utiliser et comment les combiner. Yandex a proposé Matrixnet à ces fins. C'est la méthode d'apprentissage automatique qui construit notre formule de classement.

La recherche, cependant, repose toujours sur des mots. Avant de lancer une formule de classement complexe, les moteurs de recherche compilent une liste de pages Web "pré-qualifiées", celles qui contiennent les mots de la requête. Nous, les humains, comprenons que le même sens peut être exprimé mots différents. Une page Web peut ne pas contenir tous les mots d'une requête, mais y répondre tout de même très bien. Cependant, il est assez difficile d'expliquer cela à une machine.

Yandex a fait le premier pas vers la recherche par sens l'année dernière lorsque la société a introduit l'algorithme de recherche Palekh. C'est basé sur réseau neuronal. Les réseaux de neurones montrent d'excellents résultats dans les tâches auxquelles les gens sont traditionnellement confrontés. meilleures voitures: dire, reconnaître la parole ou des objets dans les images.

En lançant Palekh, la société a appris au réseau de neurones à convertir les requêtes de recherche et les titres de pages Web en groupes de nombres - des vecteurs sémantiques. Propriété importante de tels vecteurs est qu'ils peuvent être comparés entre eux : plus la similarité est forte, plus la signification de la requête et de l'en-tête est proche.

Comment fonctionne l'algorithme de Korolev

L'algorithme de recherche de Korolev compare les vecteurs sémantiques des requêtes de recherche et des pages Web entières, et pas seulement leurs titres. Cela vous permet d'aller à nouveau niveau compréhension du sens. Imaginez que vous ayez entendu parler pour la première fois du roman Guerre et paix de Léon Tolstoï. Bien sûr, vous pouvez donner un sens au titre - par exemple, suggérer qu'il y a de nombreuses scènes de bataille dans le livre. Mais pour apprendre toutes les subtilités de l'intrigue et donner des réponses complètes aux questions sur le roman, vous devrez le lire dans son intégralité.

Comme dans le cas de Palekh, les textes des pages web sont convertis en vecteurs sémantiques par un réseau de neurones. Cette opération nécessite beaucoup de ressources informatiques. Comparez : il vous faudra quelques secondes pour lire le titre d'un livre, mais il vous faudra des heures, des jours voire des semaines pour tout lire d'un bout à l'autre. Par conséquent, Korolev ne calcule pas les vecteurs de page en temps réel, mais à l'avance, au stade de l'indexation. Lorsqu'une personne fait une requête, l'algorithme compare le vecteur de requête avec les vecteurs de page qu'il connaît déjà.

Un tel schéma vous permet de commencer la sélection des pages Web qui correspondent à la requête en termes de sens dès les premières étapes du classement. A Palekh, l'analyse sémantique est l'une des étapes finales : seuls 150 documents y passent. À Korolev, il est produit pour 200 000 documents, soit plus de mille fois plus. En outre, le nouvel algorithme compare non seulement le texte d'une page Web avec requête de recherche, mais attire également l'attention sur d'autres demandes pour lesquelles les gens viennent sur cette page. De cette manière, des connexions sémantiques supplémentaires peuvent être établies.

Les gens enseignent les machines

Yandex pense que l'utilisation de l'apprentissage automatique, et en particulier des réseaux de neurones, apprendra tôt ou tard à la recherche à fonctionner avec des significations au niveau humain. Mais sans l'aide des gens, ce n'est pas possible. Pour qu'une machine comprenne comment résoudre un problème particulier, il est nécessaire de lui montrer un grand nombre d'exemples: positifs et négatifs. De tels exemples sont donnés par les utilisateurs de Yandex.

Le réseau de neurones utilisé par l'algorithme de Korolev est entraîné sur des statistiques de recherche impersonnelles. Les systèmes de collecte de statistiques tiennent compte des pages sur lesquelles les utilisateurs se rendent pour certaines requêtes et du temps qu'ils y passent. Si une personne a ouvert une page Web et s'y est "accrochée" pendant longtemps, elle a probablement trouvé ce qu'elle cherchait - c'est-à-dire que la page répond bien à sa demande. C'est un exemple positif. Il est beaucoup plus facile de prendre des exemples négatifs : il suffit de prendre une requête et n'importe quelle page Web au hasard.

Matrixnet, qui construit une formule de classement, a également besoin de l'aide des gens. Pour que la recherche évolue, les gens doivent constamment évaluer son travail. Il était une fois, seuls les employés de Yandex, les soi-disant évaluateurs, étaient engagés dans la notation. Mais plus il y a de notes, mieux c'est - nous avons donc décidé d'impliquer tout le monde et avons lancé le service Yandex.Toloka. Aujourd'hui, plus d'un million d'utilisateurs y sont enregistrés : ils analysent la qualité de la recherche et participent à l'amélioration d'autres services Yandex. Les tâches sur Toloka sont payées - le montant qui peut être gagné est indiqué à côté de la tâche. Pendant plus de deux ans d'existence du service, les tolokers ont donné environ deux milliards de notes.

La recherche moderne est basée sur des algorithmes complexes. Les algorithmes sont inventés par des développeurs et enseignés par des millions d'utilisateurs Yandex. Toute demande est un signal anonyme qui aide la machine à mieux comprendre les gens. Par conséquent, Yandex ne se trompera pas s'il dit : une nouvelle recherche est une recherche que nous avons faite ensemble.

Le réseau de neurones analyse non seulement le titre, mais toute la page, tandis que le moteur de recherche détermine son essence même au stade de l'indexation

MOSCOU, 22 août. /TASS/. "Yandex" a lancé une nouvelle version de la recherche, basée sur une comparaison du sens de la requête et de la page Web, a indiqué la société. La nouvelle version fonctionne sur l'algorithme "Korolev", qui utilise un réseau de neurones pour déterminer exactement ce dont l'utilisateur a besoin. Le réseau de neurones analyse non seulement le titre, mais la page entière, tandis que Yandex détermine l'essence de la page à l'avance, au stade de l'indexation.

Une autre caractéristique de la "Reine" est qu'elle prend également en compte le sens des autres requêtes par lesquelles les gens basculent vers elle. « Pour qu'un réseau de neurones évalue la similarité sémantique d'une requête et d'un document, il a besoin d'un grand nombre d'exemples. De tels exemples sont donnés par des statistiques de recherche impersonnelles : sur quels sites les internautes se tournent pour des requêtes et combien de temps ils y passent. Donc, si une personne est allée sur la page et l'a parcourue pendant un certain temps, il est fort probable qu'elle ait un sens proche de la requête. Utilisant statistiques de recherche millions de personnes, Yandex apprend à comprendre les connexions sémantiques. Par exemple, il comprendra que dans la requête "image où le ciel tourbillonne", nous parlonsà propos d'un tableau de Van Gogh, et dans la requête "chat paresseux de Mongolie" - à propos d'un manul", a déclaré la société dans un communiqué de presse.

L'année dernière, Yandex a déjà lancé un système basé sur les réseaux de neurones - Palekh. Le système précédent indexait 150 pages, dans la "Reine", le nombre de pages que la recherche compare en sens avec la requête est passé à 200 000.

Le nouvel algorithme porte le nom du fondateur de l'astronautique russe Sergei Korolev.

"Et aujourd'hui, nous lançons un nouvel algorithme de classement pour le Queens. Pourquoi avons-nous choisi ce nom ? Sergei Pavlovich Korolev a réalisé le rêve de l'humanité de voler dans l'espace. Pour nous, chez Yandex, le lancement d'aujourd'hui est tout aussi important, une percée technologique vers le rêve d'une recherche qui comprend les utilisateurs », a déclaré Alexander Safronov, responsable du service de pertinence linguistique Yandex, lors de la présentation de la nouvelle version de la recherche.

Aide en salle

Pour former un moteur de recherche, vous devez évaluer la qualité des réponses. Auparavant, "Yandex" évaluait la qualité de la recherche avec l'aide de ses évaluateurs. La nouvelle recherche prendra en compte les notes que les utilisateurs du service Yandex.Toloka, un réseau distribué d'évaluateurs, mettront en place. Le service permet à quiconque d'accomplir des tâches et de recevoir des récompenses pour celles-ci. Il compte actuellement plus d'un million d'utilisateurs enregistrés. Tout le monde peut s'inscrire sur la plateforme.

Yandex est le plus grand moteur de recherche en Russie. La part de l'entreprise sur le marché russe de la recherche (y compris la recherche sur appareils mobiles) au deuxième trimestre de 2017 était en moyenne de 54,3%, au premier trimestre de cette année - 54,7% (selon le service d'analyse Yandex.Radar). Selon Liveinternet.ru, en juin de cette année partage de recherche Yandex représentait 51,3 %.