itthon / Windows oktatóanyagok / Újdonságok a Yandex keresőjében. A "Yandex" új "okos" keresést indított. Hogyan kell használni? A Matrixnettől a neurális hálózatokig

Újdonságok a Yandex keresőjében. A "Yandex" új "okos" keresést indított. Hogyan kell használni? A Matrixnettől a neurális hálózatokig

A Yandex ismét újításokkal várja a felhasználókat az információkeresés minőségének javítására. Mára a változtatások kivonatokat érintettek – megjelent egy "Tovább" gomb és egy chat a céggel. Nézzük meg közelebbről ezeket a frissítéseket.

Új „Tovább” gomb jelent meg a Yandex kereső asztali verziójában, melynek segítségével a felhasználó egy kibővített részletet láthat az oldalról. A gombra kattintva megjelenik a kéréshez kapcsolódó magyarázó szöveg.

Korábban adott funkciót csak mobileszközökön volt elérhető, de most bekerült az asztali verzió funkcionalitásába Keresési eredményekállandó jelleggel.

A közelmúltban egy Yandex-kódrészlet korlátozott mennyiségű információt jelenített meg - 240 karakter szóközökkel, körülbelül 3 sor. A felhasználónak gyakran nem volt elég ebből az információból, és fel kellett keresnie a webhelyet az érdeklődésre számot tartó információk keresésére.

Mostantól ennek a gombnak a hozzáadásával a felhasználó információkeresésének folyamata többször is felgyorsulhat.

Az új Yandex kódrészlet megtekintése

Így nézett ki a Yandex kódrészlet korábban:

Most a Yandex kódrészlet összecsukott állapotban így néz ki

Ez a fajta részlet rendelkezik mobil verzió

Megfelelő nézet a mobil kiadásban.

A Yandex kiterjesztett kódrészletének előnyei és hátrányai

Ezen információk alapján a felhasználó megalapozottabban dönthet az erőforrás hasznosságáról. A webhely tulajdonosa számára pedig egy bővített kivonat lehetőséget kínál arra, hogy többet érjen el célzott forgalom, javítani viselkedési tényezők- például csökkenti a visszafordulási arányt és növeli a konverziós forgalmat.

Ennek a funkciónak a bevezetése azonban negatív hatással lehet az oldal keresési forgalmára is, mivel ez a leírás bőven elég lesz ahhoz, hogy a felhasználó az oldal felkeresése nélkül is megkapja a keresett információkat.

Ami a kiemelt részlet hosszát illeti, a Yandex szakértői ezt mondják:

"Az elv a következő: a kiemelt részlet legfeljebb háromszor lehet hosszabb, mint a jelenlegi". Azaz a kódrészlet maximális hossza be Ebben a pillanatban legfeljebb 9 sor vagy 650-700 karakter lehet.

„Arra vonatkozóan, hogy honnan származnak a kiterjesztett leírások, itt ugyanazok a szabályok érvényesek, mint a normál kivonatokra” – magyarázzák a Yandex szakértői. A kereső a felhasználó kérésének megfelelően egy kódrészletet generál, és ha a leírási metacímkéből származó információ nem elegendő, a Yandex leveszi az információt a webhely oldaláról.

A Yandex-kódrészletekre vonatkozó szabályokról ebben a cikkben olvashat bővebben.

Legyen óvatos, előfordulhat, hogy a szolgáltatási információk bekerülnek a kiterjesztett kódrészletbe: oldalszámozási gombokból származó szöveg, szűrők, rendezés és egyebek, ezért zárja be a kódba címkékkel.

Jivosite chat a Yandex keresési eredményeiben

Ezenkívül egy csevegés jelent meg a Yandex kódrészletben. A Yandex és a Jivosite csevegést adott a keresési eredményoldalhoz. 2018. április 26-tól az ügyfelek anélkül léphetnek kapcsolatba az ügyfélszolgálattal, ha a Jivosite Chat telepítve van.

A csevegés csatlakoztatása után a következőkre lesz lehetősége:

  • engedélyezze vagy tiltsa le a csevegést a keresésben;
  • automatikus válasz hozzáadása;
  • tippeket ad hozzá;
  • ikon hozzáadása;
  • adja meg a szervezet munkaidejét, és korlátozza azon oldalak számát, amelyeken a csevegés meg fog jelenni.

A csevegés webhelyéhez való hozzáadására vonatkozó utasítások a Jivosite szolgáltatás hivatalos webhelyén találhatók.

Csevegés nézet a keresési eredmények között

Így néz ki a „Csevegés a vállalattal” kódrészlet az asztali verzióban:

Felhívjuk figyelmét, hogy az asztali és a mobil verzióban különböző ikonok állnak rendelkezésre a csevegés indításához.

A „Csevegés a céggel” gombra kattintás után közvetlenül a keresési eredményoldalon megjelenik egy űrlap a webhely támogatásával való kommunikációhoz.

A keresés mobil verziójában a csevegőablak az aktuális ablak tetején nyílik meg, de nem új lapon.

A chat érdekessége, hogy a Jivosite másik végén lévő oldal támogatásával megőrzi egy jogosult felhasználó levelezésének történetét.

A levél elküldése után a felhasználónak lehetősége van minimalizálni a csevegést, és folytatni az érdeklődésre számot tartó információk keresését:

Miután a webhely támogatása válaszol a felhasználónak, egy új üzenet jelenik meg a jobb oldalon:

A chat előnyei és hátrányai

Ez a kódrészlet lehetővé teszi, hogy elérhetőbbé tegye a felhasználó kommunikációját a szervezettel. A felhasználó anélkül vásárolhat, hogy feltenné érdeklődését anélkül, hogy felkeresné az oldalt.

Hátránya, hogy ha az operátor nincs online, és az ügyfél üzenetet küldött, akkor az üzemeltető csak akkor kapja meg az üzenetet, amikor az ügyfél legközelebb online lesz.

A hátránya továbbá, hogy a keresési eredményoldalon zajló csevegés nincs szinkronizálva magán a webhelyen zajló csevegéssel. Képzeljen el egy helyzetet: egy felhasználó néhány nappal ezelőtt közvetlenül a keresési eredményekből írt a webhely támogatására, egy héttel később pedig úgy döntött, hogy felkeresi a webhelyet, és magán az oldalon tisztázza a problémájával kapcsolatos információkat. Ennek eredményeként előfordulhat, hogy a kezelő egyáltalán nem érti, mi történik és mi a probléma. Kínos helyzet, nem? Az ügyfélnek időt kell töltenie a probléma újbóli kifejtésével, vagy ha nem akarja megismételni a fellebbezést, teljesen befejezi a kommunikációt. Jelenleg nincs megoldás erre a helyzetre, reméljük, hogy a jövőben a Yandex szakemberei a Jivosite-tal együtt megtalálják a kiutat.

Következtetés

A Yandex nem áll meg, és folyamatosan előáll valami érdekességgel. Ezúttal kiegészítettük hasznos funkciókat, a Yandex töredékei új megjelenést és új funkciókat kaptak. Ez segít javítani a keresési eredményekben megjelenő információk minőségét.

Ha nincs ideje, bármikor forduljon hozzánk segítségért az eszköz telepítéséhez.

Ezen a héten, augusztus 22-én Yandex elindította a keresés új verzióját a "Korolev" algoritmussal. Egy neurális hálózaton alapul, amely lehetővé teszi egy kérés és egy weboldal jelentésének egyeztetését, és sokkal pontosabban válaszol az összetett és kétértelmű kérésekre. A keresés új verziójának betanításához keresési statisztikákat és több millió emberre vonatkozó becsléseket használnak: kiderül, hogy nemcsak a fejlesztők, hanem általában az összes felhasználó is hozzájárul a rendszer fejlesztéséhez.
A "Koroljov" bemutatására, ami szimbolikus, a moszkvai planetáriumban került sor. A színpadon fellépett Andrey Styskin, a Yandex.Search vezetője, Alekszandr Safronov, a Yandex.Search Relevance Service vezetője és Olga Megorskaya, a Yandex.Search adatfeldolgozási osztályának vezetője.

A Matrixnettől a neurális hálózatokig

A keresőmotorok a múlt század 90-es éveinek közepén jelentek meg, amikor az internet nagyon kicsi volt - csak néhány ezer webhely. Eleinte a keresőmotorok egyszerűen összeállítottak egy listát azokról az oldalakról, ahol probléma nélkül vannak megadott szavak, a lekérdezésnek való megfelelés mértéke szerint rangsorolva. Minél gyakrabban jelennek meg a lekérdezésből származó szavak a dokumentumban, annál jobb. Egyértelmű, hogy a jelenlegi állapot mellett globális hálózat az ilyesmi már nem fog működni.

A Yandex kitalálta a Matrixnetet a kérések feldolgozására – egy gépi tanulási módszert, amelyet a szerző rangsorolási képletének felépítéséhez használtak. A keresés azonban továbbra is a szavakra támaszkodott. De mi a helyzet azokkal a lekérdezésekkel, amelyeket a felhasználók allegorikusan vagy asszociatív módon fogalmaznak meg? Ekkor a keresett weboldalnak nem kell szigorúan a lekérdezésben szereplő összes szót tartalmaznia. De hogyan magyarázza ezt el egy gépnek? Ha megértene minket emberként...




A tudósok végül kitaláltak valamit a technológia és a biológia metszéspontjában: egy mesterséges neurális hálózatot (ANN). A Wikipédia megfogalmazása szerint ez "egy matematikai modell, valamint annak szoftveres vagy hardveres megvalósítása, amely a biológiai neurális hálózatok - egy élő szervezet idegsejt-hálózatai - szerveződésének és működésének elvén épül fel". A neurális hálózatok képesek az információkat úgy feldolgozni, mint mi, és ami a legfontosabb, olyan készségeket tanulnak és csiszolnak, mint az élőlények. Valójában ezek jelentik a teljes értékű élet alapját mesterséges intelligencia, melynek megjelenése idő kérdése.

Tavaly a Yandex bemutatta a neurális hálózaton alapuló Palekh keresőalgoritmust. Kiváló eredményeket mutatott fel olyan problémák megoldásában, amelyek általában csak az emberek számára voltak lehetségesek: kiváló munkát végzett a beszéd és a tárgyak képi felismerésében. A "Palek" megtanulta a keresési lekérdezéseket és a weboldalcímeket számcsoportokká - szemantikai vektorokká - konvertálni. Fontos tulajdonságuk, hogy a vektorok összehasonlíthatók egymással: minél erősebb a hasonlóság, annál közelebb van a lekérdezés és a cím jelentéstartalma.




"Királyok". aki érti

A neurális hálózatokra épülő kereső fejlesztésének következő lépése a Korolev algoritmus volt, amely nem csak a címet, hanem az egész oldalt elemzi! Azon oldalak száma, amelyeket a keresés jelentésében összehasonlít a lekérdezéssel, 150 dokumentumról 200 000-re nőtt. Többek között Koroljev elkezdte figyelembe venni azon egyéb kérések jelentését is, amelyekkel az emberek a keresett oldalra lépnek.

A neurális hálózat úgy tanul, mint egy gyerek. Ennek elsajátításához rengeteg példára volt szüksége. Valójában a szolgáltatás minden felhasználója valamilyen módon részt vett Koroljev spontán képzésében: keresési statisztikákat és több millió emberre vonatkozó becsléseket használtak. A Yandex fokozatosan megtanulja egyre pontosabban felismerni a szemantikai összefüggéseket, például: [egy kép, ahol kanyarog az ég] egy Van Gogh-festményről szól, [egy lusta macska
Mongóliából] - manul.


A keresés nagyon összetett rendszer. Mérnökök ezrei dolgoznak azon, hogy a nő megértse az embert, és segítsen megoldani a problémáit. Korolyovban egyesítettük a gépi intelligenciát és emberek millióinak erőfeszítéseit. Felhasználóink ​​kérdésekkel és algoritmusaink betanításával javítják velünk a keresést.
Andrej Styskin, a Yandex Search vezetője.
A keresőrendszer betanítása a napi rutin elemzése mellett a válaszok minőségének felmérését is igényli. Minél bonyolultabb a rendszer, annál több értékelésre van szükség. Ha korábban a szakértői értékelők viszonylag kis csoportja, a Yandex csapat tagjai foglalkoztak a keresés minőségének értékelésével, most komolyan növelni kellett a mennyiséget. Így jött létre a szolgáltatás. Yandex.Toloki(A toloka a kölcsönös segítségnyújtás egyik formája, amelyet a falusiak gyakoroltak egykor). Bármely lelkes, akit érdekel egy kis jutalom, és természetesen valami fontoshoz tartozás érzése, egyszerű feladatokat végezhet. Mára több mint egymillió ember él ilyen tolokerekkel, és az általuk adott értékelések száma meghaladta a 2 milliárdot.




„A modern keresés összetett algoritmusokon alapul. Az algoritmusokat fejlesztők találták ki, és Yandex-felhasználók milliói tanítják őket. Minden kérés névtelen jelzés, amely segít a gépnek jobban megérteni az embereket. Ezért nem tévedünk, ha azt mondjuk: új keresés egy közös keresés” – olvasható a Yandex blogbejegyzésében.

A Yandex.Toloka több mint két éves történetében azonosították a legproduktívabb és legszorgalmasabb résztvevőt. Ők lettek a cseljabinszki Ilja Mihalenko. A srác eljött a "Korolev" moszkvai bemutatójára, hogy jól megérdemelt díjat kapjon a keresőcsapat kezéből.




Új keresés működés közben

Mi a gyakorlati módja annak, hogy javítsuk Yandexünk munkáját? Most már szinte okos és művelt barátként beszélhetsz vele. (Akár hangon is.) Mit csinálsz például, ha meg kell emlékezned egy film nevére, amiből emlékszel egy részletre, de a színészek és a rendező neve kiszállt a fejedből? Fordulhat barátaihoz, vagy kérhet segítséget valamilyen tematikus fórumon. És megkérdezheted a "királynőt"!

A képkeresés nagymértékben javult. Velük általában mindig van valami "pokol": a keresőmotor vagy meggondolatlanul kiadja az összes képet, amelynek nevében a lekérdezés szavai szerepelnek, vagy figyelembe veszi a cikk szövegét, a kép szemlélteti. Ha olyasmit keresel, ami megfelel a lélek homályos szükségleteinek, akkor készülj fel a csalódásra. A "Korolev" pontosan azt elemzi, ami a képen látható, ezért nem triviális megközelítéssel képes tetszeni.






Példaként a tesztek nem a legnyilvánvalóbb kérést kapták - [macska az űrben]. A kutyák elég gyakran keringtek pályán, de a bajuszos-csíkos, fegyelmezett űrhódítóknak nem sikerült. Csak egy kísérletet lehet biztosan tudni: 1963-ban a franciák szuborbitális repülésre indították Felicette macskát. Romantikus, de rövidlátó, - amint a tudósok kinyitották a leszállókapszula ajtaját, olyan volt a homály. A fotózásra nem került sor.

Kérésre a kereső nem csak szkafanderes kis állatokat és szürreális fotóvarangyokat ad ki, hanem egy macskát is. mosógép, ami eléggé hasonlít egy űrhajó nyílásához. De ez nem szerepel a leírásban.

Az új keresőmotor ünnepélyes elindítására a Yandex.Search teljes csapata színpadra lépett. Egy kis visszaszámlálás és... Gyerünk! Most mindenki megtapasztalhatja az éleslátó "királynő" képességeit. A lényeg az, hogy jelenlegi képességei nem statikusak, hanem folyamatosan fejlődnek.

Az est zárásaként a szervezők valami teljesen váratlannal készültek: egy kommunikációs szekcióval igazi űrhajósokkal a Föld körüli pályáról. Néhányra személyesen válaszoltak népszerű lekérdezések keresőmotorok felhasználói az űrről és válaszoltak a jelenlévők kérdéseire.

Tegnap országunk néhány lakosa hirtelen rájött. Ideiglenesen letiltották a TTK, az Akado, az Avaks és a Sumtel szolgáltatók a Roszkomnadzor irányában. Ám ezen szolgáltatók előfizetőinek jelentős része nem vette észre a blokkolást, mivel belföldit használnak keresőmotor.

NÁL NÉL 2017. április a "Yandex"-ben keresett valamit 43 millió ember. Ha Ön is közéjük tartozik, akkor ez a rövid cikk neked szól.

P.S. Azok számára, akik előnyben részesítik a Google-t és a DuckDuckGo-t, az utolsó részben találhatók linkek.

1. Hogyan kereshet egy bizonyos város, régió, szövetségi körzet vagy ország webhelyei között?

Így találhat információkat a „diplomás bál” felkérésről Bratsk város oldalain:

öregdiák bál macska:11000976

A tárcsázandó szám kiderítése a kezelő után macska:, hozzá kell adni 1100000-hez régiókód a "Yandex.Katalógusban". Például:

  • Moszkva - 1100001;
  • Csernyihiv - 1100966;
  • Voronyezs - 1100193;
  • Volga régió - 1100040;
  • Kirgizisztán - 1100207;
  • FÁK-országok - 166.

A Yandex.Catalogban már több mint 117 ezer webhely található. Hasonlóképpen, csak egy adott témára vonatkozó források között kereshet valamit. Ehhez a régiókódok helyett a következőt kell használnia témakódokés 1100000 helyett 9000000-et adjunk hozzájuk.

2. Hogyan lehet megtéveszteni a Yandexet a tartózkodási helyével kapcsolatban?

A Chrome-bővítmény használata Kézi földrajzi helymeghatározás megjelölhet egy tetszőleges pontot a térképen, és a kereső úgy gondolja, hogy Ön ott van, és ezeknek az adatoknak megfelelően módosítja a keresési eredményeket. Például kereshet olyan tárgyakat, amelyek az otthona közelében találhatók Szentpéterváron, de ugyanakkor Moszkvában is találhatók. Hasznos utazások tervezésénél.

Ez az elem minden olyan webhelyre vonatkozik, amely az Ön helyadatait használja.

3. Hogyan lehet oldalakat keresni egy adott domain zónában és egy adott nyelven?

Így találhatod meg, hogy mit írnak az ukrán oldalak a zebrákról (az ua domain zónában) ukránul:

zebra domain:ua lang:uk

Hasonlóképpen megtudhatja más államok oldalainak véleményét különböző kérdésekben. Nyelvi kódok a Yandexhez:

  • orosz (ru);
  • ukrán (UK);
  • fehérorosz (be);
  • angol (en);
  • francia (fr);
  • német (de);
  • kazah (kk);
  • tatár (tt);
  • török ​​(tr).

4. Hogyan lehet oldalakat keresni egy adott webhelyen?

Így kereshet csak oldalakat a webhely webhelyén:

zebrák site:site

Így csak egy bizonyos kategóriájú cikkek között kereshet. Például a kérdések között Mentőhely:

üzenetek url:webhely/iNotes/q/*

És a következőképpen kaphat listát a webhelyen használt összes címkéről:

5. Hogyan keressünk egy adott napon készült oldalakat?

Így találhatja meg az adott napon létrehozott oldalakat:

Steve Jobs dátum: 20170617

És így két dátum között:

steve jobs dátum:20170610..20170617

És az operátorral dátum: oldalakat az utolsó indexelés dátuma szerint kereshet.

6. Hogyan keressünk meghatározott típusú fájlokat?

Könyvkeresés itt PDF formátum letölthető az iBooksból:

virágok algernón mime:pdf

És így találhatja meg az összes MS Word dokumentumot a "nyilatkozat" szó megemlítésével a Szövetségi Adószolgálat webhelyén:

deklaráció mime:docx site:nalog.ru

A Yandex által indexelt dokumentumok típusai:

  • html;
  • docx;
  • xlsx;
  • pptx;

7. Hogyan lehet csak oldalcímekben keresni?

Ezzel az operátorral:

Nagyon kényelmes, ha egy cikket a pontos cím alapján kell megtalálnia.

8. Hogyan kereshetek képfájlnév alapján?


Mentett egy képet a számítógépére, szeretné használni a forrással, de nem emlékszik, honnan származik? A pontos képnév keresési operátora segít:

Operátorok a HTML-címkék attribútumértékei alapján történő kereséshez:

kisalkalmazás:– az applet címke kódja;
forgatókönyv:- a script címke src-je;
tárgy:– az összes objektum attribútuma;
akció:– az űrlapcímke művelete;
profil:– a fejcímke profilja.

9. Hogyan találhatunk hivatkozásokat egy adott oldalra?

A Yandex rendelkezik egy operátorral, amely a hivatkozásokon belüli lekérdezések említését keresi. Így egy adott oldalra mutató hivatkozásokat találhat.

inlink: "www.website/iNotes/533552"

10. Hogyan használhatom a widgeteket és tippeket?

Ha az alábbi négy szó valamelyikét beírja a keresésbe, minialkalmazások jelennek meg a keresősáv alatt:

  • "Számológép";
  • "Valutaváltó";
  • "Átalakító";
  • "Fordítás".

Néhány kérés esetén a válaszok közvetlenül megjelennek keresősor. Példák.


A Yandex elindította a keresés új verzióját. A "Korolev" keresési algoritmuson alapul. Az algoritmus neurális hálózatot használ a kérések és weboldalak jelentésének egyeztetésére – ez lehetővé teszi a Yandex számára, hogy pontosabban válaszoljon összetett lekérdezések. A keresés új verziójának betanításához több millió ember keresési statisztikái és értékelései szolgálnak. Így nem csak a fejlesztők, hanem az összes Yandex felhasználó is hozzájárul a keresés fejlesztéséhez.

Szavak és jelentések

Mielőtt a keresés jelenéről és jövőjéről beszélnénk, emlékezzünk a múltjára. Az első keresőmotorok az 1990-es évek közepén jelentek meg, amikor az internet nagyon kicsi volt - a webhelyek száma több ezerre rúgott. Ahhoz, hogy az ember megtalálja a megfelelőt, elég volt egy listát készíteni azokról a weboldalakról, ahol a keresési lekérdezésből származó szavak szerepelnek. Szó sem volt összetett rangsorolásról - vagyis a kérésnek való megfelelés mértéke szerinti oldalak rendezéséről. Úgy gondolták, hogy minél gyakrabban fordulnak elő a lekérdezésből származó szavak a dokumentumban, annál jobban illeszkedik.

Az internet gyorsan növekedett, és további kiválasztási kritériumokra volt szükség. A keresőmotorok elkezdték figyelembe venni a dokumentumokra mutató hivatkozásokat, megtanulták meghatározni azt a régiót, ahonnan a kérés érkezett, és elkezdtek figyelni a felhasználói viselkedésre.

Valamikor olyan sok rangsorolási tényező volt - olyan jelek, amelyek alapján meg lehet állapítani, hogy egy oldal mennyire reagál egy kérésre -, hogy világossá vált, hogy lehetetlen mindet utasítások formájában leírni. Jobb, ha megtanítja a gépet, hogy önállóan döntsön: milyen funkciókat használjon és hogyan kombinálja azokat. A Yandex ezekre a célokra találta ki a Matrixnetet. Ez a gépi tanulási módszer, amely összeállítja a rangsorolási képletünket.

A keresés azonban továbbra is a szavakra támaszkodik. Az összetett rangsorolási képlet elindítása előtt a keresőmotorok összeállítanak egy listát az „előminősített” weboldalakról – azokról, amelyek a lekérdezésben szereplő szavakat tartalmazzák. Mi, emberek megértjük, hogy ugyanaz a jelentés kifejezhető különböző szavakat. Előfordulhat, hogy egy weboldal nem tartalmazza a lekérdezésben szereplő összes szót, de mégis nagyon jól reagál rá. Ezt azonban elég nehéz elmagyarázni egy gépnek.

A Yandex tavaly tette meg az első lépést a jelentés szerinti keresés felé, amikor a vállalat bevezette a Palekh keresőalgoritmust. Azon alapul neurális hálózat. A neurális hálózatok kiváló eredményeket mutatnak azokban a feladatokban, amelyekkel az emberek hagyományosan megbirkóztak. jobb autók: mondjuk, beszéd vagy tárgyak felismerése a képeken.

A Palekh elindításával a vállalat megtanította a neurális hálózatot arra, hogy a keresési lekérdezéseket és a weboldalcímeket számcsoportokká - szemantikai vektorokká - alakítsa. Fontos tulajdonság Az ilyen vektorok közül az, hogy összehasonlíthatók egymással: minél erősebb a hasonlóság, annál közelebb áll egymáshoz jelentésben a kérés és a fejléc.

Hogyan működik a Koroljov algoritmus

A Korolev keresési algoritmus összehasonlítja a keresési lekérdezések és a teljes weboldalak szemantikai vektorait – nem csak a címüket. Ez lehetővé teszi, hogy a új szint a jelentés megértése. Képzeld el, hogy először hallottál Lev Tolsztoj Háború és béke című regényéről. A címet persze lehet értelmezni – például utalhat arra, hogy sok csatajelenet van a könyvben. De ahhoz, hogy megtanulja a cselekmény összes bonyolultságát, és átfogó válaszokat adjon a regényre vonatkozó kérdésekre, teljes egészében el kell olvasnia.

Akárcsak Palekh esetében, a weboldalak szövegeit egy neurális hálózat szemantikai vektorokká alakítja. Ez a művelet sok számítási erőforrást igényel. Hasonlítsd össze: másodpercekbe telik elolvasni egy könyv címét, de órákba, napokba vagy akár hetekbe is telhet, amíg az egészet a borítótól a borítóig elolvasod. Ezért Koroljev nem valós időben számítja ki az oldalvektorokat, hanem előre, az indexelési szakaszban. Amikor egy személy kérést küld, az algoritmus összehasonlítja a kérésvektort az általa már ismert oldalvektorokkal.

Egy ilyen séma lehetővé teszi, hogy a rangsorolás korai szakaszában megkezdje a lekérdezésnek megfelelő weboldalak kiválasztását. Palekhben a szemantikai elemzés az egyik utolsó szakasz: mindössze 150 dokumentum megy át rajta. Koroljevben 200 ezer dokumentumra állítják elő - vagyis több mint ezerszer többre. Ráadásul az új algoritmus nemcsak egy weboldal szövegét hasonlítja össze keresési lekérdezés, hanem más kérésekre is felhívja a figyelmet, amelyek miatt az emberek felkeresik ezt az oldalt. Ily módon további szemantikai kapcsolatok létesíthetők.

Az emberek gépeket tanítanak

A Yandex úgy véli, hogy a gépi tanulás, és főleg a neurális hálózatok használata előbb-utóbb megtanítja a keresést emberi szinten is jelentésekkel operálni. De az emberek segítsége nélkül ez nem lehetséges. Ahhoz, hogy egy gép megértse, hogyan kell megoldani egy adott problémát, rengeteg példát kell mutatnia neki: pozitív és negatív. Ilyen példákat adnak a Yandex felhasználók.

A Koroljov algoritmus által használt neurális hálózat személytelen keresési statisztikákra van kiképezve. A statisztikai adatgyűjtő rendszerek figyelembe veszik, hogy a felhasználók mely oldalakra keresnek fel bizonyos lekérdezéseket, és mennyi időt töltenek ott. Ha az ember megnyitott egy weboldalt, és ott "lógott" sokáig, valószínűleg megtalálta, amit keresett – vagyis az oldal jól reagál a kérésére. Ez egy pozitív példa. Sokkal egyszerűbb a negatív példák felszedése: csak egy kérés és egy tetszőleges weboldal.

A rangsorolási képletet felépítő Matrixnetnek is szüksége van az emberek segítségére. Ahhoz, hogy a keresés fejlődjön, az embereknek folyamatosan értékelniük kell a munkáját. Valamikor csak a Yandex alkalmazottai, az úgynevezett értékelők foglalkoztak osztályozással. De minél több az értékelés, annál jobb - ezért úgy döntöttünk, hogy mindenkit bevonunk ebbe, és elindítottuk a Yandex.Toloka szolgáltatást. Jelenleg több mint egymillió felhasználó regisztrált ott: elemzik a keresés minőségét, és részt vesznek más Yandex-szolgáltatások fejlesztésében. A Tolokán végzett feladatok fizetettek - a kereshető összeg a feladat mellett van feltüntetve. A szolgáltatás fennállása óta több mint két éve a tolokerek mintegy kétmilliárd értékelést adtak.

A modern keresés összetett algoritmusokon alapul. Az algoritmusokat fejlesztők találták ki, és Yandex-felhasználók milliói tanítják őket. Minden kérés névtelen jelzés, amely segít a gépnek jobban megérteni az embereket. Ezért a Yandex nem téved, ha azt mondja: az új keresés olyan keresés, amelyet együtt végeztünk.

A neurális hálózat nem csak a címet, hanem a teljes oldalt elemzi, a kereső pedig már az indexelési szakaszban meghatározza a lényegét.

MOSZKVA, augusztus 22. /TASZ/. A "Yandex" elindította a keresés új verzióját, amely a kérés és a weboldal jelentésének összehasonlításán alapul - közölte a cég. Az új verzió a "Korolev" algoritmuson dolgozik, amely neurális hálózat segítségével határozza meg, hogy pontosan mire van szüksége a felhasználónak. A neurális hálózat nemcsak a címet, hanem a teljes oldalt elemzi, míg a Yandex előre, az indexelési szakaszban meghatározza az oldal lényegét.

A "Királynő" másik jellemzője, hogy figyelembe veszi más kérések jelentését is, amelyekkel az emberek átváltanak rá. „Ahhoz, hogy egy neurális hálózat értékelje egy lekérdezés és egy dokumentum szemantikai hasonlóságát, rengeteg példára van szüksége. Ilyen példákat adnak a személytelen keresési statisztikák: milyen oldalakat keresnek fel az emberek, és mennyi időt töltenek ott. Tehát, ha valaki felkereste az oldalt, és egy ideig átnézte, akkor valószínűleg közel áll a kéréshez. Használata keresési statisztikák millió ember, a Yandex megtanulja megérteni a szemantikai kapcsolatokat. Például megérti, hogy a "kép, ahol az ég forog" lekérdezésben beszélgetünk egy Van Gogh-festményről, és a "lusta macska Mongóliából" lekérdezésben - egy manulról" - áll a cég sajtóközleményében.

Tavaly a Yandex már elindított egy neurális hálózatokon alapuló rendszert - Palekh. A korábbi rendszer 150 oldalt indexelt, a "Királynőben" 200 ezerre nőtt azoknak az oldalaknak a száma, amelyeket a keresés jelentésben összehasonlít a lekérdezéssel.

Az új algoritmust Szergej Koroljev orosz űrhajósról nevezték el.

„És ma egy új rangsorolási algoritmust indítunk a Queens számára. Miért ezt a nevet választottuk? Szergej Pavlovics Koroljev teljesítette az emberiség álmát, hogy az űrbe repüljön. Számunkra, a Yandexnél a mai bevezetés ugyanolyan fontos technológiai áttörést jelent a felhasználókat megértő keresés álma felé” – mondta Alekszandr Safronov, a Yandex Nyelvészeti Relevancia Szolgálatának vezetője a keresés új verziójának bemutatóján.

Hall segítség

A keresőmotor betanításához értékelnie kell a válaszok minőségét. Korábban a "Yandex" értékelői segítségével értékelte a keresés minőségét. Az új keresés figyelembe veszi azokat a minősítéseket, amelyeket a Yandex.Toloka szolgáltatás, az értékelők elosztott hálózatának felhasználói adnak fel. A szolgáltatással bárki elvégezhet feladatokat és jutalmakat kaphat érte, jelenleg több mint egymillió regisztrált felhasználója van. A platformon bárki regisztrálhat.

A Yandex a legnagyobb keresőmotor Oroszországban. A vállalat részesedése az orosz keresési piacon (beleértve a keresést a mobil eszközök) 2017 második negyedévében átlagosan 54,3%, az idei első negyedévben - 54,7% (a Yandex.Radar elemző szolgáltatás szerint). A Liveinternet.ru szerint idén júniusban keresési megosztás A Yandex 51,3%-ot tett ki.