Casa / Lavora su Internet / Utilizzato per cercare informazioni su Internet. Suggerimenti efficaci per la ricerca di informazioni su Internet. Il concetto di motore di ricerca

Utilizzato per cercare informazioni su Internet. Suggerimenti efficaci per la ricerca di informazioni su Internet. Il concetto di motore di ricerca

RICERCA PROFESSIONALE DI INFORMAZIONI SU INTERNET

La ricerca in Internet è un elemento importante del lavoro sul Web. Il numero esatto di risorse web internet moderno quasi nessuno lo sa per certo. In ogni caso, il conto arriva a miliardi. Per essere in grado di utilizzare le informazioni necessarie in questo particolare momento, sia per affari che per intrattenimento, devi prima trovarle in questo oceano di risorse costantemente rifornito.

Affinché una ricerca su Internet abbia successo, devono essere soddisfatte due condizioni: le query devono essere ben formulate e devono essere poste in luoghi idonei. In altre parole, l'utente deve, da un lato, essere in grado di tradurre i propri interessi di ricerca nella lingua della query di ricerca e, dall'altro, buona conoscenza motori di ricerca, strumenti di ricerca disponibili, loro vantaggi e svantaggi, che ti permetteranno di scegliere gli strumenti di ricerca più appropriati in ogni caso specifico.

Attualmente non esiste una singola risorsa che soddisfi tutti i requisiti per la ricerca in Internet. Pertanto, con un approccio serio alla ricerca, devi inevitabilmente utilizzare strumenti diversi, utilizzando ciascuno nel caso più opportuno.

Principale strumenti di ricerca su Internetpossono essere suddivisi nei seguenti gruppi principali:

motori di ricerca;

Directory Web;

Risorse di riferimento;

Programmi locali per la ricerca in Internet.

Il motore di ricerca più popolare èmotori di ricerca- i cosiddetti motori di ricerca Internet (Motori di ricerca). I primi tre leader su scala globale sono abbastanza stabili: si tratta di Google, Yahoo! e Bing. Molti paesi aggiungono a questo elenco i propri motori di ricerca locali ottimizzati per i contenuti locali. Con il loro aiuto, in teoria, puoi trovare qualsiasi parola specifica sulle pagine di molti milioni di siti. Dal punto di vista dell'utente, il principale svantaggio dei motori di ricerca è l'inevitabile presenzarumore di informazioninei risultati. È così che è consuetudine chiamare i risultati che, per un motivo o per l'altro, sono inclusi nell'elenco dei risultati che non corrispondono alla query.

Nonostante molte differenze, tutti i motori di ricerca Internet funzionano su principi simili e, da un punto di vista tecnico, sono costituiti da sottosistemi simili. La prima parte strutturale del motore di ricerca sono i programmi speciali utilizzati per ricerca automatica e successiva indicizzazione delle pagine web. Tali programmi sono generalmente chiamati spider o bot. Guardano il codice delle pagine Web, trovano i collegamenti che si trovano su di esse e quindi scoprono nuove pagine Web. Ci sono anche modo alternativo inclusione del sito nell'indice. Molti motori di ricerca offrono ai proprietari di risorse l'opportunità di aggiungere autonomamente un sito al proprio database. Comunque sia, le pagine web vengono scaricate, analizzate e indicizzate. Si distinguono elementi strutturali, vengono trovate le parole chiave, vengono determinati i loro collegamenti con altri siti e pagine web. Vengono eseguite anche altre operazioni, il cui risultato è la formazione della base dell'indice del motore di ricerca. Questa base è il secondo elemento principale di qualsiasi motore di ricerca. Attualmente, non esiste una base di indici assolutamente completa che contenga informazioni su tutto il contenuto di Internet. Poiché diversi motori di ricerca utilizzano diversi programmi di ricerca di pagine Web e creano il loro indice utilizzando algoritmi diversi, le basi degli indici dei motori di ricerca possono variare in modo significativo. Alcuni siti sono indicizzati da più motori di ricerca, ma c'è sempre una certa percentuale di risorse incluse nel database di un solo motore di ricerca. Il fatto che ogni motore di ricerca abbia una parte dell'indice così originale e non sovrapponibile permette di trarre un'importante conclusione pratica: se utilizzi un solo motore di ricerca, anche il più grande, perderai sicuramente una certa percentuale di link utili .

La parte successiva del motore di ricerca in Internet è il programma di ricerca e ordinamento vero e proprio. Questi programmi risolvono due compiti principali: in primo luogo, trovano pagine e file nel database che corrispondono alla richiesta in arrivo, quindi ordinano l'array di dati risultante in base a vari criteri. Il successo nel raggiungimento degli obiettivi della ricerca dipende in gran parte dall'efficacia del loro lavoro.

L'ultimo elemento di un motore di ricerca su Internet è l'interfaccia utente. Oltre ai requisiti di estetica e praticità consueti per qualsiasi sito, c'è un altro requisito importante per le interfacce dei motori di ricerca: devono offrire vari strumenti per compilare e perfezionare le query, nonché per ordinare e filtrare i risultati. I vantaggi dei motori di ricerca sono un'eccellente copertura delle fonti, un aggiornamento relativamente rapido del contenuto del database e una buona scelta caratteristiche aggiuntive.

Lo strumento principale per lavorare con i motori di ricerca è una query.

Vengono utilizzate anche le ricerche su Internet applicazioni speciali installato su computer locale. Potrebbe essere come programmi semplici e complessi piuttosto complessi di ricerca e analisi dei dati. I plug-in del browser più comuni sono i plug-in del browser, i pannelli del browser progettati per funzionare con un servizio di ricerca specifico e i pacchetti di metasearch con funzionalità di analisi dei risultati.

Directory web - si tratta di risorse in cui i siti sono distribuiti per categorie tematiche. Se l'utente lavora con i motori di ricerca solo tramite query, il catalogo ha la possibilità di visualizzare le intere sezioni tematiche. Secondo differenza fondamentale cataloghi dai motori di ricerca automatici è che le persone che visualizzano le risorse e classificano il sito in una categoria o nell'altra sono direttamente coinvolte nella loro compilazione, di norma. Le directory Web sono generalmente suddivise in universali e tematiche. Universal cerca di coprire il maggior numero possibile di argomenti. Puoi trovare qualsiasi cosa in loro: dai siti sulla poesia a risorse informatiche. In altre parole, hanno la massima ampiezza di ricerca. Le directory tematiche, invece, si specializzano in una determinata materia, fornendo, riducendo l'ampiezza di copertura delle risorse, la massima profondità di ricerca.

Vantaggi dei cataloghi - comparativamente alta qualità risorse, poiché ogni sito in esso contenuto viene visualizzato e selezionato da una persona. Il raggruppamento tematico dei siti consente di individuare comodamente i siti di argomenti simili. Questa modalità operativa è utile per scoprire nuovi siti per te su un argomento di interesse: è più accurata rispetto all'utilizzo di un motore di ricerca. Si consiglia di utilizzare le directory Web per la prima conoscenza di qualsiasi area tematica, oltre a cercare query fuzzy: avrai l'opportunità di "vagare" tra le sezioni della directory e determinare con maggiore precisione ciò di cui hai bisogno.

Gli svantaggi delle directory web sono noti. Innanzitutto si tratta di un lento reinserimento del database, poiché l'inserimento di un sito nel catalogo richiede la partecipazione di una persona. In termini di efficienza, la directory web non è rivale dei motori di ricerca. Inoltre, le directory web sono significativamente inferiori ai motori di ricerca in termini di dimensioni del database.

Parlando di ricerca su Internet, non possiamo ignorare una serie di termini strettamente correlati a quest'area e spesso utilizzati per descrivere e valutare i motori di ricerca. Per esempio: ampiezza e profondità ricerca Internet. Una ricerca ampia è una ricerca che cattura il maggior numero possibile di fonti di informazioni. Allo stesso tempo, è considerata sufficiente almeno una menzione di un particolare sito che corrisponde alla query. La profondità di ricerca si riferisce ai dettagli dell'indicizzazione e della successiva ricerca di ogni specifica risorsa. Ad esempio, molti motori di ricerca hanno approcci diversi all'indicizzazione di siti diversi. I siti grandi e popolari sono indicizzati al massimo, i robot cercano di non perdere nemmeno una pagina di tale risorsa. Allo stesso tempo, su altri siti, è possibile indicizzare solo la pagina principale e un paio di pagine di contenuto. Queste circostanze, ovviamente, influiscono sulla successiva ricerca. La ricerca approfondita funziona secondo il principio "è meglio includere informazioni ridondanti nei risultati piuttosto che perdere qualsiasi dato rilevante per l'argomento di ricerca".

È abbastanza comune imbattersi in concetti come globale e locale ricerca Internet. La ricerca su Internet locale tiene conto della posizione geografica dell'utente e viene data preferenza ai risultati che sono in qualche modo correlati a un determinato paese o località. Una ricerca globale ignora queste informazioni e cerca tutte le risorse disponibili.

Quando si compila una query sui motori di ricerca Internet, varie modalità ricerca. Le modalità di ricerca tipiche che si trovano sulla maggior parte delle macchine Internet includono semplice e avanzato Ricerca. La ricerca semplice consente di specificare solo una funzione di ricerca in una query. La ricerca avanzata consente di creare una query da più condizioni collegandole con operatori logici.

Per essere sicuro query di ricerca vari filtri . I filtri sono chiamati quelli o altri mezzi ausiliari per compilare una query che non si riferiscono al lato contenuto delle condizioni della query, ma limitano i risultati della ricerca a qualche segno formale. Quindi, ad esempio, quando si applica un filtro del tipo di file durante la ricerca, l'utente non fornisce al sistema informazioni relative all'oggetto della sua richiesta, ma limita semplicemente i risultati ottenuti a un tipo di file specifico specificato nella condizione della sua richiesta.

Per la maggior parte degli utenti, i motori di ricerca universali sono il principale e spesso l'unico mezzo di ricerca su Internet. Offrono una buona copertura delle fonti, nonché una serie di strumenti sufficienti per le attività di ricerca di base.

Il mercato dei motori di ricerca universali è piuttosto ampio. Abbiamo cercato di analizzare i motori di ricerca più famosi e i risultati sono presentati sotto forma di Tabella 1.

Quando si sceglie un motore di ricerca universale, la qualità delle risorse trovate con il suo aiuto gioca un ruolo importante. È possibile determinare il motore di ricerca preferito per attività specifiche utilizzando il "metodo dei marcatori". La sua essenza sta nel fatto che all'inizio viene compilata una determinata query di ricerca tematica, dopo di che un gruppo di persone - esperti in questo campo viene intervistato per identificare le migliori, secondo loro, le risorse Internet sull'argomento scelto. Sulla base dei dati del sondaggio, viene formato un elenco di siti marker che sono garantiti per essere rilevanti per la query e contenere informazioni di alta qualità. Quindi la richiesta viene inviata ai motori di ricerca testati. La logica di valutazione è semplice: più in alto si trovano i siti dei marker nei risultati della ricerca, migliore una determinata risorsa è adatta per trovare informazioni su un argomento di prova.


La ricerca efficace di informazioni utilizzando un computer è un compito urgente che si pone non solo per i principianti, ma anche per gli utenti Internet esperti, perché chi possiede i dati possiede il mondo, come dice il noto proverbio. Oggi analizzeremo modi per trovare rapidamente il necessario e Informazioni importanti su Internet russo. Sul questo momento Ne esistono solo tre tipi:

  • Ricerca di informazioni tramite un collegamento diretto sul web
  • Cerca utilizzando la navigazione in Internet
  • Regole per la ricerca di informazioni su Internet
  1. indicando l'indirizzo diretto del sito dove si trovano i dati necessari e le informazioni necessarie;
  2. collegamento con la navigazione personal computer su internet;
  3. utilizzando motori di ricerca (macchine) su Internet.

Consideriamo più in dettaglio tutti i modi per cercare informazioni aggiornate sulla rete utilizzando un computer.

Ricerca di informazioni tramite un collegamento diretto sul web

Se sai già a quale indirizzo su Internet si trovano le informazioni di cui hai bisogno, la ricerca utilizzando un computer è notevolmente più semplice: basta inserire l'indirizzo del sito nella riga del browser e familiarizzare con i dati proposti. Se hai aperto un testo voluminoso su una pagina di un sito Web su Internet e ti interessano solo poche righe nascoste in una "tonnellata" di caratteri stampati, puoi utilizzare la ricerca nella pagina. Per fare ciò, premi la combinazione di tasti Ctrl e F (di qualsiasi layout di tastiera di computer), e nella colonna "Trova" proposta, digita la frase o la parola che è esattamente contenuta nel paragrafo con le informazioni che stai cercando, e quindi premere "Invio".

Il browser evidenzierà con un colore diverso tutte le parole menzionate nella pagina che sono simili alla parola che stai cercando. Tuttavia, capita spesso che non ricordiamo o non conosciamo i collegamenti con la posizione delle informazioni su Internet. In questo caso, è più conveniente ricorrere agli altri due tipi di ricerca dei dati tramite computer.

Cerca utilizzando la navigazione in Internet

La navigazione in Internet è una ricerca in cui si effettua un passaggio sequenziale tramite link da un sito tematico all'altro fino a trovare la fonte dei dati necessari. Il vantaggio di questo metodo di ricerca dei dati su Internet risiede nel suo fascino e nella capacità di padroneggiare una grande quantità di informazioni da siti diversi in modo coerente e completo. Tra gli svantaggi di questo tipo di ricerca c'è la sua durata, oltre al fatto che devi anche raggiungere in qualche modo il sito originale da cui inizi a navigare. E se non hai l'indirizzo del sito da cui inizierai a navigare, qui dovrai ricorrere all'aiuto di un metodo di ricerca come i motori di ricerca.

Modi per trovare informazioni sul web utilizzando i motori di ricerca

Oggi, motori di ricerca come Yandex.ru, Rambler.ru, Google.ru sono ampiamente conosciuti dal pubblico di Runet. Questi siti consentono di cercare dati sulla query di input su tutti i siti Internet. Secondo il principio di funzionamento, i motori di ricerca sono di due tipi: indici di ricerca e directory di ricerca:

  • directory di ricerca. Questi siti aiutano nella ricerca di dati su un argomento specifico su Internet: le informazioni in tali cataloghi sono chiaramente strutturate per gruppi e argomenti, il che contribuisce alla rapida ricerca del risultato. In ogni argomento, all'utente viene offerto un certo numero di link a siti dove è possibile trovare la conoscenza di suo interesse.
  • Cerca indici. Si tratta di siti di puntamento in cui, inserendo una parola chiave nella barra di ricerca, l'utente riceve una serie di collegamenti a pagine su Internet che contengono la parola o la frase richiesta. Gli indici di ricerca eseguono ricerche utilizzando programmi speciali chiamati "spider" che scansionano le pagine dei siti su Internet per i loro argomenti. Dopo tale scansione, il motore di ricerca li inserisce nel suo database, dal quale le informazioni vengono successivamente "ottenute" quando l'utente inserisce una richiesta nel periodo di ricerca.

Regole per la ricerca di informazioni su Internet

Ora diamo un'occhiata alle regole di base, ma importanti per cercare in modo efficace informazioni aggiornate in Rete in lingua russa Internet utilizzando un computer.

  1. Forma la frase chiave corretta per indirizzare il motore di ricerca. Non puoi usare solo una parola di ricerca se vuoi ottenere risultati davvero utili e non dovresti nemmeno inserire frasi troppo grandi. La dimensione ottimale della query di ricerca è compresa tra 2 e 4 parole. Se il motore di ricerca ha trovato troppo pochi risultati nei risultati della ricerca, dovresti provare a riformulare la frase inserita, sostituendo alcune parole con sinonimi e anche verificare la presenza di errori di ortografia nelle parole. Ricorda: non ci sono tali informazioni che non siano su Internet. Basta scegliere le parole giuste, seguire le regole e troverai quello che stai cercando.
  2. Utilizzare operatori speciali. Una ricerca moderna, efficiente e veloce di qualsiasi informazione necessaria attraverso un motore di ricerca e l'utilizzo di un personal computer implica la conoscenza e l'applicazione di alcuni trucchi, che sono le abbreviazioni ei caratteri speciali dell'operatore. Gli operatori sono icone utilizzate quando si forma una query in un motore di ricerca e facilitano la ricerca dei dati necessari. Considera gli operatori più comuni e i loro significati, che possono essere utili nella pratica.
  3. Uno spazio o un segno & - significa che vuoi cercare i documenti con la frase richiesta all'interno di una frase. Esempio di input in stringa di ricerca: ricetta squisita o squisita e ricetta.
  4. && - indica la necessità di cercare una pagina in cui le singole parole della frase saranno menzionate nell'intero testo e non solo in una frase. Esempio: deliziosa && ricetta.
  5. | - ti verranno proposti articoli all'interno dei quali verrà utilizzata solo 1 delle parole inserite. Esempio: matrimonio | svantaggio | difetto.
  6. + - significa cercare il testo con una combinazione obbligatoria di parole consecutive inserite tra il segno "+". Esempio: deliziosa + ricetta.
  7. “ ” – cerca una catena di parole senza dividerla in parole separate. Esempio: "Dolci Krasnaya Polyana".

Seguendo questi regole semplici durante la ricerca di dati utilizzando un computer e Internet, ti semplificherai le cose e potrai sempre trovare rapidamente le informazioni di cui hai bisogno in qualsiasi momento.

In Internet globale, puoi trovare informazioni su qualsiasi argomento di interesse. Ma la cosa più difficile nel lavorare con Internet è trovare le informazioni di cui hai bisogno. Poiché Internet non ha una chiara struttura centralizzata, si sviluppa in modo caotico e nel mondo compaiono sempre più nuovi server, i problemi di ricerca delle informazioni diventano molto rilevanti.

Motori di ricerca semplificare notevolmente il lavoro su Internet e aiutarci a trovare rapidamente le informazioni di cui abbiamo bisogno in una vasta gamma di server Internet. Ci sono diverse migliaia di motori di ricerca sul World Wide Web, tra i quali ci sono sia quelli consolidati che quelli meno conosciuti.

I motori di ricerca più diffusi

  • Yandex- rimedio ricerca a tutto testo informazioni che tengono conto della morfologia della lingua russa; cerca nei siti, nel tuo catalogo, notizie, prodotti, mappe, dizionari, blog, immagini, documenti Microsoft Office e adobe acrobat PDF
    • Yandex
  • Rambler(OJSC "Rambler Internet Holding") — ricerca nel sito tenendo conto della morfologia delle lingue russa e inglese; Ha anche un sistema di ricerca nel catalogo.
    • Rambler Lite: motore di ricerca- una versione breve della pagina di ricerca
  • Servizio di ricerca Sputnik(JSC "Rostelecom") - ricerca su siti, servizi pubblici, ecc.; Ricerca sicura
  • NIGMa - motore di ricerca intelligente(Lomonosov Moscow State University e Stanford University) — ricerca di documenti, immagini, libri, notizie tramite Google, Yahoo, MSN, Yandex, Rambler, altavista, Aport; il sistema fornisce anche una ricerca univoca per formule chimiche e reazioni
  • Google — ricerca per siti (è possibile cercare siti in lingua russa); cercare documenti in formato Adobe Acrobat PDF, Microsoft Office, PostScript, Corel WordPerfect, Lotus 1-2-3 e così via; ricerca di immagini, video, notizie, ricerca su mappa; la possibilità di cercare su siti in lingua russa e russi; esiste un sistema per tradurre il testo in altre lingue (49 lingue)
  • Bing(Microsoft Corp.) - ricerca di siti, immagini e video; la possibilità di cercare su siti in lingua russa e russi; esiste un sistema per tradurre il testo in altre lingue (22 lingue)
  • Yahoo!(Yahoo) - cerca siti, indirizzi e-mail, ecc.

Ciascuno dei motori di ricerca ha i suoi vantaggi e svantaggi, che sono determinati dal principio di funzionamento del motore di ricerca, dalla facilità d'uso, dal suo design, dalla complessità del linguaggio di query, dalla presenza di varie funzioni avanzate (controllo del formato e classifica delle informazioni di output, correzione di errori di ortografia e layout errati della tastiera quando si è in acqua parole chiave, traduzione della pagina in altre lingue, ecc.), velocità di lavoro e altri parametri. La scelta del motore di ricerca per una particolare applicazione è determinata dallo scopo della ricerca, dalla natura delle informazioni ricercate, dal formato di output desiderato e dall'ampiezza degli indirizzi dei server tracciabili nel mondo di Internet.

Ricerca per parole chiave. Linguaggio di query dei motori di ricerca

Il motore di ricerca di solito ha un campo per l'immissione di parole chiave, tramite il quale trova i documenti che contengono queste parole chiave. Migliore (qualità superiore) è la query al motore di ricerca, minore è il numero totale di documenti trovati e più documenti corrispondono a ciò di cui hai bisogno. Se la richiesta è molto semplice o analfabeta, il motore di ricerca può fornirti diversi milioni di documenti che non guarderai per tutta la vita.

Utilizzando un linguaggio di query contenente operazioni logiche(operatori logici E, o NON, parentesi quadre, ecc.), prefissi di presenza obbligatoria di parole chiave nel documento «+» e «-» (quando si ricercano termini altamente specializzati, è preferibile utilizzarlo), la posizione delle parole chiave in un documento nelle vicinanze oa una certa distanza, ecc.), e altri elementi, e un numero maggiore di parole chiave correlate, possono restringere significativamente il area di ricerca e comporre meglio la richiesta al server di ricerca. Va tenuto presente che diversi motori di ricerca possono avere sia linguaggi di query diversi che molto simili.

Alcuni motori di ricerca hanno anche una funzione Ricerca Avanzata, consentendo all'utente di descrivere in modo più accurato ciò di cui ha specificamente bisogno senza conoscere il linguaggio di query. La funzione di ricerca avanzata è, ad esempio, i motori di ricerca Yandex e Google.

I principali tipi di motori di ricerca. Quale motore di ricerca utilizzare

Esistono 2 tipi principali di motori di ricerca su Internet: indice e classificazione (catalogo). Motori di ricerca per indici (ad esempio Yandex, Rambler, Sputnik, Google, Bing, ecc.), lavorando in Modalità automatica aggiornare le proprie informazioni, visualizzare i contenuti dei server su Internet, indicizzare le informazioni in essi contenute e inserire nei propri database informazioni sulla posizione delle parole nelle pagine del sito. I motori di ricerca delle directory (ad esempio Rambler, Yahoo!, ecc.) contengono un catalogo di server strutturato in modo tematico e il più delle volte vengono riforniti manualmente. Tipicamente, la pagina WWW del motore di ricerca di classificazione contiene anche un campo per l'inserimento di parole chiave per la ricerca nel proprio database. Nel sistema di ricerca del catalogo, puoi iniziare con un'intestazione tematica più ampia e scendere gradualmente più in basso lungo le intestazioni, per arrivare al collegamento al sito di cui hai bisogno. In alcuni casi è più conveniente utilizzare il primo tipo di motori di ricerca, in altri il secondo. Esistono motori di ricerca che combinano entrambi i principi di lavoro. In particolare, molti motori di ricerca per indici dispongono anche di un sistema di ricerca per catalogo. Inoltre, i motori di ricerca possono utilizzare alcuni altri principi dei metodi di ricerca.

Molti motori di ricerca si sono trasformati in portali Internet che combinano un gran numero di risorse e servizi. Sulle pagine di tali portali è possibile leggere le notizie, conoscere il programma TV, conoscere il tempo, i tassi di cambio, utilizzare il servizio di mappatura e altro ancora. altri

I motori di ricerca russi più popolari hanno capacità di ricerca che tengono conto delle peculiarità della lingua russa.

Per cercare contemporaneamente in più motori di ricerca, è possibile utilizzare le cosiddette metamacchine di ricerca che accedono a più motori di ricerca contemporaneamente, ad esempio NIGMa.

Esistono anche motori di ricerca specializzati nella ricerca su un singolo argomento (ad esempio su tecnologie dell'informazione, musica, risorse naturali, ecc.)

Trovare le informazioni giuste su Internet è spesso piuttosto difficile. Internet si sta sviluppando in modo caotico, non ha una struttura ben definita. Nessuno può garantire che su un dominio ci siano solo informazioni di un determinato argomento e sull'altro informazioni di un argomento diverso, ma anche chiaramente definito. Ad esempio, sui domini .com è possibile trovare non solo informazioni commerciali, ma, ad esempio, documentazione varia in merito prodotti software o anche scherzi.

Se la struttura del dominio fosse simile alla struttura delle directory, ad esempio, nel dominio ru.comp.os.linux (come nel sistema di news) ci sarebbero tutte le informazioni sul funzionamento Sistema Linux in russo e qualche organizzazione di moderatore si è assicurata che le informazioni su Linux non fossero pubblicate in altri domini, quindi la ricerca sarebbe stata molto più semplice. Dopotutto, sapremmo dove cercare. Apri un browser, inserisci ru.comp.os.linux e ottieni... milioni di collegamenti diversi ad articoli, documenti HOWTO e altre informazioni relative a Linux in un modo o nell'altro.

Prestazioni di ricerca

    Il rendimento della ricerca dipende da molti fattori:
  • Dalle informazioni stesse: possono esserci molte informazioni su un argomento, ma poche su un altro. A volte puoi trovare molte informazioni su un determinato argomento, ma l'efficienza di questa ricerca sarà vicina allo 0,0% e puoi trovare solo 3-4 collegamenti, e questo sarà proprio quello di cui hai bisogno. Ciò include anche la capacità del webmaster di inviare correttamente le informazioni in modo che i motori di ricerca stessi possano trovarle. Supponiamo che da qualche parte molto lontano ci siano le informazioni di cui hai bisogno, ma il motore di ricerca non ne sa nulla. Forse l'informazione è stata appena pubblicata o solo il webmaster che ha pubblicato l'informazione non sospetta nemmeno l'esistenza dei motori di ricerca. Stai cercando informazioni utilizzando un motore di ricerca. Se lei non "conosce" le informazioni di cui hai bisogno, quindi, non saprai nulla nemmeno di lei.
  • Dal motore di ricerca - ci sono molti motori di ricerca e sono tutti diversi. Anche se sono dello stesso tipo (parleremo dei tipi di motori di ricerca poco dopo), ovviamente ognuno di essi avrà il suo algoritmo. Se non riesci a trovare informazioni con un motore di ricerca, prova a cercarle con un altro. Non rimanere bloccato su un motore di ricerca, non importa quanto ti piaccia.
  • Molto dipende dalla capacità di utilizzare un motore di ricerca: come sai come utilizzare un motore di ricerca. Se non sai come utilizzare un motore di ricerca, è improbabile che la tua ricerca sia efficace.

Come cercare informazioni

Poiché molto spesso non selezioni il sito di cui hai bisogno dalla directory del motore di ricerca, ma inserisci una parola chiave specifica (o più parole chiave), è necessario specificare questa stessa parola chiave nel modo più specifico possibile. Più precisamente definisci l'oggetto della ricerca, più accurato sarà il risultato. Il motore di ricerca non può indovinare i tuoi pensieri, devi indicargli chiaramente cosa stai cercando.

Ogni motore di ricerca ha la sua sintassi che devi conoscere. Questo capitolo descriverà la sintassi dei motori di ricerca Google, Yandex e Rambler. Se vuoi utilizzare un altro motore di ricerca, puoi trovare la sua sintassi sul suo sito web (di solito è descritto in dettaglio).

Motori di ricerca su Internet

Ora parliamo dei motori di ricerca stessi.

Sul territorio dell'ex CSI, i seguenti motori di ricerca sono i più popolari, secondo SpyLog (Openstat):

  • 1. Yandex (www.yandex.ru);
  • 2. Google (www.google.com);
  • 3. [email protected] (go.mail.ru);
  • 3. Rambler (www.rambler.ru);
  • 5 Yahoo! (www.yahoo.com);
  • 6. AltaVista (www.altavista.com);
  • 7. Bing (www.bing.com).

I motori di ricerca sono elencati in ordine decrescente di popolarità. Come puoi vedere, il nostro motore di ricerca più popolare è Yandex.

Tipi di motori di ricerca

    Esistono due tipi principali di motori di ricerca:
  • indice - Google, AltaVista, Rambler, HotBot, Yandex, ecc.;
  • classificazione (catalogo) - Rambler, Yahoo! e così via.

Non sorprenderti se il motore di ricerca Rambler è elencato due volte: era sia indice che classificazione allo stesso tempo. Su questo torneremo più avanti, ma per ora parliamo delle differenze tra questi due sistemi.

Come funziona un motore di ricerca per indici? Il motore di ricerca si avvia programma speciale, che naviga i contenuti dei server web, indicizza le informazioni: inserisce nel proprio database le parole chiave di una determinata pagina web, alcune informazioni da una pagina web.

Una breve storia di Google

Cominciamo dal nome. Google è una versione leggermente modificata della parola googol (spesso chiamata "Google" per un motivo). A sua volta, questa parola è stata introdotta da Milton Sirota, nipote del famoso matematico Edward Kasner, e poi è stata resa popolare nel libro di Kasner e Newman Mathematics and Imagination. La parola "googol" mostra il numero come uno 1 seguito da 100 zeri. Il nome "Google" riflette un tentativo di organizzare la grande quantità di informazioni sul Web.

Quindi, cominciamo proprio dall'inizio. I futuri sviluppatori di Google Sergey Brin e Larry Page si sono incontrati nel 1999 alla Stanford University. Poi Larry aveva 24 anni e Sergey - 23. Larry a quel tempo era uno studente all'Università del Michigan e venne a Stanford per alcuni giorni. Sergei era in un gruppo di studenti che avrebbero dovuto far conoscere agli ospiti l'università. Dal primo incontro, Sergey e Larry, per usare un eufemismo, non si sono piaciuti: hanno discusso su tutto ciò di cui si potrebbe discutere. Anche se alla fine questa si è rivelata una cosa positiva, dal momento che le loro diverse opinioni hanno portato alla creazione di un algoritmo per risolvere uno dei problemi informatici più urgenti: trovare le giuste informazioni tra un'enorme quantità di dati. Nel gennaio 1996, Larry e Sergey hanno iniziato a lavorare sul motore di ricerca BackRub, che avrebbe dovuto analizzare i link "indietro" che puntavano a questo sito web. Il lavoro su questo server è stato svolto in una costante mancanza di fondi - dopotutto, a quel tempo Sergey e Larry erano studenti laureati dell'università - tu stesso capisci che gli studenti laureati non hanno molti soldi. A proposito, questa è stata la prima volta che Larry ha preso parte a un progetto così serio, e prima era impegnato in ogni sorta di progetti "frivoli", anche a volte aneddotici, ad esempio, ha costruito una stampante funzionante da un costruttore Lego.

Algoritmi di ricerca di Google

L'interfaccia di Google colpisce per la sua semplicità: un campo di input e due pulsanti. Come si suol dire, tutto ciò che è geniale è semplice.

Sintassi speciale (estesa) di Google

Oltre che logico operatori di Google fornisce i modificatori di ricerca elencati nella tabella. I modificatori di ricerca sono chiamati sintassi speciale di Google. Prendi sul serio questa tabella: una volta che proverai a cercare qualcosa usando i modificatori, non li rifiuterai.

Modificatore inurl di Google

Il modificatore inurl viene utilizzato per cercare l'URL specificato. E a differenza del modificatore del sito, che consente di cercare informazioni su un solo sito o dominio, il modificatore inurl consente di cercare informazioni nelle sottodirectory del sito, ad esempio:

inurl: siteskype-zvonim-free

Il modificatore inurl consente di utilizzare il carattere * per specificare un dominio, ad esempio:
inurl: "*.redhat.com"

È meglio usare inurl con il sito. La seguente query cercherà informazioni nel dominio gidmir.ru, su tutti i suoi sottodomini ad eccezione di www:
sito: gidmir.ru inurl: "*.gidmir" -inurl: "www.gidmir.ru"

Lingua di ricerca di Google

Google consente una sintassi mista, ad es. una sintassi che utilizza diversi modificatori di ricerca speciali in una query. Questo ti permette di ottenere il miglior risultato.

Ecco l'esempio più semplice di sintassi mista:
sito: ru inurl: disco

In questo caso, la ricerca verrà eseguita sui siti di dominio e l'URL deve contenere la parola disco.

Ecco un altro esempio:
sito: ru -inurl: org.ua

La ricerca verrà effettuata sui siti del dominio ru, ma i risultati della ricerca non conterranno pagine che si trovano su org.ua.

Termini di ricerca su Google

Per la maggior parte degli utenti ordinari di Google, il limite di 10 parole chiave non è evidente. Ma gli amanti delle query lunghe, probabilmente hanno notato che Google tiene conto solo delle prime 10 parole chiave e tutto il resto viene semplicemente ignorato.

Perché cercare frasi lunghe? Nella maggior parte dei casi si tratta di estratti di opere. Supponiamo di cercare l'opera "Maestro e Margherita". Si dovrebbe notare che frase chiave dovrebbe assomigliare a "Master Margarita" perché le parole e, o, e, di, o, io, a, le e alcune altre vengono ignorate dal motore di ricerca. Se vuoi forzare l'inclusione di una di queste parole nella tua ricerca, fai precedere la parola con un segno "+", ad esempio +il.

Il superamento del limite di 10 parole consente la corretta costruzione della query. I seguenti consigli ti aiuteranno non solo a ridurre la lunghezza della query, ma anche a migliorare l'efficienza della tua ricerca in generale.

Ricerca Google avanzata

Digitiamo nella riga di input del browser l'indirizzo - www.google.ru/advanced_search e andiamo alla ricerca avanzata di Google.

Con la ricerca avanzata, puoi cercare informazioni in modo flessibile quasi quanto con i modificatori di ricerca. Perché "quasi"? L'interfaccia di ricerca avanzata non fornisce l'accesso a tutti i modificatori di ricerca.

Impostazione delle proprietà di ricerca di Google nei cookie del browser

Non voglio disturbarvi con i dettagli tecnici, quindi vi dirò brevemente cosa sono i Cookie e non, con cosa non si mangiano, ma come devono essere lavorati.

Immagina di avere il seguente compito: dobbiamo scrivere un rapporto di visita individuale per ogni cliente del sito web della nostra azienda. Cioè, in modo che l'utente non veda il numero totale di visite, sappia quante volte è stato sul nostro sito. Per ogni indirizzo IP, dobbiamo conservare i record in una tabella, che probabilmente sarà grande, e da ciò ne consegue che stiamo usando irrazionalmente il tempo del processore e lo spazio su disco. Sarebbe molto più corretto da parte nostra utilizzare questo spazio con maggiore beneficio.

Risultato di ricerca di Google

Risultato ricerca Google non è solo un insieme di link corrispondenti a condizioni specificate ricerca. Questo è qualcosa di più che merita una considerazione separata. Inserisci la parola "rusopen" e fai clic sul pulsante Ricerca Google.

In alto, vediamo il numero totale di risultati (883.000.000) e il tempo totale impiegato dalla ricerca, ovvero 0,34 secondi.

    Nella maggior parte dei casi, il risultato si presenta come:
  • nome della pagina;
  • descrizione della pagina;
  • URL della pagina;
  • dimensioni della pagina;
  • data dell'ultima indicizzazione della pagina;

Ricerca immagini di Google

Il servizio Google Immagini ti permette di trovare diverse immagini sul web. Sebbene le immagini stesse non possano essere indicizzate, le pagine che contengono tali immagini vengono indicizzate. Inserisci una descrizione per l'immagine e otterrai molti, molti collegamenti, oltre alle immagini stesse presentate come una galleria.

    Per una ricerca di immagini più efficiente, è necessario utilizzare i seguenti modificatori di ricerca:
  • intitle: - cerca nel titolo della pagina;
  • filetype: - permette di specificare il tipo di immagine, è possibile specificare i seguenti tipi: JPEG e GIF, non BMP, PNG, le immagini di altri tipi non sono indicizzate;
  • inurl: - cerca l'URL specificato, ad esempio inurl: www.gidmir.ru ;
  • site: ricerca nel dominio o nel sito specificato, ad esempio site: com.

Servizi Google

Google è un potente motore di ricerca con oltre 3 miliardi di pagine. Oltre alle normali pagine Web, Google indicizza file Word, Excel, PowerPoint, PDF e RTF. Google può essere utilizzato anche per cercare immagini e numeri di telefono: Google Immagini e Rubrica sono progettati rispettivamente per questo. In questo articolo parleremo dei Servizi Ad Hoc di Google.

E-mail di Google

Prova a utilizzare la posta di Google. Va notato che questa non è una normale posta web.

    Tra le funzionalità di Gmail, vanno evidenziate le seguenti:
  • enorme dimensione della casella di posta - più di 7 GB;
  • invece di eliminare le lettere, puoi archiviarle - quindi avrai spazio sufficiente per molto tempo e sarai in grado di ripristinare le lettere che sono state ricevute o inviate da te diversi anni fa;
  • la possibilità di cercare per cassetta postale con l'efficienza di Google;
  • comoda organizzazione di lettere e risposte: tutte le lettere e le risposte formano un'unica catena facile da tracciare;
  • buona protezione dallo spam;
  • indirizzo memorabile [email protected];
  • interfaccia intuitiva.

Motore di ricerca Rambler (Rambler)

Storia di Rambler

Tutto è iniziato nel 1991 nella città di Pushchino, nella regione di Mosca. In quell'anno lontano si riunì un gruppo di persone che la pensano allo stesso modo, tra cui Dmitry Kryukov, Sergey Lysakov, Viktor Voronkov, Vladimir Samoilov, Yuri Ershov. L'interesse comune di questo gruppo era Internet. Probabilmente, nel 1991, nessuno dei futuri sviluppatori di Rambler immaginava che sarebbero diventati i creatori di uno dei più grandi e famosi motori di ricerca su Runet. Dopotutto, prima di allora, tutti servivano dispositivi radio presso l'Istituto di biochimica e fisiologia dei microrganismi dell'Accademia delle scienze russa. Nel 1992 è stata creata la società "Stack", guidata da Sergei Lysakov. Profilo Aziendale - reti locali e Internet. In effetti, la società "Stack" era un provider Internet. L'azienda ha creato una rete intracity, quindi ha collegato Pushchino a Mosca e, attraverso di essa, a Internet. A proposito, questo è stato il primo canale IP che è andato oltre Mosca. E questo è nel 1992! Ora la posa di un canale è piuttosto problematica: ci sono sempre molte sfumature, quindi i cavi dovevano essere posati indipendentemente, manualmente, sottoterra, e tutto questo veniva fatto in inverno.

Come ha funzionato la ricerca di Rambler

Internet è in continua evoluzione: il numero dei siti e le loro dimensioni aumentano ogni giorno. Dopotutto, immagina: i siti di grandi dimensioni vengono aggiornati ogni giorno, anche se il volume degli aggiornamenti è di 1024 byte (1 KB), quindi se assumiamo che ci siano 10.000 di questi siti, ogni giorno il motore di ricerca deve elaborare (indicizzare) 10.000 Informazioni KB (approssimativamente, 10 MB). Il numero 10.000 è preso "dal soffitto" - per esempio. Può essere superiore o inferiore: dopotutto, anche i siti di grandi dimensioni non vengono aggiornati ogni giorno. Anche la dimensione dell'aggiornamento è artificiosa. Immagina un sito di informazioni e analisi in cui nuovi articoli vengono pubblicati quasi ogni giorno o materiali vengono ristampati da altri siti. In questo caso, la dimensione degli aggiornamenti sarà lontana da 1 KB, ma almeno 10. A tutto questo si aggiungono altre notizie e altre informazioni, e si scopre che con il numero di siti aggiornati 10.000, il motore di ricerca dovrebbe indicizzare 120 MB di testo. E con tutto ciò, il motore di ricerca non dovrebbe solo visualizzare accuratamente i risultati della ricerca, ma anche farlo il più rapidamente possibile in modo che l'utente si senta a proprio agio nel lavorarci. Chi vuole aspettare 10 minuti per i risultati della ricerca? Sto esagerando, ovviamente, ma personalmente non aspetterei più di 30 secondi per i risultati della ricerca (dal momento in cui fai clic sul pulsante Trova fino alla comparsa dei primi dieci risultati). Si scopre che gli sviluppatori del motore di ricerca devono mantenere costantemente al giusto livello non solo il "ferro", che dovrebbe essere in grado di elaborare quantità sempre crescenti di informazioni, ma non puoi nemmeno prendere "matematica" con un ferro da stiro. È necessario migliorare costantemente gli algoritmi di ricerca in modo che con un aumento del volume della base di ricerca, il tempo di ricerca non aumenti (il che significa un aumento significativo del tempo - per l'utente non c'è differenza per quanto tempo la ricerca sarà di 2,5 secondi o 2,0555 secondi, poiché non è in grado di stimare questo tempo).

Query Rambler, sintassi Rambler

La richiesta a Rambler potrebbe essere composta da una o più parole e la richiesta potrebbe contenere segni di punteggiatura. Gli sviluppatori di Rambler hanno progettato il loro motore di ricerca per la massima comodità dell'utente. Rambler potrebbe persino usare utente inesperto, che non ha alcuna familiarità con il linguaggio di query. Tutto quello che doveva fare era inserire una richiesta composta da più parole (ad esempio, una frase) e senza segni di punteggiatura: lo stesso Rambler ha trovato i documenti necessari e lo ha fatto nel modo più efficiente possibile. Naturalmente, se il linguaggio di query è stato utilizzato correttamente, l'efficienza è aumentata in modo significativo, ma anche con la completa ignoranza del linguaggio di query, l'efficienza della ricerca è stata pari a alto livello. Come già notato, la conoscenza del linguaggio di query è nel tuo interesse, puoi semplicemente trovare le informazioni di cui hai bisogno molto più velocemente.

Motore di ricerca Yandex (Yandex)

Riferimento storico

Nel 1990, la società Arcadia, guidata da Arkady Borkovsky e Arkady Volozh, iniziò a sviluppare una ricerca Software. Sei anni dopo, è apparso il sito Web Yandex. Ma cosa è successo in quei sei anni?

Per due anni sono stati creati due sistemi di recupero delle informazioni: "Classificazione internazionale delle invenzioni" e "Classificatore di beni e servizi". Entrambi i sistemi funzionavano sotto DOS e consentivano la ricerca di una parola da un determinato dizionario utilizzando operatori logici.

Arcadia è diventata una divisione di CompTek nel 1993. Nel periodo 1993-1994, le tecnologie di ricerca sono notevolmente migliorate, ad esempio un dizionario che fornisce ricerche tenendo conto della morfologia della lingua russa occupava solo 300 KB, il che significa che si adatta liberamente RAM e ha funzionato molto rapidamente. Basato su questo nuova tecnologia nel 1994 è stato creato il "Bible Computer Reference", un sistema di reperimento di informazioni che funziona con le traduzioni dell'Antico e del Nuovo Testamento.

Ricerca lingua Yandex

Come interpreterà il motore di ricerca la parola inserita?

    Ora parleremo di questo:
  • Regola 1. Si scopre che il sistema lo interpreta secondo le regole della lingua russa. Esempio: se inserisci la parola "auto", otterrai anche risultati contenenti le parole "auto", "auto", ecc. Allo stesso modo, con i verbi - per la query "go", riceverai documenti contenenti le parole "go", "goes", "walked", "walked", ecc. Come puoi vedere, il motore di ricerca è più intelligente di quanto potresti pensare: non è solo uno strumento per cercare una parola particolare in un database.
  • Regola 2 Attenzione speciale dato alle parole maiuscole. Se una parola è in maiuscolo e non è la prima parola di una frase, verranno trovate solo le parole in maiuscolo. In caso contrario, verranno trovate le parole scritte sia con lettere maiuscole che minuscole. Esempio: su richiesta "Basso A." si troveranno documenti contenenti sia "taxa" (quota) che "taxa" (cognome), poiché la parola "taxa" sebbene in maiuscolo, è però prima nella frase. Ma la query "A. Dachshund" troverà documenti contenenti solo la parola "Dachshund", scritta con la lettera maiuscola.

Sintassi Yandex

Per impostazione predefinita, Yandex utilizza l'operatore logico AND. Ciò significa che se hai inserito una query " tv samsung", quindi nei risultati otterrai documenti in cui le parole "TV" e "Samsung" appariranno nella stessa frase. Se vuoi specificare esplicitamente l'operatore AND, usa il carattere e commerciale &. In altre parole, il La query "Samsung TV" è simile alla query "TV e Samsung". Puoi anche utilizzare la query "TV + Samsung".

Se vuoi l'effetto opposto, cioè Se desideri ottenere documenti che contengono la parola "TV" separatamente e la parola "Samsung" separatamente, devi utilizzare l'operatore OR (|), ad esempio: "TV | Samsung".

Sintassi della query Yandex

Tutte le parole nel testo di un documento sono numerate da Yandex in ordine. La distanza tra le parole adiacenti è 1 (non 0!) e la distanza tra le parole all'interno ordine inversoè uguale a -1. Lo stesso vale per le offerte.

Per indicare la distanza tra le parole, viene inserito il segno /, seguito immediatamente da un numero, il che significa che questa è la distanza tra le parole. Ad esempio, la query "sviluppatore /2 programmi" troverà documenti che contengono le parole "sviluppatore" e "programmi" e la distanza tra le parole non dovrebbe essere superiore a due parole e tutte queste parole dovrebbero essere in una frase. In questo caso verranno trovati documenti contenenti "sviluppatore di programmi applicativi", "sviluppatore di programmi di sistema", ecc.

Se conosciamo esattamente la distanza e l'ordine delle parole, possiamo usare la sintassi / + n. Ad esempio, la query "red /+1 riding hood" risulterebbe nella parola "cap" immediatamente dopo la parola "red". La query "cappuccetto rosso" porterebbe allo stesso risultato.

Operatori di ricerca Yandex

Le parentesi vengono utilizzate per rappresentare un'intera espressione in una query. Ad esempio, la ricerca "(storia | tecnologie | programmi)/+1 Linux" troverà documenti contenenti una delle frasi "storia di Linux", "Tecnologie Linux", " Programmi Linux".

Zone

Una zona è un luogo in cui trovare le informazioni di cui hai bisogno. È possibile specificare la zona in cui si desidera effettuare la ricerca: intestazioni (zona titolo), collegamenti (ancoraggi) o indirizzo (indirizzo). Puoi anche utilizzare la zona tutto: cerca nell'intero documento.

Sintassi: query $nome_zona.

Ad esempio: request $title "(!LANG:Microsoft" найдет все документы, в заголовках которых встречается точная фраза "Microsoft".!}

Opzioni di ricerca Yandex aggiuntive

Il motore di ricerca Google ha consentito di limitare il percorso di ricerca a un elenco specifico di server o, al contrario, di escludere determinati server dall'elenco di ricerca. Ci sono esattamente le stesse opportunità nel motore di ricerca Yandex. Puoi anche cercare documenti che rimandano a URL o immagini specifici. Quando si specifica una maschera di file (ad esempio un'immagine), è possibile utilizzare il carattere *, che indica tutti i caratteri, ad esempio: ”audi-*”.

La sintassi è: #nome_elemento="valore".

Obbiettivo: comprendere i principi di base dell'organizzazione della ricerca di informazioni su Internet.

Compiti:

Educativo:

  • formazione di capacità di ricerca di informazioni su Internet;
  • utilizzare la ricerca e la selezione delle informazioni nelle attività pratiche e nella vita quotidiana;

Sviluppando:

  • sviluppo del pensiero logico, attenzione, approccio creativo al business negli scolari;

Educativo:

  • formazione negli studenti di responsabilità per le imprese, interesse per l'informatica, collettivismo e mutua assistenza.

Tipo di lezione: apprendimento di nuovo materiale.

Forme di formazione: frontale, individuale, di gruppo.

Metodi didattici: Verbale, visivo, pratico, di ricerca.

Attrezzatura:

  • Computer con accesso a Internet, proiettore multimediale, ufficio.
  • Presentazione per la lezione <Презентация >
  • Prova dello studente <Приложение 1 >
  • Schede attività per gruppi <Приложение 2 >
  • Operatori logici <Приложение 3 >

Piano di lezione:

  1. Momento organizzativo - 2 min.
  2. Tecniche per la ricerca di informazioni su Internet - 18 min.
  3. Servizio World Wide Web (WWW)
  4. directory di ricerca.
  5. Motori di ricerca.
  6. Formazione di richieste di ricerca di informazioni.
  7. Lavoro di gruppo sulla ricerca di informazioni su Internet - 15 min.
  8. Esecuzione del test - 5 min.

Durante le lezioni

1. Momento organizzativo.

2. Tecniche per la ricerca di informazioni su Internet

Internet sta crescendo a un ritmo molto veloce, sta diventando sempre più difficile trovare le informazioni necessarie tra centinaia di miliardi di pagine Web e centinaia di milioni di file. Per cercare informazioni vengono utilizzati motori di ricerca speciali, che contengono informazioni costantemente aggiornate sulla posizione di pagine Web e file su centinaia di milioni di server Internet.

Prima di considerare i sistemi di recupero delle informazioni, dobbiamo affrontare le domande: che cosa possiamo cercare e dove, poi - come organizzare una tale ricerca.

La memorizzazione delle informazioni di solito termina con la ricerca di informazioni specifiche per un ulteriore utilizzo. La ricerca è organicamente collegata alla procedura di archiviazione, quindi non sempre viene individuata.

Servizio World Wide Web (WWW)

È il servizio più popolare su Internet oggi. È lei che viene spesso identificata con Internet nel suo insieme, sebbene in realtà sia solo uno dei suoi tanti servizi.

Definizione WWW

Il fondatore della rete Tim Bernes-Lee ha dato questa definizione.

WWW è una rete di server, un sistema multimediale informativo distribuito eterogeneo ad uso collettivo.

Dalla definizione è chiaro quale ruolo enorme abbia l'ambiente informatico nella società moderna. L'ambiente WWW non ha una struttura centralizzata. Chiunque desideri mettere su Internet i propri materiali che non siano in contraddizione con la legge può farlo. Viene chiamato un documento separato del World Wide Web pagina web. In genere, si tratta di un documento combinato che può contenere testo, grafica, contenuti multimediali e altri oggetti. Una caratteristica distintiva dell'ambiente WWW è la disponibilità di mezzi di passaggio da un documento all'altro, ad esso tematicamente associati, senza specificarne esplicitamente l'indirizzo. La comunicazione tra i documenti viene effettuata utilizzando collegamenti ipertestuali. Un numero enorme di documenti elettronici ipertestuali archiviati sui server WWW formano una sorta di iperspazio di documenti tra i quali è possibile il movimento.

La comunicazione tra centinaia di milioni di documenti archiviati sui server fisici di Internet non potrebbe esistere se ogni documento in questo iperspazio non avesse un proprio indirizzo univoco. Un file su un singolo computer locale ha un nome completo univoco, che include il proprio nome file con un'estensione e il percorso del file, che inizia con il nome del dispositivo su cui è archiviato. Quando si determina la posizione di un file sul World Wide Web, è necessario espandere il concetto di un nome di file univoco. Viene determinato l'indirizzo di qualsiasi file su scala mondiale localizzatore di risorse uniforme - URL. Un URL è una stringa standard di caratteri che specifica la posizione di una risorsa, documento o parte di esso su Internet ed è composta da tre parti.

  • nome del protocollo per l'accesso al servizio Internet;
  • il nome del server su cui è archiviata la risorsa e l'applicazione del server del servizio Internet è in esecuzione;
  • il nome completo del file archiviato sul server.

Per il funzionamento del servizio Internet sono necessari server e software client. Il servizio World Wide Web è fornito dal server Software- Server Web e programmi client - Browser Web.

Sistemi di reperimento delle informazioni

I servizi di informazione definiscono la tecnologia di archiviazione, trasmissione oggetti informativi e, di conseguenza, algoritmi di ricerca.

I documenti Web sono archiviati su server Web, i file e gli archivi di file sono archiviati su file server. A questo proposito, l'insieme di oggetti informativi disponibili utilizzando ciascun servizio può essere considerato come uno spazio di recupero delle informazioni separato.

Ora sapendo che cosa possiamo cercare e dove, Diamo un'occhiata alla domanda - come organizzare una tale ricerca.

Attualmente, per cercare informazioni specifiche, ci sono i cosiddetti sistemi di reperimento delle informazioni o, come si dice nel gergo di Internet, servizi di ricerca. Il motore di ricerca è un sito Web specializzato. Il principio di funzionamento di tali sistemi è semplice: l'utente deve spiegare al sistema cosa deve ottenere e il compito del servizio di ricerca è trovare e visualizzare un elenco di collegamenti ipertestuali a pagine che menzionano le informazioni rilevanti.

Classificazione del servizio di ricerca:

  • secondo il metodo di organizzazione e riempimento del database di documenti sulla rete per directory di ricerca e motori di ricerca;
  • dalla profondità della copertura delle risorse in globale e locale.

Caratteristiche delle directory di ricerca

I cataloghi di ricerca sono organizzati secondo lo stesso principio dei cataloghi tematici delle grandi biblioteche. I principi per lavorare con le directory sono abbastanza semplici. In genere, la pagina principale di un sito Web di catalogo contiene un elenco di categorie o intestazioni, ciascuna delle quali è rappresentata da un collegamento ipertestuale.

Lavorare con le directory di ricerca è intuitivamente semplice. In essi la ricerca di informazioni finisce quasi sempre in modo più o meno fruttuoso. Tuttavia, questa semplicità nasconde l'estrema complessità della creazione e della manutenzione di un catalogo.

La caratteristica più importante delle directory è il volume del database, ad es. il numero di documenti presentati. Per i cataloghi globali, questo valore è di circa 1-2 milioni di documenti, ovvero circa lo 0,1-0,2% dello spazio WWW totale, e il grado di copertura del volume totale delle risorse WWW è in costante diminuzione a causa dell'aumento a valanga di risorse informative in rete globale. Pertanto, l'uso dei cataloghi non può dare risultati altamente completi.

Rispetto ai motori di ricerca, il tasso di crescita dei database di directory è piuttosto lento. Il fatto è che le directory di ricerca vengono create manualmente da un team di redattori altamente qualificati, chiamati anche moderatori. Tuttavia, questo può essere visto anche come un vantaggio dei motori di ricerca, poiché la selezione manuale migliora l'accuratezza della ricerca e la distribuzione dei materiali nelle intestazioni appropriate.

Un'altra caratteristica delle directory è il numero di categorie o intestazioni nella directory. Naturalmente, maggiore è questo valore, più accurati saranno i risultati della ricerca. Per i cataloghi globali, questo valore è attualmente di decine di migliaia.

Funzionalità del motore di ricerca

Nei motori di ricerca, le directory delle risorse Web vengono create automaticamente da programmi speciali chiamati robot di ricerca o indici di ricerca (oltre a "worm", "spider", "trawlers", "macchine automatiche", "agenti", ecc.). Il fattore umano è escluso dal processo di riempimento del database dei motori di ricerca. Allo stesso tempo, la qualità dei collegamenti forniti dal sistema in base ai risultati della ricerca diminuisce, ma allo stesso tempo aumenta il loro numero.

Il programma Search Robot esegue la scansione del Web per identificare nuovi documenti da inserire nel database del motore di ricerca - indice. Viene chiamato il processo di aggiunta di informazioni su un documento a un indice indicizzazione.

Fasi del robot di ricerca

  1. Raccolta del database primario.
  2. Indicizzazione database.
  3. Creazione dell'elenco di collegamenti risultante.

Formazione di richieste di ricerca di informazioni

Quando cerchiamo informazioni su Internet, abbiamo il diritto di fare affidamento sulla completezza, accuratezza e pertinenza dei risultati della ricerca, inoltre, desideriamo ricevere i risultati il ​​più rapidamente possibile.

Alcuni dei fattori elencati non possono essere influenzati dall'utente che effettua la ricerca. Ad esempio, la velocità di ottenimento delle informazioni dipende dalle caratteristiche tecniche e dal carico di lavoro dei canali di comunicazione e dei server dei servizi di ricerca, nonché dalle caratteristiche degli algoritmi implementati nel motore di ricerca. Tuttavia, l'utente può influire sulla qualità dei risultati della ricerca se, durante l'operazione di ricerca, si verificano:

  • fare una scelta giustificata del servizio di recupero delle informazioni;
  • tenere conto delle caratteristiche del sistema di reperimento delle informazioni;
  • formulare correttamente le richieste di ricerca di informazioni.

La formazione di query è il processo di espressione di un'esigenza di informazione utilizzando parole chiave e combinando queste parole chiave utilizzando il linguaggio di recupero delle informazioni del sistema.

La qualità di una query è influenzata da tre fattori: la conoscenza da parte dell'utente delle caratteristiche di un linguaggio naturale, la capacità di prendere in considerazione le caratteristiche del linguaggio dei documenti e la conoscenza della struttura e delle caratteristiche di un linguaggio di reperimento delle informazioni.

Strutture e caratteristiche del linguaggio di reperimento delle informazioni

Per migliorare l'accuratezza dei risultati della ricerca, come già notato, è importante formulare correttamente le richieste di ricerca delle informazioni. Le lingue di recupero delle informazioni forniscono all'utente un gran numero di operatori, ad es. parole di servizio utilizzate per combinare le parole chiave della query. Ogni motore di ricerca ha il proprio set di operatori, ma di solito questi operatori sono combinati in gruppi comuni alla maggior parte dei sistemi.

Operatori di motori di ricerca

Quando si utilizzano linguaggi di query, è necessario tenere conto del fatto che differiscono notevolmente nei diversi motori di ricerca. Questo diventa un grosso problema durante l'utilizzo interrogazioni complesse nei metamotori di ricerca.

Operatori logici

I motori di ricerca hanno solitamente tre operatori: "AND logico", "OR logico" e "NOT logico". Tra le parole chiave viene indicato l'operatore "AND logico" se è necessario restituire documenti contenenti tutte le parole cercate. “OR logico” viene utilizzato quando è necessario ricercare documenti contenenti almeno una delle parole chiave associate a questo operatore. L'operatore "NOT logico" è necessario per escludere dall'elenco i documenti in cui è presente una parola preceduta nella query da questo operatore.

Una semplice situazione spiega quanto sopra. La query "autobus e tram" o "autobus e tram" restituirà solo documenti in cui le parole bus e tram sono presenti contemporaneamente.

La query "bus o tram" restituirà tre tipi di documenti: il documento contiene solo la parola bus, il documento contiene solo la parola tram e il documento contiene le parole bus e tram.

Il simbolo “!”, in Yandex, ad esempio, significa riparare il registro. Se stai cercando il nome del villaggio "Ostrov" e non il concetto geografico di "isola", dovresti scrivere "!Ostrov". Quando si cercano informazioni sul film "The Island", è meglio fare una domanda sotto forma di citazione: "il film The Island".

Operatori a distanza

La maggior parte dei motori di ricerca attualmente offre la possibilità di utilizzare i cosiddetti operatori di distanza, che stabiliscono dei limiti alla distanza tra le occorrenze delle parole chiave l'una dall'altra nel testo del documento. Di norma, si distinguono tre operatori di questo gruppo: un operatore di ricerca di frasi che consente di trovare le occorrenze esatte di una specifica sequenza di parole (una frase è specificata tra virgolette), un operatore che imposta la distanza in parole e un operatore che imposta la distanza in frasi.

Altri operatori

Oltre a questi due gruppi, ci sono anche gli operatori:

  • tenendo conto delle caratteristiche del linguaggio naturale;
  • selezionando la parte del documento da ricercare;
  • selezionando per cercare pagine scritte in una lingua particolare;
  • limitare la ricerca a un tipo di file specifico;
  • cercare il testo nelle intestazioni delle pagine;
  • selezione di un sottoinsieme di documenti.

La composizione di questi gruppi dipende fortemente dal motore di ricerca.

Lavoro di gruppo sulla ricerca di informazioni su Internet - 15 min.

A gruppi di studenti viene assegnato un compito Allegato 2.

Esecuzione del test - 5 min.

Riassumendo la lezione - 5 min.

Riassumiamo il nostro lavoro. Parli uno dopo l'altro in una frase, scegliendo l'inizio della frase dallo schermo riflettente.

  • Oggi ho scoperto...
  • Era difficile…
  • Ho svolto compiti...
  • Ho studiato…
  • Ho acquistato...
  • Ho capito che...
  • Era interessante…

Compiti a casa

1. Sezione 3.5. Rispondi alle domande dopo il paragrafo.

2. Completare per iscritto. È stato proposto un elenco di vari motori di ricerca. Dividili in due colonne.

sistema russo Sistema internazionale

Letteratura

  1. Informatica e TIC., ND Ugrinovich, grado 8