Come i motori di ricerca di lavoro - Web crawler da Fahrizal Wibowo

itis motori di ricerca che finalmente portare il vostro sito web per il noticeof potenziali clienti. Quindi è meglio sapere come thesesearch motori realmente funzionano e come presentare le informazioni per thecustomer avviare una ricerca.

Thereare fondamentalmente due tipi di motori di ricerca. Il primo è da crawler o spider robotscalled.

searchengines

usespiders a siti web di indice. Quando si invia le pagine del sito web per aSearch motore completando la loro pagina di presentazione desiderata, thesearch spider dei motori di volontà indice intero sito. Un programma di 'ragno' ISAN automatico che viene eseguito dal sistema dei motori di ricerca. Spidervisits un sito web, leggere il contenuto sul sito stesso, i tag site'sMeta e seguire anche i link che il sito collega. Thespider poi restituisce tutte queste informazioni di nuovo ad un centraldepository, dove i dati vengono indicizzati. Si visiterà ogni collegamento youhave sul tuo sito web e indice quei siti come bene. Alcuni ragni willonly indice di un certo numero di pagine del tuo sito, in modo da non createa sito con 500 pagine!

Thespider sarà periodicamente tornare ai siti per verificare la presenza di anyinformation che è cambiato. La frequenza con cui questo happensis determinato dai moderatori del motore di ricerca.

Aspider è quasi come un libro se contiene la tabella dei contenuti, il contenuto effettivo e il link e riferimenti per tutti i websitesit trova durante la sua ricerca, e può indicizzare fino a un milione di pagine aday

Esempio:.. Excite, Lycos, AltaVista e Google

whenyou chiedere a un motore di ricerca per trovare informazioni, si actuallysearching attraverso l'indice che ha creato e non actuallysearching il Web. Diversi motori di ricerca producono differentrankings perché non tutti i motori di ricerca utilizza lo stesso algoritmo di tosearch attraverso gli indici.

Oneof le cose che le scansioni di un algoritmo motore di ricerca per è thefrequency e la posizione di parole chiave su una pagina web, ma può alsodetect parola chiave artificiale ripieno

o spamdexing.

Poi gli algoritmi analizzano il modo in cui pagine contengono dei collegamenti ad altre pagine Web inthe. Controllando come pagine contengono dei collegamenti tra di loro, un motore può bothdetermine ciò che una pagina è di circa, se le parole chiave del pagesare legati simile alle parole chiave nella pagina originale.