2. Come avviene
l'indicizzazione ?
L'indicizzazione
avviene in due modi. Nel primo, è il motore
stesso che mediante un sistema automatico,
detto spider o crawler, visita i vari
siti web seguendo i link presenti nelle
loro pagine. Per ogni pagina web incontrata,
lo spider registra parte del contenuto,
sia quello visibile dal browser, sia quello
facente parte del codice html non visibile
ai navigatori. Tale informazione sarà
necessaria per associare la pagina alle
parole chiave digitate dagli utenti del
motore di ricerca.
Con questo sistema, lo spider di un motore
viaggia attraverso il web indicizzando
una notevole quantità di pagine (nell'ordine
delle centinaia di milioni). Tuttavia,
molte rimangono non raggiungibili, se
non sono collegate ad altri siti tramite
link. Se si immagina il web come un mare,
i siti sono isole collegate fra di loro
con dei ponti, i link. Un nuovo sito nasce
isolato, finché un altro, a sua volta
collegato ad altri, non attiva un link.
Per indicizzare anche siti "isolati",
i motori di ricerca ricorrono a un secondo
metodo, il "submit". (Non tutti: alcuni
motori ammettono solo il submit di siti
non isolati). Mediante il submit si segnala
direttamente una pagina web a un motore
in modo che la possa collocare nel suo
indice, cioè indicizzare. Alcuni motori
si limitano ad indicizzare le pagine segnalate,
altri azionano lo spider che segue anche
i link in essa presenti. Se dunque si
segnala una homepage, alcuni motori indicizzeranno
tutto il sito o alcune sue parti, a loro
discrezione
3. Perché il mio sito non si trova nei
motori ?
Perché non è stato ancora indicizzato. Se il
sito è in rete da poco tempo, probabilmente
non è stato ancora reperito in modo automatico.
Oppure, non vi sono altri siti ad esso
collegati con dei link, e dunque esso
è isolato e non reperibile dai motori
che visitano il web seguendo i link che
collegano i vari siti. Per indicizzare
un sito, è necessario assicurarsi che
sia collegato al resto della rete tramite
almeno un link entrante, oppure segnalarlo
direttamente mediante con un "submit".
Nei siti dei motori di ricerca vi è una
sezione in cui è possibile segnalare nuove
pagine web tramite una form. 
4. Perché il mio sito non si trova
nei motori anche se l'ho segnalato?
Perché fra la segnalazione e l'indicizzazione
possono trascorrere anche parecchi mesi.
Il tempo varia molto da motore a motore,
ma generalmente devono trascorrere almeno
alcune settimane. Se anche dopo diverso
tempo il sito non compare, è possibile
che quando il motore di ricerca ha visitato
la pagina segnalata per indicizzarla,
non abbia ricevuto risposta dal server.
Se il sito risiede su un server instabile
o sovraccarico, come capita nei servizi
di hosting gratuiti o economici, è possibile
che la visita del motore avvenga proprio
in un momento di "down". In tal caso è
necessario ripetere il submit. In taluni
casi, ad essere sovraccarico è il motore
stesso, che non riuscendo ad evadere le
troppe richieste, le ignora. Anche in
questo caso il submit va ripetuto. Un
altro motivo può essere la tecnologia
utilizzata dal mio sito. I motori di ricerca
non sono in grado di indicizzare pagine
solo grafiche, o in java, o in flash,
o in altre tecnologie non-html. Anche
i siti con frames risultano ostici ai
motori. 
5. Perché nei motori si trovano solo
alcune pagine del mio sito?
Perché non tutte le pagine di un sito sono indicizzabili.
Pagine solo grafiche, o in java, o in
flash, o in altre tecnologie non-html.
Nei i siti con frame spesso vengono indicizzati
solo i singoli frame distinti dal frameset.
Se inoltre il sito ha sezioni dinamiche,
queste rimangono off-limits per i motori,
o vengono indicizzate in modo parziale.
Un altro motivo è che talvolta i motori,
per motivi di risorse insufficienti, indicizzano
solo i primi livelli di un sito non seguendo
i link in profondità. Ancora, è possibile
che il motore in questione contenga solo
le pagine segnalate direttamente col submit
e non abbia eseguito l'indicizzazione
completa, o che siano state segnalate
solo pagine interne senza link. 
6. Perché nei motori si trovano pagine
vecchie del mio sito?
Perché quelle pagine sono ancora presenti fisicamente
sul server, anche se non fanno più parte
del sito. Per evitare che vengano visualizzate,
devono essere rimosse dalla loro collocazione
originaria. Peraltro, rimarranno i link
nell'indice dei motori, per lo meno finché
essi non avranno visitato nuovamente il
sito verificando che le pagine non esistono
+ ed eliminandole definitivamente dall'indice.
Ciò può richiedere anche diversi mesi,
durante le quali nell'indice rimangono
i link ma l'eventuale clic da parte di
chi effettua le ricerche provocherà un
errore 404 - page not found. 
7. Perché il mio sito si trova nei motori
ma non nei primi posti?
Perché non è stata eseguito un operazione di
ottimizzazione del sito per i motori di
ricerca. L'ordine con cui vengono visualizzati
i listing (i link alle pagine indicizzate)
è frutto di un complesso calcolo che tiene
conto di una serie di fattori tutti riconducibili
al contenuto delle pagine web e al codice
HTML in cui sono scritte. Ogni motore
di ricerca utilizza propri criteri, per
cui quanto risulta adeguato per uno non
lo è per gli altri. Per ottimizzare un
sito, è necessario intervenire sul suo
codice in modo da renderlo più adeguato
ai criteri di classificazione di tutti
i motori ricerca principali. 
8. Perché nei motori si trovano link
a pagine del mio sito non più esistenti?
Perché l'indicizzazione è avvenuta quando quelle
pagine erano ancora . Una volta che un
sito è stato indicizzato, possono passare
dei mesi prima di un aggiornamento. Dunque
rimarranno i link nell'indice finché essi
non avranno visitato nuovamente il sito
verificando che le pagine non esistono
+ ed eliminandole definitivamente dall'indice.
9. Perché il mio sito improvvisamente
non si trova più nei motori?
Perché il motori di ricerca sono in continua
evoluzione, e le regole che valgono oggi
possono non valere più domani. Non sono
infrequenti cambi di algoritmo, nel tentativo
di migliorare la qualità delle ricerche,
per cui i criteri di ordinamento dei risultati
cambiano. Talvolta gli enormi database
in cui sono contenuti gli indici vengono
aggiornati o trasferiti con conseguente
perdita di dati. E' inoltre possibile
che il motore abbia visitato il sito per
il periodico aggiornamento e non abbia
ricevuto risposta dal server, temporaneamente
malfunzionante, eliminando il sito dall'indice
in quanto inattivo. 
10. Perché siti più semplici sono più
avanti del mio?
La complessità grafica di un sito web è inversamente
proporzionale alla probabilità di un buon
posizionamento motori di ricerca. Questi
infatti basano le loro ricerche esclusivamente
sul codice HTML ignorando le tecnologie
web più avanzate che rendono i siti accattivanti,
privilegiando i siti prevalentemente testuali
e non molto elaborati. Ma non essendo
in grado di valutare la qualità dei testi,
i motori di ricerca finiscono sovente
per premiare siti scarsi sia dal punto
di vista dello stile che del contenuto.