Non sono pazzo: sì, possiamo far credere ad un sito di essere uno spider come googlebot con estrema facilità.
Perchè mai farlo? Semplice, perchè in alcuni casi questo trucco ci risparmia la “fatica” di doverci registrare ai vari siti, blog, forum durante le nostre ricerche sul web.
Lo scenario tipico è quello in cui, quando digitiamo una chiave di ricerca su google e seguiamo uno dei risultati ci troviamo di fronte ad una richiesta di registrazione, necessaria per accedere al contenuto desiderato. Il che a volte è molto fastidioso.
Come avrete capito Googlebot, il famoso spider (o Crawler) che in ogni momento setaccia il web a caccia di contenuti da indicizzare, ha le porte aperte un po più degli altri. Il motivo lo ho già detto: in quanto spider analizza e indicizza le pagine, indicizzazione significa popolarità, popolarità significa incremento della visibilità e volendo maggiori guadagni per il webmaster, magari se nelle proprie pagine mostra un po di pubblicità.
Ecco perchè ognuno di noi avrebbe interesse a far leggere i propri contenuti al googlebot di turno, pure se normalmente non sarebbero accessibili ad utenti non registrati, ed è proprio questo quello che accade, per un semplice discorso di visibilità.
Basta modificare lo User-agent del nostro browser, una stringa di testo (header) inviata ai vari server durante le richieste http e usata per identificare il client (browser) utilizzato per la navigazione.
Banalmente, se avete firefox, la stringa che inviate è questa:
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.9.0.3) Gecko/2008092417 Firefox/3.0.3
Anche Googlebot manda un header quando bussa alle porte di una pagina web, ed è questo:
User-Agent: Googlebot/2.1 (+http://www.googlebot.com/bot.html)
Se volete provare vi consiglio di usare Firefox, installando un leggerissimo Add-On che modifica a piacimento gli header HTTP: Modify-Headers.
Installatelo e aggiungete la stringa di googlebot come nell’immagine, attivate la modifica e buona navigazione.
Il mio consiglio è quello di attivare l’header solamente quando si fanno ricerche, in quanto certi domini tendono a dare in pasto ai bot versioni Lo-Fi delle pagine.
DTIData rende disponibili sul proprio blog ufficiale una serie di articoli e utili consigli per la salvaguardia dei dati personali.
A proposito di CHKDSK (checkdisk), utility disponibile nei sistemi DOS e Windows per il controllo del file system, Jacqui Best ci spiega perchè è importante fare un backup completo prima di usarla quando sul supporto che non funziona correttamente sono presenti dati importanti.
CHKDSK è uno strumento sviluppato per il controllo e il ripristino dell’integrità del file system, può essere usato anche per riconoscere bad sectors e fare in modo che questi vengano ignorati dal sistema; infine è la prima risorsa built-in a disposizione del sistemista quando windows non si avvia.
Quello che di solito si ignora è che CHKDSK non è stato pensato per eseguire il controllo sull’integrità dei dati.
Cito da una Knowledge Base Microsoft che approfondisce il funzionamento dell’utility:
Note also that NTFS does not guarantee the integrity of user data after an instance of disk corruption, even if you immediately run a full CHKDSK operation. There might be files that CHKDSK cannot recover, and files that CHKDSK does recover might still be internally corrupted. It remains vitally important that you protect mission-critical data by performing periodic backups or by using some other robust method of data recovery.
Se volete ridurre al minimo la possibilità di perdere i vostri dati il consiglio è di fare un’immagine del disco prima di tentare il recovery con checkdisk, dal momento che oltre a farvi perdere (molto) tempo e danneggiare ulteriormente l’hard disk potrebbe rendere difficile il lavoro persino ad uno specialista.
Per evitare quindi l’esecuzione non desiderata del comando (windows tende a schedularlo al primo reboot in caso di errori), perlomeno finchè i dati che ci interessano non sono in salvo, si può ricorrere ad un piccolo trucco:
da un prompt del DOS, che se il sistema non si avvia possiamo utilizzare anche in modalità provvisoria, digitiamo
Chkntfs /x C:
dove al posto di <C:> inseriremo la lettera di unità del disco danneggiato.