Cercare mp3 ed altri tipi di file con Google

A volte si cerca un pezzo mp3 e non si ha la voglia o la possibilità di utilizzare un programma p2p, ecco quindi un vecchio trucco per raffinare la ricerca con Google, spulciando tra le cartelle web il cui contenuto è visibile. Basta utilizzare la seguente sintassi:

-inurl:(htm|html|php) intitle:"index of" +"last modified" +"parent directory" +description +size +mp3 "the smiths"

Se vogliamo includere anche i file di tipo wma:
-inurl:(htm|html|php) intitle:"index of" +"last modified" +"parent directory" +description +size +(mp3|wma) "the smiths"

Se vogliamo cercare pdf basterà modificare l’estensione presente nella stringa di ricerca, idem per i video (avi, mpg, mpeg…), etc.

Modificare il nome di una cartella in Google Reader

Google Reader non offre la possibilità di modificare direttamente il nome di una cartella. È però possibile arrivare allo stesso risultato attraverso una breve serie di passaggi. Vediamo come fare:

  1. Cliccate su Settings per aprire la finestra delle impostazioni;
  2. Nella finestrella a destra per filtrare i risultati inserite il nome della cartella che volete modificare, Google Reader vi mostrerà soltanto i blog che appartengono a tale categoria;
  3. Cliccate su Select all (numero a piacere) subscriptions;
  4. Cliccate nelle opzioni di un feed su Change folders…, selezionate New Folder…, e create la nuova cartella che volete sostituisca la vecchia;
  5. Cliccate in alto su More actions… e scegliete, sotto Add Tag… il nome della cartella che avete appena creato. Quindi fate lo stesso per l’opzione Remove tag…, scegliendo la cartella che volete eliminare.

In questo modo Google Reader eliminerà la vecchia cartella e creerà la nuova. Un po’ più laborioso rispetto alla semplice possibilità di cambiarne il nome ma alla fin fine il risultato è lo stesso.

Google reader perde pezzi

Da qualche giorno Google Reader ha deciso che non tutti i commenti ai post di mau valgon la pena di essere scaricati, e adesso a quanto pare nemmeno i miei. Tutti quelli inviati oggi sono stati bellamente ignorati, benché Feedburner li mostri correttamente. Mah.

Update: I miei sono arrivati tutti di botto, si vede che GR aspettava che rispondessi.

Creare mappa del sito e robots.txt per il proprio blog

Il corretto utilizzo della mappa del sito (sitemap) e del file robots.txt può aiutare ad aumentare il ranking del proprio blog sui motori di ricerca ed è in generale consigliabile farne uso in quanto migliorano l’indicizzazione della pagine. Benché questo articolo sia incentrato su WordPress i suggerimenti forniti possono essere adattati a qualsiasi piattaforma.

Creare la mappa del sito

La mappa del sito non è altro che un file in formato xml che mostra al motore di ricerca come questo è organizzato, in modo che possa essere indicizzato correttamente. Si tratta di una procedura introdotta da Google ma in rapida diffusione. Se in un primo momento il file doveva essere segnalato attivamente, di recente è stata introdotta la novità di utilizzare il file robots.txt per avvertire i programmi che in automatico visitano le pagine per conto del motore (gli spider). Creare la mappa del proprio blog è semplicissimo se si utilizza WordPress, è sufficiente utilizzare il plugin Google Sitemap Generator che si fa carico di tutta l’operazione.

Il file robots.txt

Il file robots.txt è un semplicissimo file di testo che contiene informazioni destinate ai motori di ricerca. In esso è possibile inserire istruzioni circa le pagine da controllare e quelle da evitare discriminando tra i vari motori di ricerca. È una buona idea farne uso perché in questo modo si può evitare che gli spider cerchino tra pagine che non debbono essere indicizzate e che archivino informazioni doppie. Il formato è molto semplice: ogni riga contiene un’istruzione, ogni gruppo di istruzioni è preceduto dall’indicazione del motore di ricerca al quale ci si rivolge, e le righe che iniziano con “#” sono commenti.

Un piccolo esempio:

User-agent: *
Disallow: /wp-
Disallow: /trackback/

La prima riga come abbiamo già detto indica a quali motori di ricerca sono rivolte le istruzioni che seguono: l’asterisco è una espressione regolare che significa “tutti”, quindi varrà tanto per Google quanto per Yahoo o Altavista. Le righe successive contengono invece le istruzioni vere e proprie, ossia indicano agli spider di non prendere in considerazione le cartelle il cui nome inizia con “/wp-” e la sottocartella “trackback”.

Quali cartelle inserire nel file robots.txt, dunque? Questo sta a chi gestisce il blog stabilirlo, in linea di massima se si utilizza WordPress è utile escludere le seguenti cartelle:

  • Le cartelle che servono per la gestione del blog (quelle che abbiamo visto iniziare con “wp-”);
  • La cartella dei trackback, in quanto farebbe indicizzare pagine vuote;
  • Il feed dei commenti, in quanto riporterebbe informazioni duplicate;

Il contenuto del file potrebbe quindi essere il seguente:

User-agent: *
Disallow: /wp-
Disallow: /comments/feed/
Disallow: /trackback/

A questo punto non resta che aggiungere l’indicazione della sitemap. Per farlo è sufficiente utilizzare la riga seguente:

Sitemap: http://www.example.com/sitemap.xml

Dove al posto dell’indirizzo basta inserire il percorso assoluto della propria mappa. Nel mio caso ad esempio, poiché ho creato la mappa soltanto per il blog contenuto nella sottocartella “/blog/”, questo sarebbe:

http://www.stambugia.com/blog/sitemap.xml

In conclusione ecco la parte relativa alla installazione di WordPress contenuta nel mio file robots.txt attuale:

User-agent: *
Disallow: /blog/wp-
Disallow: /blog/comments/feed/
Disallow: /blog/trackback/
Sitemap: http://www.stambugia.com/blog/sitemap.xml

Ho specificato nel percorso il fatto che le sottocartelle da escludere siano contenute nella cartella “/blog/” ma questo è in linea di massima inutile, a meno di non voler discriminare tra cartelle aventi nomi identici ma percorsi diversi.

Una volta inserite queste informazioni tutto ciò che è necessario fare è salvare il file con il nome robots.txt e caricarlo sul proprio sito. Attenzione che esso deve essere salvato alla radice del sito, non in sottocartelle, ad esempio quella in cui potreste avere installato il blog. Per controllare se tutto è andato per il verso giusto si possono utilizzare gli strumenti per webmaster di Google.

Per saperne di più:

Google Music

Cercando una discografia mi è appena apparso questo:

Risultato di una ricerca musicale con Google

Da quando Google ha introdotto questa novità? Sono sempre l’ultimo a sapere le cose…

(E comunque no, quella non era l’informazione che cercavo)