Cercare mp3 ed altri tipi di file con Google

A volte si cerca un pezzo mp3 e non si ha la voglia o la possibilità di utilizzare un programma p2p, ecco quindi un vecchio trucco per raffinare la ricerca con Google, spulciando tra le cartelle web il cui contenuto è visibile. Basta utilizzare la seguente sintassi:

-inurl:(htm|html|php) intitle:"index of" +"last modified" +"parent directory" +description +size +mp3 "the smiths"

Se vogliamo includere anche i file di tipo wma:
-inurl:(htm|html|php) intitle:"index of" +"last modified" +"parent directory" +description +size +(mp3|wma) "the smiths"

Se vogliamo cercare pdf basterà modificare l’estensione presente nella stringa di ricerca, idem per i video (avi, mpg, mpeg…), etc.

Modificare il nome di una cartella in Google Reader

Google Reader non offre la possibilità di modificare direttamente il nome di una cartella. È però possibile arrivare allo stesso risultato attraverso una breve serie di passaggi. Vediamo come fare:

  1. Cliccate su Settings per aprire la finestra delle impostazioni;
  2. Nella finestrella a destra per filtrare i risultati inserite il nome della cartella che volete modificare, Google Reader vi mostrerà soltanto i blog che appartengono a tale categoria;
  3. Cliccate su Select all (numero a piacere) subscriptions;
  4. Cliccate nelle opzioni di un feed su Change folders…, selezionate New Folder…, e create la nuova cartella che volete sostituisca la vecchia;
  5. Cliccate in alto su More actions… e scegliete, sotto Add Tag… il nome della cartella che avete appena creato. Quindi fate lo stesso per l’opzione Remove tag…, scegliendo la cartella che volete eliminare.

In questo modo Google Reader eliminerà la vecchia cartella e creerà la nuova. Un po’ più laborioso rispetto alla semplice possibilità di cambiarne il nome ma alla fin fine il risultato è lo stesso.

Basta inviti

Per favore, davvero, basta. Capisco che teniate alla mia presenza, che i giocattoli nuovi siano i più belli, che sia tutto molto social, web duepuntozero, aggregazione, amore, dire-fare-baciare-lettera-e-testamento. Però mo’ basta con ‘sti cazzo di inviti su aNobii. Ma davvero c’è bisogno del gruppo sul personaggio migliore? Eppoi che si inventerà? Quello sulla suppellettile, vista in un libro, più interessante? Sulla preposizione articolata più amata? Sul codice a barre più eccitante?
Pietà, mi arrendo.

Opera è meglio di Firefox

E basta. Non è possibile che per avere le stesse funzionalità di Opera si debba fare incetta di estensioni. Non è possibile che non siano integrate funzionalità tanto elementari come la richiesta della master password ad ogni login, la gestione dei tab e quella dei movimenti del mouse, o addirittura la possibilità di modificare le scorciatoie da tastiera. Non è possibile che nel menù contestuale non ci sia l’opzione “apri il link in questo tab”.

Mi chiedo come abbia fatto un prodotto tanto scarso ad avere tanto successo. D’accordo, è open source, ma poi? È lento e pesante, anche se ha mille estensioni quelle davvero utili sono una manciata, ed oltretutto la loro aggiunta non fa che appesantire il programma. Senza contare che molte “novità” di Firefox in Opera erano presenti da tempo, come la navigazione per tab.

Eppure in questo momento mi trovo costretto ad usare Firefox perché a causa di un bug in WordPress i post scritti con Opera non sono XHTML valido, e a parte questo capita di trovare siti ottimizzati per Firefox, si vedano bookmarklet che con Opera non funzionano e quisquilie varie. Giusto per farla breve:

Le cose che Firefox ha e mancano in Opera:

  • Gli strumenti per sviluppatori web, in particolar modo Firebug e Web Developer: Opera ha una barra apposita ed è possibile utilizzare Firebug inserendo uno script sulla pagina web ma non è la stessa cosa (attraverso gli strumenti Opera Developer Console e Dom Snapshot, e la Web Developer Toolbar & Menu non credo manchi davvero nulla, anzi c’è anche troppa roba);
  • Tiny Menu: per avere tutti i menù in un’unica voce;
  • NoScript e CookieSafe: Opera ha ottime opzioni per cookie e javascript, sicuramente al livello di quelle per Firefox, quello che manca è la possibilità di gestirle cliccando su un semplice pulsante;

Le cose che Opera ha, e Firefox no:

  • Un’interfaccia pulita, coerente, veloce e leggera;
  • Una gestione delle password ottima, grazie alla bacchetta magica e alla master password (no, nemmeno con le estensioni Firefox arriva a quei risultati);
  • La possibilità di cliccare su “Indietro” e avere la pagina che si è appena lasciati senza che questa si ricarichi. Opera la pesca dalla cache ed è subito lì;
  • Ottime scorciatoie da tastiera che possono essere modificate a piacimento;
  • La possibilità di andare alla pagina, o immagine, successiva di una serie, semplicemente andando avanti attraverso barra spaziatrice, il movimento del mouse, etc;
  • Una funzione Speed Dial fatta come si deve (no, quella che si ottiene con l’estensione di Firefox non lo è, per chi è abituato ad Opera);
  • Una gestione dei tab pressoché perfetta;
  • Varie ed eventuali (di tantissime cose ci si rende conto solo nell’uso comune);

È inutile, alla fin fine Firefox non mi convincerà mai, e dover essere costretto ad utilizzarlo solo perché sta diventando il nuovo standard nel web 2.0, forse più di quanto lo fosse IE nel web 1.0, è frustrante. L’unica maniera che ha Opera per ottenere il successo che merita è divenire open source, ma questo non accadrà probabilmente mai, ergo dovrò continuare a smoccolare anche negli anni a venire.

Creare mappa del sito e robots.txt per il proprio blog

Il corretto utilizzo della mappa del sito (sitemap) e del file robots.txt può aiutare ad aumentare il ranking del proprio blog sui motori di ricerca ed è in generale consigliabile farne uso in quanto migliorano l’indicizzazione della pagine. Benché questo articolo sia incentrato su WordPress i suggerimenti forniti possono essere adattati a qualsiasi piattaforma.

Creare la mappa del sito

La mappa del sito non è altro che un file in formato xml che mostra al motore di ricerca come questo è organizzato, in modo che possa essere indicizzato correttamente. Si tratta di una procedura introdotta da Google ma in rapida diffusione. Se in un primo momento il file doveva essere segnalato attivamente, di recente è stata introdotta la novità di utilizzare il file robots.txt per avvertire i programmi che in automatico visitano le pagine per conto del motore (gli spider). Creare la mappa del proprio blog è semplicissimo se si utilizza WordPress, è sufficiente utilizzare il plugin Google Sitemap Generator che si fa carico di tutta l’operazione.

Il file robots.txt

Il file robots.txt è un semplicissimo file di testo che contiene informazioni destinate ai motori di ricerca. In esso è possibile inserire istruzioni circa le pagine da controllare e quelle da evitare discriminando tra i vari motori di ricerca. È una buona idea farne uso perché in questo modo si può evitare che gli spider cerchino tra pagine che non debbono essere indicizzate e che archivino informazioni doppie. Il formato è molto semplice: ogni riga contiene un’istruzione, ogni gruppo di istruzioni è preceduto dall’indicazione del motore di ricerca al quale ci si rivolge, e le righe che iniziano con “#” sono commenti.

Un piccolo esempio:

User-agent: *
Disallow: /wp-
Disallow: /trackback/

La prima riga come abbiamo già detto indica a quali motori di ricerca sono rivolte le istruzioni che seguono: l’asterisco è una espressione regolare che significa “tutti”, quindi varrà tanto per Google quanto per Yahoo o Altavista. Le righe successive contengono invece le istruzioni vere e proprie, ossia indicano agli spider di non prendere in considerazione le cartelle il cui nome inizia con “/wp-” e la sottocartella “trackback”.

Quali cartelle inserire nel file robots.txt, dunque? Questo sta a chi gestisce il blog stabilirlo, in linea di massima se si utilizza WordPress è utile escludere le seguenti cartelle:

  • Le cartelle che servono per la gestione del blog (quelle che abbiamo visto iniziare con “wp-“);
  • La cartella dei trackback, in quanto farebbe indicizzare pagine vuote;
  • Il feed dei commenti, in quanto riporterebbe informazioni duplicate;

Il contenuto del file potrebbe quindi essere il seguente:

User-agent: *
Disallow: /wp-
Disallow: /comments/feed/
Disallow: /trackback/

A questo punto non resta che aggiungere l’indicazione della sitemap. Per farlo è sufficiente utilizzare la riga seguente:

Sitemap: http://www.example.com/sitemap.xml

Dove al posto dell’indirizzo basta inserire il percorso assoluto della propria mappa. Nel mio caso ad esempio, poiché ho creato la mappa soltanto per il blog contenuto nella sottocartella “/blog/”, questo sarebbe:

http://www.stambugia.com/blog/sitemap.xml

In conclusione ecco la parte relativa alla installazione di WordPress contenuta nel mio file robots.txt attuale:

User-agent: *
Disallow: /blog/wp-
Disallow: /blog/comments/feed/
Disallow: /blog/trackback/
Sitemap: http://www.stambugia.com/blog/sitemap.xml

Ho specificato nel percorso il fatto che le sottocartelle da escludere siano contenute nella cartella “/blog/” ma questo è in linea di massima inutile, a meno di non voler discriminare tra cartelle aventi nomi identici ma percorsi diversi.

Una volta inserite queste informazioni tutto ciò che è necessario fare è salvare il file con il nome robots.txt e caricarlo sul proprio sito. Attenzione che esso deve essere salvato alla radice del sito, non in sottocartelle, ad esempio quella in cui potreste avere installato il blog. Per controllare se tutto è andato per il verso giusto si possono utilizzare gli strumenti per webmaster di Google.

Per saperne di più:

I link del fine settimana

  • letturalenta ha scritto un bel post su preti pedofili e documentario della BBC (via ipazia);
  • Se siete interessati a quei giochini che “allenano il cervello”, da oggi c’è lumosity; sono dubbioso sulla reale efficacia di questi piccoli esercizi ma di certo male non fanno, eppoi c’è la testimonianza in home page del tipo che ora riesce ad ammazzare le mosche con molta più precisione, mica pizza e fichi. Se i curriculum di chi è dietro al progetto sono reali, tanto di cappello. Ah, nel test preliminare ho fatto un misero 117 :-)
  • Giuro, esiste anche il club mondiale del gioco della morra cinese. E ha pure un sito!

aNobii, il last.fm dei libri

Era parecchio che cercavo un sito simile, avevo persino pensato che ad averne le capacità non sarebbe stato male crearlo (anche se in un primo momento avevo pensato a qualcosa di più simile a debaser.it), e grazie a mau finalmente l’ho trovato. aNobii è il corrispettivo di last.fm per quanto riguarda i libri: si inseriscono i libri letti, o che si stanno leggendo, si usano i tag per catalogarli, si lasciano commenti, e si guarda chi ha gusti simili ai propri, e così via. Tutto molto web 2.0 e social web, insomma, ma fatto nel modo giusto per essere davvero funzionale.

Rispetto a last.fm il sito è ancora abbastanza spartano e l’interfaccia, almeno ad una mia prima impressione, più scomoda. Mancano ancora un po’ di cosette ed alcuni tocchi di classe ma il sito è tutto sommato giovane e sono certo che crescerà. Il vero problema è che i dati sui libri vanno aggiunti a mano e sistemati e questo porta via parecchio tempo, soprattutto a chi come me è molto precisino in cose come questa e si ritrova a cercare in rete l’IBSN per libri vecchi di qualche decennio, poi le copertine per tali edizioni, quindi si mette ad inserire tutti i tag… insomma, invece di leggere si passa il tempo a sistemare la propria libreria :-)

NoFollow e commenti

Interessante lettura sul perché l’attributo NoFollow è inutile, in particolare nei commenti in un blog. Visto che attualmente mi trova d’accordo ho già provveduto, grazie al plugin per WordPress DoFollow (interessante anche quanto scrive l’autore del plugin sull’argomento). Tanto con BadBehaviour e SpamKarma il problema spam è attualmente irrilevante.