Segnali di vita

Non la farò troppo lunga. Il titolo del blog dice tutto e in questo periodo non ho avuto voglia di scrivere. E non ne ho molta nemmeno adesso, a dirla tutta. Grazie comunque ai miei tre lettori fedeli, mi spiace di avermi privato di un rimedio contro l’insonnia :-)

Ah, ho aggiornato WordPress all’ultima versione, alcuni plugin non erano ufficialmente compatibili ma spero non daranno problemi. Ho pure eliminato Bad Behaviour che in pratica bloccava l’accesso a commenti e altro a chiunque utilizzasse una connessione Telecom. Incluso il sottoscritto.

Non studio, non lavoro, non guardo la tv,
Non vado al cinema e non faccio sport.

Google reader perde pezzi

Da qualche giorno Google Reader ha deciso che non tutti i commenti ai post di mau valgon la pena di essere scaricati, e adesso a quanto pare nemmeno i miei. Tutti quelli inviati oggi sono stati bellamente ignorati, benché Feedburner li mostri correttamente. Mah.

Update: I miei sono arrivati tutti di botto, si vede che GR aspettava che rispondessi.

Creare mappa del sito e robots.txt per il proprio blog

Il corretto utilizzo della mappa del sito (sitemap) e del file robots.txt può aiutare ad aumentare il ranking del proprio blog sui motori di ricerca ed è in generale consigliabile farne uso in quanto migliorano l’indicizzazione della pagine. Benché questo articolo sia incentrato su WordPress i suggerimenti forniti possono essere adattati a qualsiasi piattaforma.

Creare la mappa del sito

La mappa del sito non è altro che un file in formato xml che mostra al motore di ricerca come questo è organizzato, in modo che possa essere indicizzato correttamente. Si tratta di una procedura introdotta da Google ma in rapida diffusione. Se in un primo momento il file doveva essere segnalato attivamente, di recente è stata introdotta la novità di utilizzare il file robots.txt per avvertire i programmi che in automatico visitano le pagine per conto del motore (gli spider). Creare la mappa del proprio blog è semplicissimo se si utilizza WordPress, è sufficiente utilizzare il plugin Google Sitemap Generator che si fa carico di tutta l’operazione.

Il file robots.txt

Il file robots.txt è un semplicissimo file di testo che contiene informazioni destinate ai motori di ricerca. In esso è possibile inserire istruzioni circa le pagine da controllare e quelle da evitare discriminando tra i vari motori di ricerca. È una buona idea farne uso perché in questo modo si può evitare che gli spider cerchino tra pagine che non debbono essere indicizzate e che archivino informazioni doppie. Il formato è molto semplice: ogni riga contiene un’istruzione, ogni gruppo di istruzioni è preceduto dall’indicazione del motore di ricerca al quale ci si rivolge, e le righe che iniziano con “#” sono commenti.

Un piccolo esempio:

User-agent: *
Disallow: /wp-
Disallow: /trackback/

La prima riga come abbiamo già detto indica a quali motori di ricerca sono rivolte le istruzioni che seguono: l’asterisco è una espressione regolare che significa “tutti”, quindi varrà tanto per Google quanto per Yahoo o Altavista. Le righe successive contengono invece le istruzioni vere e proprie, ossia indicano agli spider di non prendere in considerazione le cartelle il cui nome inizia con “/wp-” e la sottocartella “trackback”.

Quali cartelle inserire nel file robots.txt, dunque? Questo sta a chi gestisce il blog stabilirlo, in linea di massima se si utilizza WordPress è utile escludere le seguenti cartelle:

  • Le cartelle che servono per la gestione del blog (quelle che abbiamo visto iniziare con “wp-“);
  • La cartella dei trackback, in quanto farebbe indicizzare pagine vuote;
  • Il feed dei commenti, in quanto riporterebbe informazioni duplicate;

Il contenuto del file potrebbe quindi essere il seguente:

User-agent: *
Disallow: /wp-
Disallow: /comments/feed/
Disallow: /trackback/

A questo punto non resta che aggiungere l’indicazione della sitemap. Per farlo è sufficiente utilizzare la riga seguente:

Sitemap: http://www.example.com/sitemap.xml

Dove al posto dell’indirizzo basta inserire il percorso assoluto della propria mappa. Nel mio caso ad esempio, poiché ho creato la mappa soltanto per il blog contenuto nella sottocartella “/blog/”, questo sarebbe:

http://www.stambugia.com/blog/sitemap.xml

In conclusione ecco la parte relativa alla installazione di WordPress contenuta nel mio file robots.txt attuale:

User-agent: *
Disallow: /blog/wp-
Disallow: /blog/comments/feed/
Disallow: /blog/trackback/
Sitemap: http://www.stambugia.com/blog/sitemap.xml

Ho specificato nel percorso il fatto che le sottocartelle da escludere siano contenute nella cartella “/blog/” ma questo è in linea di massima inutile, a meno di non voler discriminare tra cartelle aventi nomi identici ma percorsi diversi.

Una volta inserite queste informazioni tutto ciò che è necessario fare è salvare il file con il nome robots.txt e caricarlo sul proprio sito. Attenzione che esso deve essere salvato alla radice del sito, non in sottocartelle, ad esempio quella in cui potreste avere installato il blog. Per controllare se tutto è andato per il verso giusto si possono utilizzare gli strumenti per webmaster di Google.

Per saperne di più:

Bah.

Il plugin per last.fm non va. L’opzione per importare i feed non va (e ovviamente l’ho scoperto dopo aver cancellato i vecchi link). Il login al pannello di controllo del sito non va. Vado a vedermi il finale di Lost, che è meglio.

NoFollow e commenti

Interessante lettura sul perché l’attributo NoFollow è inutile, in particolare nei commenti in un blog. Visto che attualmente mi trova d’accordo ho già provveduto, grazie al plugin per WordPress DoFollow (interessante anche quanto scrive l’autore del plugin sull’argomento). Tanto con BadBehaviour e SpamKarma il problema spam è attualmente irrilevante.

Questione di feeding

WordPress e FeedBurner mi stanno facendo ammattire: non capisco perché i miei feed non risultino aggiornati all’istante. Ho chiesto sul forum di FeedBurner e mi è stato risposto che forse dipende dal codice di stato HTTP, il 307 pare non sia digerito bene da tutti e sarebbe meglio usare il 302. Ok, mi sono detto, modifichiamolo, che sarà mai? Dopo tentativi su tentativi ho scoperto che la modifica non andava fatta né tramite il cPanel del mio hosting, né tramite l’.htaccess, ma modificando il plugin di WordPress. Eppure anche adesso che l’ho modificato pare che non sia cambiato nulla. Se si aggiunge a tutte le sfighe che ho avuto recentemente con internet ed informatica inizio a credere che qualcuno me l’abbia tirata. Bah.

Google Reader e compagnia

Sto utilizzando da qualche giorno Google Reader per seguire i miei feed. Rispetto a Bloglines mi sembra un gradino superiore, benché non arrivi ancora ai livelli di NewsAlloy. Se solo quest’ultimo non si perdesse i post per strada sarebbe di gran lunga il migliore: ottima interfaccia, gestione perfetta delle codifiche, leggero, pieno di opzioni (per dire, col lettore di Google non riesco nemmeno a trovare l’opzione per decidere quante news alla volta visualizzare).

Domanda: perché non esiste alcun lettore online di news (intendo le news di Usenet), buono come questi? Possibile che nessuno abbia ancora pensato di crearne uno sfruttando le potenzialità di AJAX?

Work in progress

Mammamea, ‘sto WordPress mi sta facendo smadonnare come non mai. Nell’ordine:

  • Il plugin per FeedBurner pare che duplichi la lista dei tag. Contattato l’autore, ancora non ha risposto. Mah. (Ora pare funzionare, forse si trattava di una opzione di Ultimate Tag Warrior. Forse.)
  • Gravatars2 mi pare non mostri decentemente gli avatar nei commenti ma ancora aspetto che il mio avatar venga registrato per vedere e, eventualmente, scrivere nella pagina dei commenti del plugin. (Update: a quanto pare gli avatar vengono mostrati, solo che: 1) non riesco ad impostare quello locale, 2) quando viene mostrato l’avatar di default non c’è il link al sito dell’autore)
  • C’è una marea di plugin che non ho idea se vadano installati o meno per migliorare le performance dell’ambaradan.

E a parte tutto questo, ancora devo pensare ad una favicon decente. Il mio logo ci starebbe da schifo rimpicciolito così, senza considerare che non starebbe bene nella grafica del sito. (Update: Ok habemus favicon, anche se sul decente ci sarebbe da discutere… ma perché non mi compare nel feed di Newsalloy? Mistero della fede…)
Ah sì, ancora non sono convinto al 100% del template (e difatti l’ho cambiato, vediamo se a questo mi abituo…).

Credo di non aver dimenticato nulla.