“Ma perché Nielsen mi odia” ?
In questi ultimi mesi sono almeno una decina gli editori ed amici che mi dicono “Io vorrei capire perchè nielsen ce l’ha proprio con me e perchè mi dimezza gli utenti unici…”
Amici tranquillizzatevi, è una cosa normale che accade a tutti, non c’è un accanimento verso un solo sito. Ogni sistema in realtà prende dati diversi ed in maniera diversa e quindi è perfettamente normale che i risultati siano differenti.
Vorrei contribuire a chiarire la spinosa faccenda analizzando i vari sistemi e spiegando a mio avviso il motivo delle discrepanze. Prendo in considerazione: Nielsen, Analytics, Alexa, Log del webserver, Adserver.
1. Nielsen
E basato su un panel di 15.000 persone, scelto con un criterio rappresentativo della popolazione italiana, a cui viene installato un software di rilevazione che traccia la navigazione. La navigazione di questi 15.000 viene quindi memorizzata e rappresenta poi la navigazione dei 20 milioni di users italiani. E’ un sistema molto preciso perchè riesce a nettare in maniera perfetta gli utenti unici intesi come % di share sul totale dei navigatori. E’ buono per comparare e per i trend. E’ un sistema meno preciso sul calcolo di pagine viste e su numeri assoluti, ed ovviamente piu i siti sono piccoli e piu diventa men preciso.
Per esempio: essendo il panel di 15.000 utenti, ogni 10 utenti nielsen valgono circa 15.000 utenti unici veri. E’ ovvio quindi che se Nielsen rileva per un sito un passaggio da 100.000 a 150.000 utenti unici in reatà nel suo panel si tratta di un aumento di 33 persone che navigano nel sito. Troppo poche per una reale valenza.
Ovvio quindi che sotto i 2-300k utenti unici il panel è meno affidabile e la percentuale di errore aumenta (a mio avviso oscilla almeno del 20%). Parliamo infatti di un pugno di persone. Sulle page views per le ragioni di cui sopra il sistema è ancora più approssimativo. Per questo le oscillazioni mensili di nielsen (anche +-30% su siti piccoli) non hanno valore e spesso non trovano riscontro su analytics o weblog.
2. Analytics
Come tutti sanno funziona mettendo un codice JS in ogni pagina. Tale codice manda i dati ai padroni di internet (ndr google) che registrano tutto e poi forniscono le statistiche. Il sistema spara anche dei cookie ai navigatori per tracciare gli utenti unici. E’ indubbiamente, insieme ai dati da webserver, uno dei sistemi piu precisi per calcolo di visite e di page views. Ma per gli utenti unici ?
Qui veniamo a spiegare la discrepanza che fa arrovellare i miei amici. Essendo il tracciamento degli utenti unici basato sui cookie si deve sapere che molti utenti :
- puliscono e cancellano i cookie
- ci sono browser che cancellano automaticamente i coockie
- ci sono utenti con i cookie bloccati
ComScore in questo articolo ci racconta come da uno studio negli USA almeno il 30% degli utenti nell’arco del mese cancellino i cookie. Cosa che comporta che i dati di analitics sono sovrastimati di almeno 2 volte.
Inoltre c’è da considerare altri questioni :
- utenti che hanno nel pc doppio browser
- utenti che hanno in casa doppio pc (fisso laptop)
E questo sovrastima sempre Analytics.
Infine c’è da considerare che Analytics da il dato di utenti che provengono da tutto il mondo mentre Nielsen ha un panel di utenti ESCLUSIVAMENTE italiani.
Tutte queste cose spiegano ampiamente perche il dato nielsen è la metà del dato di analytics. E la conclusione è che il dato buono (per gli utenti unici) almeno per i siti medio grandi è Nielsen.
3. Perche su Alexa tu sei il doppio di me ?
Alexa si basa su una toolbar che ti installi e ti traccia la navigazione, i dati vengono inviati a e da loro elaborati servono per creare le statistiche. Il sistema potrebbe essere interessante se la toolbar fosse di massa e se ci fosse una ponderazione a posteriori. In Italia è poco diffusa, funziona solo su un browser e quindi è di per se poco affidabile, ma è interessante per i trend di lungo periodo dove, il suo dato ha un valore di trendline che spesso trova conferme con gli altri sistemi.
Ma l’errore su cui cadono molti è quello del tempo. Alexa misura il dato di reach giornaliero……e non mensile. Questo cambia radicalmente la cosa.
Facciamo un esempio usando due estremi :
Community XZY : è una community (es. un forum) che ha 10.000 iscritti che, ogni giorno e sempre gli stessi, tutti i giorni accedono al sito. Non ha traffico da motore di ricerca perchè il tutto è dietro login.
Sito ricette ABC : è database di ricette che non ha traffico proprio e che vive con il 95% del traffico da google ricevendo 5.000 utenti al giorno.
Cosa succede quindi? La community XZY su Alexa sarà esattamente il DOPPIO del sito ABC, con due linee orizzontali parallele su un dato mese.
Ma gli stessi siti avranno su Nielsen un trattamento completamente diverso: la community xyz avrà 10.000 utenti unici al mese mentre il sito di ricette rischia di avere su base mensile 100.000 utenti unici, ed essere quindi 10 volte piu grande
Anche un blog che ha molto traffico ma composto solo dagli abbonati ai feed (sempre gli stessi tutti i giorni) su Nielsen vedrà ridimensionata la sua audience.
Questi sono casi che estremizzano, ma che rendono bene l’idea: una cosa sono le visite una cosa i veri utenti unici, ed una cosa è il conteggio mensile e un’altra il conteggio giornaliero.
Infatti le community molto fidelizzate sono molto molto piu “alte” in alexa, dove invece su nielsen sono avvantaggiati i siti che hanno molto traffico da google (piu utenza diversa e variabilità). Questo spiega anche perche su Alexa Facebook supera Myspace mentre su Nielsen Myspace è ancora il doppio di F.
4. Weblog
I dati da weblog sono tra quelli piu certi, almeno per la erogazione delle pagine viste, e possono essere utilizzati anche per un calcolo approssimato delle visiste e unici (io uso ancora il vecchio webalizer).
Molti non li sanno però usare perchè non prestano attenzione a togliere dal calcolo pagine di servizio, applicativi, frame, e simili. Inoltre con molti sottodomini diventa molto complicato capire i dati netti.
5. ADserver
Il sistema di cui nessuno parla, e che alla fine è l’unico che conta ed il più interessante, è ovviamente quello che determina il guadagno. Ovvero l’adserver.
Alla fine il numero di ads serviti è quello che conta, insieme al numero di utenti unici (ma unici per davvero). Gli ads serviti sono la inventory, il tuo magazzino, quello che alla fine determina il tuo guadagno (moltiplicato per cpm).
I dati dell’adserver sono SEMPRE piu bassi delle pagine viste di analytics o weblog. Anche qua c’è una spiegazione. I tag dell’adserver sono posizionati quasi sempre in fondo alla pagina. C’è una percentuale consistente di pagine (almeno il 30%) che non finisce di caricarsi perche l’utente clicca su un link della pagina prima del caricamento del banner. Oppure l’utente stoppa il caricamento dal bottone del browser.
Conclusioni
Per le ragioni sopra esposte tutti i sistemi sono da usare, e tutti sono importanti nei contesti di riferimento.
Per un calcolo della % della audience è Nielsen il sistema migliore, cosi come per le teste uniche. Per i fini editoriali e controllo andamento traffico (visite, page views e trends) è analytics combinato con logserver il dato migliore.
Per avere delle comparazioni “a gratisse” e su lungo periodo alexa va benissimo ma va sa saputo usare, comparando siti similari e considerando che è un dato giornaliero.
Per le valutazioni di business come il valore di un sito, i ricavi futuri, sono i dati dell’adserver che contano mixati con le teste uniche.
Ovviamente viviamo in un paese ed in un mercato molto poco serio, e quindi molti operatori non usano i dati nel contesto di riferimento, ma usano a prescindere i dati con le cifre piu grosse. Ci sono esempi incredibili di siti che si presentano con 1,5 milioni di utenti unici quando ne hanno 100k scarsi. Il mercato e gli operatori sono molto immaturi e nel caos molti se ne approfittano.
Io nel mio lavoro (ma mi rendo conto di essere l’unico) dò sempre le cifre piu basse (nielsen) e sempre la media degli ultimi mesi e non il mese migliore. Forse sono un coglione?





dicembre 6th, 2007 at 9:36 am
Mi stai dicendo che la classifica di Alexa che vede primeggiare HTML.it testa a testa con i grandi portali è inaffidabile? Ora chi lo dice a mia madre?
La tua mi sembra un’anlisi molto puntuale.
Aggiungo che i dati degli ADserver sono alterati dal sempre maggior numero di utenti, soprattutto “evoluti”, che utilizzano Adblock.
Inoltre, non tutti gli editori hanno accesso ai dati Nielsen, per cui sono “costretti” a fornire altri dati. Sarebbero di grande aiuto report pubblici accessibili a tutti. Ma la perenne agonia di Audiweb non fa ben sperare.
dicembre 6th, 2007 at 9:42 am
Adserver : è vero, gli Adblock falsano le stats. Io non ho mai capito però se il banner viene erogato ma non è visto dall’utente è se proprio il banner non viene erogato perche il software non fa eseguire il codice…
dicembre 6th, 2007 at 9:56 am
bella domanda, su Adblock… boh. Ora chiedo a Michele.
non parli, però dello Sceriffo Rosso, che di solito è il doppio di Nielsen e quindi è il dato che tutti ti danno in prima battuta. Poi li guardi storto, e chiedi: 3 milioni di UV su Nielsen? E loro: no, su Red Sheriff, su Nielsen sono 1.6
dicembre 6th, 2007 at 10:21 am
Se si usa poi Nielsen Site Census (l’Analytics di Nielsen per intenderci) i dati rilevati si posizionano tra Advserver e Analytics, ovvero 4 volte superiori al pannel dello stesso Nielsen, almeno nel nostro caso.
In ogni caso preferisco avere il 92% dei miei accessi composto da utenti fidelizzati che arrivano al mio sito digitando quotidianamente l’url nel browser e rinunciare al “mega” dato Nielsen che premia l’indicizzazione del progetto sui motori di ricerca. Va beh…a dire la verità vorrei entrambe le cose
Saluti e buone feste!
dicembre 6th, 2007 at 10:47 am
Per Adblock dipende dal software e in alcuni casi dalle scelte degli utenti.
E’ possibile che il software nasconda semplicemente l’immagine (o il file Flash) oppure blocchi completamente le richieste provenienti dal dominio. Nel primo caso, oltre al “danno” della mancata impression, si deprime il click rate delle impression reali.
Abbiamo installato l’estensione di Firefox. Creato una zona di prova sul nostro Adserver. Inibito il dominio ad.html.it (non fatelo a casa, potrebbe essere pericolo) e verificato che in effetti le impression del Firefox bloccato su quella zona non vengono conteggiate.
dicembre 6th, 2007 at 11:20 am
mah
quello che dici su analytics è vero per gli utenti mensili.
ma non è vero, o è poco vero, per gli utenti quotidiani. immagino siano solo una piccola parte quelli che quotidianamente tornano sul tuo sito dopo essersi cancellati i cookie (o si sono riconnessi con un altro pc o….).
dicembre 6th, 2007 at 11:21 am
noooohhhh!
hai i commenti in moderazione!
buhhhhhhh!
fischi dalla curva bloggerz.
dicembre 6th, 2007 at 3:19 pm
ciao a tutta la banda.
da quello che so, confermo che gli AdBlocker inibiscono la chiamata stessa agli adserver: quindi l’adv non viene deliverata, e di conseguenza nemmeno conteggiata.
ci mancherebbe altro che devo pagare per qualcosa che non viene vista! però, adesso che ci penso, questo accade regolarmente per il direct e-mailing…
dicembre 6th, 2007 at 4:59 pm
LOL, grande. L’email mktg è tornato dall’oltretomba, è pazzesco. E spesso con gli stessi identici database di quegli anni…
dicembre 6th, 2007 at 5:41 pm
per i pop under c’è un grosso problema
Ad server concessionaria conta il tentativo di erogazione e quindi il cliente paga
In realtà il pop under non è stato erogato
dicembre 6th, 2007 at 8:23 pm
@ Morbin : si il dato di analytics sugli utenti unici giornalieri è preciso (o piu preciso) diventa sempre meno preciso via via che passa il tempo. la discrepanza nasce sul confronto con Nielsen ma su base mensile.
@ Gm : i pop under ormai sono bloccati da tutti i browser. Ma i clienti li vogliono lo stesso, non c’è verso di farglielo capire.
@ Massimo : l’email marketing è cosi tornato di moda che ci sono editori (o meglio possessori di liste) che li danno anche a 4 concessionarie contemporaneamente. Cosi ci sono clienti che comprano lo stesso db anche 4 volte.
vabbè siamo in italia.
@Marco Lonardoni: avere il 90% degli utenti che ti cerancano digitando il tuo nome nel browser è una cosa di una potenza inaudita oggi giorno. Rimane il fatto che un sito che ha tanti utenti tutti i giorni, ma sempre gli stessi su base mensile, ha una utenza che vale un pò meno pubblicitariamente.
dicembre 6th, 2007 at 9:38 pm
Diciamo che passa il 20% dei pop under. Numero verosimile?
Sull’email mkt stendo un velo pietoso…gli stessi operatori si sono fregati a vicenda bruciando uno strumento che poteva esser meglio valorizzato
Meglio vendere 1 dem a 25 cpm che 10 a 2 (meglio per utente, per concessionaria, per possessore lista)
Pure mia figlia di 2 anni lo capisce…
E invece…
dicembre 11th, 2007 at 10:20 am
il rapporto 15.000 panelist rispetto ai 20 milioni di utenti non implica necessariamente un errore del 20%. Dipende da come è stato costruito il campione; Nielsen solitamente è molto seria nelle indagini di mercato. E’ chiaro che se si vuole rilevare con buona approssimazione il traffico di siti con “poche” visite giornaliere, il campione va costruito “ad hoc” per eventi rari e non mi pare questo lo scopo principale dell’indagine Nielsen
dicembre 11th, 2007 at 11:29 am
@ adrian : ti porto un esempio. Un sito che esiste da 7 anni, che ha stabilmente su nielsen 200-250k utenti unici ad ottobre su nielsen è crollato a 80.000. Quindi in pratica ridotto ad un terzo.
Ovviamente su dati analytics e su dati webserver NESSUN crollo ma anzi leggero aumento di visite e unici. Aumento di traffico da google e da motori del 15%.
Questo vuol dire che perlomeno per siti intorno ai 200k utenti il margine di errore è molto ampio. Nessuno dice che Nielsen non è seria, ma che sui siti sotto i 500k unici il margine di errore è MOLTO ampio e va fatta sempre la media su sei mesi. Altrimenti si prendono grossi abbagli. grazie ciao!
dicembre 11th, 2007 at 5:51 pm
grazie per la risposta. in effetti pensavo che i problemi maggiori si riscontrassero per i siti con pochi utenti. Il mio rilievo era di carattere metodologico, sono uno statistico e sono sensibile su argomenti come trovare i dati per dimensionare un fenomeno. Come hai rilevato, questo mercato è poco serio e di conseguenza ci si arrangia per ottenere una dimensione attendibile. Suggerimento: se fai la media, che è un indice che risente molto di fluttuazioni estreme, ti consiglio ti eliminare i mesi in cui giudichi/riconosci che i dati sono molto eterogenei con gli altri (come nell’esempio). Altrimenti è meglio usare la mediana che non ha questi inconvenienti.