Progetto e realizzazione di un sistema database di supporto per le analisi dei dati di log di Web Server


Nell'ambito di questo progetto, sono di particolare interesse i seguenti temi:

  1. Realizzazione della struttura del DataBase di supporto all'analisi dei dati di log di Web Server, con rappresentazione sia degli elementi standard/fissi e tracciati record comuni (ad esempio tracciati NCSA), sia degli elementi variabili (acquisizione tracciato record personalizzato).

  2. Analisi delle problematiche relative all'acquisizione dei dati relativi ai log dei Web Server (ad esempio, problematiche relative all'acquisizione di grandi volumi di dati e "ricombinazione" dei dati provenienti da più sorgenti).

  3. Creazione di viste e query di base per la selezione dei dati su criteri temporali, geografici e organizzativi.

  4. Ricostruzione di elementi caratteristici a partire dai dati di log: identificazione dei percorsi utente nel sito, identificazione delle sessioni utente, identificazione del traffico su elementi specifici, identificazione di clienti cumulativi (proxy), identificazione di clienti singoli ad alto traffico (e.g, spider dei motori di ricerca), identificazione di referenti e collegamenti con altri siti

  5. Analisi, sulla base dei dati di log, dei collegamenti con altri sistemi, ad esempio DNS: risoluzione di indirizzi IP in indirizzi logici, approssimazione geografica o organizzativa per IP non classificati dal DNS, rappresentazione geografica delle richieste (sistemi informativi geografici), sistemi di journaling e registrazione degli eventi collegati ai contenuti del server (collegamenti traffico/pubblicazioni su singoli contenuti)

  6. Realizzazione degli strumenti per la presentazione e reporting dei dati raccolti nei log dei Web Server, ad esempio reporting testuale, tabulare e grafico

  7. Analisi delle problematiche relative all'infrastruttura (elevata disponibilità dei dati, salvaguardia degli stessi).


Last Update: 9 March 2004