Comprendre les données présentées dans les statistiques

Les données/requêtes peuvent avoir été reçues par le proxy HTTP intégré à l'Olfeo ou par le moteur de filtrage (suivant votre type d'intégration), ou bien par les proxys FTP, RTSP, TCP ou SOCKS.

Types de requêtes

Les données présentées dans les statistiques sont des requêtes de filtrage d'URL : celles-ci correspondent à une règle de l'onglet Accès du moteur de règles ou à une politique de filtrage d'URLs. Chaque ressource demandée par une page produit une requête d'accès et est autorisée individuellement. Dans les données on peut donc voir des requêtes correspondant à des fichiers mais de type URL.

Interpréter les données

Les données enregistrées par l'Olfeo ne reflètent pas directement le comportement de l'utilisateur, mais celui du navigateur (et de la machine). En d'autres termes, beaucoup de hits ne correspondent pas à des clics réalisés par l'utilisateur.
  • Un hit sur un domaine ne signifie pas que l'utilisateur a visité lui-même ce domaine : souvent, une page HTML intègre des éléments hébergés sur des domaines différents de celui auquel appartient la page elle-même (vidéos, images hébergées sur un site dédié au stockage d'images, publicité, liens vers Facebook ou Twitter...). Les logs d'un utilisateur peuvent donc par exemple inclure des hits vers Facebook alors que l'utilisateur n'a jamais consulté de page Facebook.
  • Certaines pages web s'auto-rafraîchissent en permanence. Si un utilisateur laisse ce type de page ouverte dans son navigateur, l'Olfeo enregistrera de nombreux hits liés à cette page, même si l'utilisateur ne l'a en réalité consultée qu'une fois.
  • Il faut extraire le sens des données brutes, notamment en comparant les chiffres en nombre de hits et en volume de données. Exemple : un utilisateur regarde 1 vidéo d'une heure. Il n'a consulté qu'une page, mais le volume de données est élevé. Un autre utilisateur va passer 1 h à discuter sur un forum au format texte (très léger) : le volume de données sera faible mais le nombre de pages consultées élevé.
  • Il convient aussi de s'interroger si le surf constaté est pertinent au vu du poste de l'utilisateur. Au sein de votre organisation, tous les utilisateurs ne sont pas amenés à consulter les mêmes sites dans le cadre de leur travail. Toutes les catégories ne correspondront pas de la même façon à "site professionnel" et "site non professionnel".
  • Filtrez les données pour ne regarder par exemple que les usages personnels lors des plages de travail : inclure le surf hors des horaires de travail pourrait donner une image déformée de la réalité. Utilisez des filtres "exclure".