I- Expert Data Miner - Initiation

 

Supposons que vous utilisiez Expert Data Miner pour la première fois; auparavant vous êtes allé chercher vos logs sur le serveur de pages. La première étape est d'ouvrir vos fichiers log à partir du projet par défaut:

 

Si vous possédez assez de mémoire, il est préférable d'ouvrir plusieurs fichiers log à la fois. Utilisez la touche 'shift' en même temps que la souris pour cela:

 

La prochaine étape est d'analyser vos fichiers log. Mais puisque vous utilisez le système pour la première fois, on vous demande votre nom de domaine. Ce nom de domaine sera utilisé à l'intérieur du projet défaut. Si vous avez plusieurs sites à gérer vous devrez créer au moins un projet par site plutôt que de vous baser sur le projet par défaut.

 

Le nom fictif du domaine tapé est 'shonxxx.com', pas 'www.shonxxx.com' ou 'http://www.shonxxx.com'. Taper un nom inadéquat aurait des conséquences sur la validité des données du rapport Reférents Externes ainsi que sur l'arborescence des pages demandées.

La page par défaut est celle qui est appelée lorsqu'un utilisteur tape votre nom de domaine sans nommer de fichier HTML ou ASP. Souvent cette page est index.html ou encore default.asp sur un serveur IIS. Qu'un utilisateur tape http://mondomaine.com/ ou encore http://mondomaine.com/index.html la même page est affichée. Donc EDM fusionnera toutes les requêtes de ce type en une seule requête sur "/", le répertoire racine pour comptabiliser correctement les hits sur cette page.

Les suffixes de requêtes sont les lettres qui suivent le '?' dans une page comme http://mondomaine.com/page.php?id=77&sess=a65343hb9&groupe=999 . Plusieurs pages asp, perl, php, etc... affichent un contenu différent qui dépend du suffixe fourni. Il est donc logique de considérer ces pages commes différentes; par contre certains suffixes peuvent être uniques à chaque utilisateur (comme ici la variable 'sess'). Si ces suffixes sont pris en compte, il n'y aura qu'un seul hit pour chacunes des variantes de page.php !!! Ici on a intérêt à éliminer sélectivement la variable 'sess' et son contenu. En choisissant cette option un popup vous permet de choisir les variables de requêtes et même les pages pour lesquelles la condition s'applique.

 

  Le deuxième bouton sous l'option de menu 'Démarrer' est alors utilisé. Une boite de dialogue affiche alors l'état de l'analyse. Après quelques secondes en général le tout est terminé.

Choisissons la section Données Générale - Trafic. L'activité journalière est affichée:

 

Le % de personnes qui ont visité la page racine est une colonne définie par l'utilisateur. Pour voir comment ceci est fait, je clique sur le bouton avec un marteau et un tournevis, juste à côté de l'ampoule. L'écran de configuration suivant apparait:

 

Ici vous pouvez configurer l'apparence des écrans ou encore les rapports HTML, si vous décidez plus tard d'exporter vers des fichiers HTML. Il y a un écran de configuration disponible pour chaque rapport. La boite combo Trié Par: définit la colonne utilisée pour décider de l'ordre d'affichage des diverses rangées. Ce tri s'applique aux rapports HTML et au tri par défaut lorsque vous demandez ce rapport à l'écran. Autrement vous pouvez toujours changer le tri par défaut en cliquant sur l'entête d'une colonne.

La colonne '% qui visitent le répert. racine' peut être sélectionnée et supprimée. On peut aussi ajouter de nouvelles colonnes à partir du bassin des colonnes existantes qui sont disponibles. Mais on peut aussi créer de nouvelles colonnes dans ce bassin. On le fait en cliquant sur le bouton Définir Action. Si vous cliquez sur ce bouton, voici l'écran obtenu:

 

Si vous voulez ajouter une nouvelle colonne dans votre rapport, vous sélectionnez un type d'action dans la boite combo appropriée. L'action peut être: un visiteur qui demande une page/un fichier quelconque, un visiteur qui demande un fichier dans un répertoire, un visiteur qui s'enregistre, un visiteur qui provient d'une certaine zone, un visiteur qui demande plus ou moins que 'x'' pages, ou encore plus ou moins que 'x' kb. Une autre action permet aussi de savoir le pourcentage des nouveaux visiteurs qui reviennent avant 'X' jours.

 

Si vous voulez savoir quel pourcentage de vos visiteurs demandent la page http://mydomain.com/sub1/mypage.html lors d'une session ou visite, vous sélectionnez 'Egaler une Page/Fichier'. On peut aussi choisir un fichier téléchareable (fichier mp3, zip, etc...). Vous devez ensuite taper dans la grande boite cible:

/sub1/mypage.html.

Vous devez aussi définir l'entête de colonne est cliquer sur le bouton Mettre à Jour lorsque vous avez terminé avant d'appuyer sur Sauvegarder. La description longue (tool tip) est optionelle; puisque vous êtes limités à 22 caractères pour une entête de colonne il se peut que vous trouviez utile d'avoir une description plus longue lorsque vous promener votre souris au-dessus de l'entête de colonne dans vos rapports un peu plus tard (surout si vous définissez beaucoup d'actions). Disons cependant que vous avez changé d'idée et que vous ne voulez pas ajouter cette colonne maintenant mais seulement de visualiser le contenu d'une action définie auparavant. Sélectionnez la première ligne dans la liste et cliquez sur le bouton Modifier. Vous obtiendrez ceci:

 

La cible '/' est le dernier caractère après votre nom de domaine dans un exemple comme: http://www.mydomain.com/ . C'est la page racine. Lorsque EDM analyse votre log, il transforme l'URL http://www.mydomain.com/index.html en son équivalent http://www.mydomain.com/ , c'est à dire '/' puisque vous obtenez la même page en utilisant ces deux premiers URLs dans votre navigateur. Pour les logs de serveurs IIS, '/default.asp' et '/default.aspx' sont aussi transformés en '/' pour la même raison. Le but est de fusionner des requêtes apparament différentes dans vos logs mais qui concernent la même page afin d'obtenir des statistiques plus adéquates concernant les hits. La même opération se fait dans les sous-répertoires. Il n'y a aucune raison de modifier ceci pour le moment, cliquons donc sur le bouton Annuler. L'action qui sera crée dans le bassin globale sera Les visiteurs provenant du Canada, donc le choix 'Provenir d'une Zone' est pris dans la boite combo Type d'Action.

 

Le bouton Mettre à Jour est alors appuyé, puis le bouton Sauvegarder. Nous sommes de retour dans l'écran précédent mais il faut aussi ajouter cette colonne quelque part dans le rapport; pour le moment celle-ci ne se trouve que dans le bassin global et n'est attachée à aucun rapport. Sélectionnons la colonne Visites et appuyons sur le bouton Insérer Colonne ensuite. La colonne est donc ajoutée après la colonne Visites.

 

Une fois ce changement effectué, relancez l'analyse de votre log en cliquant sur le même bouton qu'auparavant et attendez que tout soit fini.

 

L'algorithme essaye parfois d'ajuster l'entête de colonne sur deux lignes si la phrase est trop longue, ici on aurait obtenu de meilleurs résultats en indiquant 'pourcentage de canadiens' plutôt que '% de canadiens' puisque la largeur effective serait réduite. C'est ce qui s'est produit pour la dernière colonne, la largeur du descripteur cadre bien alors que pour l'avant dernière colonne le descripteur devrait idéalement être changé pour quelque chose d'un peu plus court ou même quelque chose d'un peu plus long afin de forcer une brisure sur deux lignes à partir du milieu de la phrase.

Des actions comme celle-ci peuvent être introduites ou supprimées dans les 3/4 des rapports environ. Vous pouvez utiliser votre imagination et déterminer quelle combinaison vous serait utile. Si vous travaillez dans un département de marketing particulièrement vous devriez en tirer plusieurs conclusions intéressantes. Disons maintenant qu'ont veuille jetter un coup d'oeil aux phrases tapées sur des moteurs de recherche.

Prochaine section: Chemin de Navigation

Table des Matières du Tutorial

Retourner à la page d'accueuil