KOMMANDOInternetMatérielsPrestationsNEXTSTEP·OPENSTEPFormationsPartenairesRéférences



[Banniere]

Mythes et réalités sur la fréquentation des sites Web.

Mythes
Réalités

[Retour au titre]Mythes
Un grand nombre, pour ne pas dire la majorité, des sociétés de service assurant l'hébergement de sites Web pour leurs clients mettent en avant la capacité à fournir à ces derniers un rapport détaillé de la fréquentation des sites en question, sous une forme riche de tableaux d'informations très techniques, de graphiques en couleurs et autres artifices.
On lira ici que 5 328 « personnes » ont visité votre serveur, et là que 47 % d'entre elles sont d'origine nord-américaine.
Certaines sociétés soi-disant spécialisées dans le calcul d'audience vont même jusqu'à proposer des outils dédiés pour des sommes de plusieurs dizaines de milliers de francs.

Voyons maintenant plusieurs raisons pour lesquelles ces chiffres sont obligatoirement biaisés, quelques soient les efforts que peuvent déployer les prestataires.

Le rafraîchissement
Il s'agît tout simplement de la possibilité qui est offerte dans la majorité des logiciels de navigation (les « butineurs ») de solliciter une nouvelle fois le serveur pour le document en cours de consultation, en cas, par exemple, d'une erreur de transmission qui aurait altérée le contenu de la page.
L'effet le plus visible de l'effet de bord provoqué par cette anodine action se constate sur les pages contenant un compteur possédant un comportement primaire. Vous verrez alors le compteur augmenter à chaque appui sur ce bouton.
Pensez-vous que le nombre de visites qu'il est censé dénombrer a vraiment progressé à ce point ?
Étudiez notre petit exemple à ce sujet.
L'interruption en cours de téléchargement d'une page
La navigation a longtemps été assimilée à la pratique du zapping télévisé. C'est toujours d'actualité et les documents sollicités dont même les premières lignes ne sont pas lues sont monnaie courante.
Croyez-vous pour autant qu'un serveur Web peut vous le dire ? Non. Il enregistrera simplement que le document a été demandé et qu'il a été transmis.

Plus « technique »

Les proxies
Sous ce terme barbare se cachent en fait deux notions très différentes qui toutes deux influent directement et dans des proportions non négligeables sur les rapports de fréquentation que délivrent les serveurs Web.
 
Les premiers et les plus connus du grand public depuis leur emploi croissant ces derniers mois chez les fournisseurs d'accès Internet (les FAI) sont en fait des zones mémoires spécialisées (des caches, des tampons, des buffers comme peuvent les appeler les uns et les autres) qui ont pour but principal de minimiser l'usage de la précieuse « bande passante », ressource Ô combien coûteuse (prosternons-nous devant le dictat de France Télécom) et, corollaire, d'améliorer parfois considérablement les temps de réponse offert aux abonnés.
Ils permettent aussi de réduire de manière importante les requêtes émises à l'attention des serveurs très connus et par conséquent très sollicités, surtout lors de la sortie d'un nouveau programme très attendu disponible en téléchargement. (Un exemple représentatif étant la dernière version d'Acrobat Reader de la société Adobe qui a enregistrée plusieurs centaines milliers de connexions dans les semaines qui ont suivies l'annonce de sa disponibilité.)
Il est étonnant que cette pratique ne soit apparue que très récemment tant le principe en est simple et le gain immédiat.
Puisqu'une majorité d'Internautes passent par les services de FAI spécialisés et par conséquent par leurs machines, il suffit de stocker sur ces ordinateurs la plus grande quantité possible de documents qu'ils sollicitent sur les serveurs du monde entier en se basant sur l'hypothèse qu'un bon nombre de ces fichiers seront probablement et rapidement sollicités par les autres abonnés.
Si le document présent sur les machines du FAI est toujours d'actualité lors de la requête suivante provenant de l'un de ces abonnés, la version présente sur ses mémoires de masse sera envoyée à l'utilisateur plutôt que d'aller chercher à nouveau l'original à la source avec pour conséquence deux aspects essentiels :
1 - un gain pour les trois acteurs impliqués dans cette communication. L'ordinateur du serveur se voit épargné d'un travail qu'il peut ainsi faire profiter un autre utilisateur. Le FAI économise ses connexions vers « l'extérieur » et gagne en crédit auprès de son client. Enfin le client qui peut ainsi réduire ses temps de communication et par conséquent le montant de sa facture téléphonique.
2 - Le serveur ne peut plus espérer comptabiliser systématiquement toutes les nouvelles connexions.
De plus, serveur comme FAI sont susceptibles de faire l'un et l'autre, suivant leurs contrats respectifs, une économie sur leurs frais de communications, si ils sont facturés au volume plutôt qu'au forfait ou s'ils dépassent le volume de données transférées prévu par le forfait.
Cette idée s'appuie sur les probabilités et sur le nombre d'abonnés que peut compter chaque FAI.
Il est évident que l'évolution que connaît le milieu Internet (augmentation du nombre d'utilisateurs et fusion des plus importants FAI) ne peut que favoriser cette pratique pour le plus grand confort de tous.
 
Les seconds désignent des programmes particuliers chargés de faire de la translation d'adresses IP (dans le jargon des initiés, il mettent en oeuvre le protocole NAT, « Network Address Translation »).
Une brève explication vous permettra de comprendre pour quelle raison les FAI ne tiennent pas trop à ce que ce protocole soit connu de leurs clients.
En règle générale, l'abonnement type auprès d'un opérateur prévoit le raccordement ponctuel (notion de dialup-IP par opposition à une liaison permanente appelée full-IP) d'un ordinateur à Internet par le biais des machines du FAI. La procédure de connexion implique entre autres l'attribution d'une adresse IP « prêtée » par l'opérateur durant la période de connexion et qui identifiera votre ordinateur de manière unique au milieu des centaines de milliers, voire millions, d'autres ordinateurs branchés sur Internet au même moment.
Pourquoi ne pas donner à chaque abonné une adresse IP unique une fois pour toute plutôt que de lui en attribuer une potentiellement différente à chacune de ses connexions ?
 
La réponse tient en un mot : saturation.
 
Les choix techniques retenus il y a quelques années et la distribution parfois un peu légère des adresses IP incitent désormais les organismes (RIPE pour l'Europe) à modérer et surtout à mieux contrôler les demandes des prestataires ou des compagnies importantes (IBM ou HP par exemple).
En particulier dans le cas des FAI, pourquoi leur accorder autant d'adresses IP différentes que d'abonnés alors que la seule chose qui importe techniquement est seulement d'avoir autant d'adresses distinctes que le nombre de personnes pouvant se connecter à un instant donné, soit pour schématiser, autant d'adresses que de modems disponibles. Nombre qui, même s'il est important, est en règle générale inférieur au nombre des abonnés.
Mais tout cela nous éloigne de la technique qui nous intéresse dans le présent propos.
Donc, le principe est qu'à chacune de vos connexions, une (et une seule) adresse IP vous est dynamiquement communiquée par votre FAI, n'autorisant que l'ordinateur sur lequel est branché votre modem à dialoguer sur Internet. Si vous désirez que plusieurs ordinateurs accèdent simultanément au réseau des réseaux, que ce soit pour une utilisation domestique ou professionnelle, la première idée qui vient à l'esprit est de multiplier d'autant le nombre d'abonnements auprès de votre FAI et aussi le nombre de modems, et enfin pour être logique, le nombre de lignes téléphoniques. Cela devient rapidement ruineux, y compris pour une entreprise. Non, la solution est ailleurs, qui ne requiert pas non plus la location d'une ligne louée à peine moins coûteuse. Comme vous l'aurez deviné, cette solution se nomme NAT. Le principe est de partage une adresse IP entre plusieurs postes pour les communications avec « l'extérieur ». Ainsi, un seul abonnement autorise la connexion de plusieurs machines en même temps. Ajoutez-y un système, matériel ou logiciel, de partage de la ressource physique que constitue le modem entre ces différentes machines et vous obtenez un moyen efficace de contourner la limitation initiale.
Certains fabricants ont bien compris cette ouverture et proposent depuis plusieurs mois des produits qui répondent aux deux contraintes à la fois, ce sont en particulier certains modèles de routeurs Ethernet/RNIS. Branchés directement sur le réseau local, ils sont ainsi visibles de tous les ordinateurs qui y sont aussi raccordés, sans intermédiaire. Et quand le routeur intègre ce protocole NAT (appelé SUA chez ZyXEL), le partage d'un accès Internet peut-être configuré en moins d'un quart d'heure, sans aucune révision de votre abonnement traditionnel.
Dans le cas d'un accès par le câble comme celui que fournit (bien mal) la société Cybercable à ses abonnés, la liaison étant permanente, pendant très longtemps, les adresses IP ont été associées à chaque modem-câble en attendant la mise en place d'un serveur DHCP pour l'attribution dynamique d'adresse aux clients ayant souscrit un abonnement de type « Résidentiel ».
Sachez enfin que, à priori, l'utilisation du protocole NAT n'est pas détectable.
Si vous désirez approfondir le sujet, ou passer directement à l'action, nous vous recommandons les sites suivants :
- le document « RFC » qui s'y rapporte.
- Une source tierce.
- Et quelques programmes, principalement pour Windows, WinProxy, Wingate, avec tout de même de quoi satisfaire les accros d'Unix grâce aux outils IP-Filter.
- Sans oublier le magnifique routeur qui l'intègre en standard, le ZyXEL Prestige 100.
Les firewalls
Comparables par certains de leurs aspects techniques aux proxies évoqués ci-dessus, ils diffèrent essentiellement par leur vocation de protection.

Une raison pour laquelle il peut être délicat de s'y retrouver dans cette jungle de termes et de technologies est que souvent ces techniques sont employées conjointement et présentés comme un produit indivisible.
Par exemple, la plupart des proxies répondant au second cas de figure expliqué plus haut proposés sous forme purement logicielle (par opposition à ceux intégrés dans certains routeurs) sont associés à un proxy comme ceux évoqués dans le premier cas de figure. Vous pouvez alors aisément imaginer alors à quel point les confusions sont possibles.
 
[Retour au titre]Réalités
Bien entendu, des chiffres évoqués ci-dessus, il est possible de dégager une tendance, et SEULEMENT une « tendance ».
Il n'existe à notre connaissance aucune technique fiable de quantifier avec un minimum de réalisme la fréquentation d'un site. En fait, suivant le site proposé il sera éventuellement possible de mettre en place des solutions propres à qualifier plus qu'à dénombrer les visiteurs.
Principe à notre sens
d'autant plus cohérent que dans le cas d'un site commercial, quel intérêt de savoir qu'un millier de personnes ont admiré les vitrines si on ne peut distinguer le simple passant du futur client.
Les idées en question ne sont ni très originales, ni très compliquées à mettre en oeuvre. Elles résultent juste du bon sens.
La plus évidente d'entre elles consiste juste à proposer au visiteur réellement intéressé un formulaire (ne serait-ce que son adresse électronique) à remplir sous prétexte de lui faire parvenir ponctuellement ou régulièrement un complément d'information, qu'elles fassent l'objet d'une actualité précise, d'une promotion commerciale ou d'une offre plus personnalisée.

D'autre part, concernant la mémorisation des documents sur les « proxies » des FAI, il existe probablement une parade mais qui n'est, en terme de ressources pur, pas très satisfaisant et qui consiste à utiliser correctement les notions de date d'expiration des documents en les ramenant à un délai tellement court (de l'ordre de la seconde) qu'aucun proxy correctement configuré ne prendra la peine de stocker tant sa durée de vie sur le support du FAI sera éphémère.
 

[petit logo]

     Chercher sur ce site

Une remarque, une question ou une suggestion ? Merci de nous écrire.

KOMMANDO
Siège social : 3, rue Jacques Daguerre · 95370 MONTIGNY lès CORMEILLES
Tél : 33 (0)6 60 60 10 48 · Fax : 33 (0)9 55 30 89 88



KOMMANDOInternetMatérielsPrestationsNEXTSTEP·OPENSTEPFormationsPartenairesRéférences