 |
Un grand nombre, pour ne pas dire la majorité, des sociétés
de service assurant l'hébergement de sites Web pour leurs clients mettent
en avant la capacité à fournir à ces derniers un rapport détaillé
de la fréquentation des sites en question, sous une forme riche de
tableaux d'informations très techniques, de graphiques en couleurs et
autres artifices.
On lira ici que 5 328 « personnes » ont visité
votre serveur, et là que 47 % d'entre elles sont d'origine nord-américaine.
Certaines sociétés soi-disant spécialisées dans le
calcul d'audience vont même jusqu'à proposer des outils dédiés
pour des sommes de plusieurs dizaines de milliers de francs.
Voyons maintenant plusieurs raisons pour lesquelles ces chiffres sont
obligatoirement biaisés, quelques soient les efforts que peuvent déployer
les prestataires.
- Le rafraîchissement
- Il s'agît tout simplement de la possibilité qui est offerte
dans la majorité des logiciels de navigation (les « butineurs »)
de solliciter une nouvelle fois le serveur pour le document en cours de
consultation, en cas, par exemple, d'une erreur de transmission qui aurait altérée
le contenu de la page.
- L'effet le plus visible de l'effet de bord provoqué par cette
anodine action se constate sur les pages contenant un compteur possédant
un comportement primaire. Vous verrez alors le compteur augmenter à
chaque appui sur ce bouton.
- Pensez-vous que le nombre de visites qu'il est censé dénombrer
a vraiment progressé à ce point ?
- Étudiez notre petit exemple à
ce sujet.
- L'interruption en cours de téléchargement d'une page
- La navigation a longtemps été assimilée à la
pratique du zapping télévisé. C'est toujours d'actualité
et les documents sollicités dont même les premières lignes
ne sont pas lues sont monnaie courante.
- Croyez-vous pour autant qu'un serveur Web peut vous le dire ? Non. Il
enregistrera simplement que le document a été demandé et
qu'il a été transmis.
Plus « technique »
- Les proxies
- Sous ce terme barbare se cachent en fait deux notions très différentes
qui toutes deux influent directement et dans des proportions non négligeables
sur les rapports de fréquentation que délivrent les serveurs Web.
-
- Les premiers et les plus connus du grand public depuis leur
emploi croissant ces derniers mois chez les fournisseurs d'accès Internet
(les FAI) sont en fait des zones mémoires spécialisées (des
caches, des tampons, des buffers comme peuvent les appeler les uns et les
autres) qui ont pour but principal de minimiser l'usage de la précieuse « bande
passante », ressource Ô combien coûteuse (prosternons-nous
devant le dictat de France Télécom) et, corollaire, d'améliorer
parfois considérablement les temps de réponse offert aux abonnés.
- Ils permettent aussi de réduire de manière importante les
requêtes émises à l'attention des serveurs très
connus et par conséquent très sollicités, surtout lors de
la sortie d'un nouveau programme très attendu disponible en téléchargement.
(Un exemple représentatif étant la dernière version
d'Acrobat Reader de la société Adobe qui a enregistrée
plusieurs centaines milliers de connexions dans les semaines qui ont suivies
l'annonce de sa disponibilité.)
- Il est étonnant que cette pratique ne soit apparue que très récemment
tant le principe en est simple et le gain immédiat.
- Puisqu'une majorité d'Internautes passent par les services de FAI spécialisés
et par conséquent par leurs machines, il suffit de stocker sur ces
ordinateurs la plus grande quantité possible de documents qu'ils
sollicitent sur les serveurs du monde entier en se basant sur l'hypothèse
qu'un bon nombre de ces fichiers seront probablement et rapidement sollicités
par les autres abonnés.
- Si le document présent sur les machines du FAI est toujours
d'actualité lors de la requête suivante provenant de l'un de ces
abonnés, la version présente sur ses mémoires de masse sera
envoyée à l'utilisateur plutôt que d'aller chercher à
nouveau l'original à la source avec pour conséquence deux aspects
essentiels :
- 1 - un gain pour les trois acteurs impliqués dans cette
communication. L'ordinateur du serveur se voit épargné d'un
travail qu'il peut ainsi faire profiter un autre utilisateur. Le FAI économise
ses connexions vers « l'extérieur » et gagne en crédit
auprès de son client. Enfin le client qui peut ainsi réduire ses
temps de communication et par conséquent le montant de sa facture téléphonique.
- 2 - Le serveur ne peut plus espérer comptabiliser systématiquement
toutes les nouvelles connexions.
- De plus, serveur comme FAI sont susceptibles de faire l'un et l'autre,
suivant leurs contrats respectifs, une économie sur leurs frais de
communications, si ils sont facturés au volume plutôt qu'au forfait
ou s'ils dépassent le volume de données transférées
prévu par le forfait.
- Cette idée s'appuie sur les probabilités et sur le nombre
d'abonnés que peut compter chaque FAI.
- Il est évident que l'évolution que connaît le milieu
Internet (augmentation du nombre d'utilisateurs et fusion des plus importants
FAI) ne peut que favoriser cette pratique pour le plus grand confort de tous.
-
- Les seconds désignent des programmes particuliers
chargés de faire de la translation d'adresses IP (dans le jargon des
initiés, il mettent en oeuvre le protocole NAT, « Network
Address Translation »).
- Une brève explication vous permettra de comprendre pour quelle
raison les FAI ne tiennent pas trop à ce que ce protocole soit connu de
leurs clients.
- En règle générale, l'abonnement type auprès
d'un opérateur prévoit le raccordement ponctuel (notion de
dialup-IP par opposition à une liaison permanente appelée full-IP)
d'un ordinateur à Internet par le biais des machines du FAI. La procédure
de connexion implique entre autres l'attribution d'une adresse IP « prêtée »
par l'opérateur durant la période de connexion et qui identifiera
votre ordinateur de manière unique au milieu des centaines de milliers,
voire millions, d'autres ordinateurs branchés sur Internet au même
moment.
- Pourquoi ne pas donner à chaque abonné une adresse IP unique
une fois pour toute plutôt que de lui en attribuer une potentiellement
différente à chacune de ses connexions ?
-
- La réponse tient en un mot : saturation.
-
- Les choix techniques retenus il y a quelques années et la
distribution parfois un peu légère des adresses IP incitent désormais
les organismes (RIPE pour l'Europe) à modérer et surtout à
mieux contrôler les demandes des prestataires ou des compagnies
importantes (IBM ou HP par exemple).
- En particulier dans le cas des FAI, pourquoi leur accorder autant
d'adresses IP différentes que d'abonnés alors que la seule chose
qui importe techniquement est seulement d'avoir autant d'adresses distinctes que
le nombre de personnes pouvant se connecter à un instant donné,
soit pour schématiser, autant d'adresses que de modems disponibles.
Nombre qui, même s'il est important, est en règle générale
inférieur au nombre des abonnés.
- Mais tout cela nous éloigne de la technique qui nous intéresse
dans le présent propos.
- Donc, le principe est qu'à chacune de vos connexions, une (et une
seule) adresse IP vous est dynamiquement communiquée par votre FAI,
n'autorisant que l'ordinateur sur lequel est branché votre modem à
dialoguer sur Internet. Si vous désirez que plusieurs ordinateurs accèdent
simultanément au réseau des réseaux, que ce soit pour une
utilisation domestique ou professionnelle, la première idée qui
vient à l'esprit est de multiplier d'autant le nombre d'abonnements auprès
de votre FAI et aussi le nombre de modems, et enfin pour être logique, le
nombre de lignes téléphoniques. Cela devient rapidement ruineux, y
compris pour une entreprise. Non, la solution est ailleurs, qui ne requiert pas
non plus la location d'une ligne louée à peine moins coûteuse.
Comme vous l'aurez deviné, cette solution se nomme NAT. Le principe est
de partage une adresse IP entre plusieurs postes pour les communications avec « l'extérieur ».
Ainsi, un seul abonnement autorise la connexion de plusieurs machines en même
temps. Ajoutez-y un système, matériel ou logiciel, de partage de
la ressource physique que constitue le modem entre ces différentes
machines et vous obtenez un moyen efficace de contourner la limitation initiale.
- Certains fabricants ont bien compris cette ouverture et proposent depuis
plusieurs mois des produits qui répondent aux deux contraintes à
la fois, ce sont en particulier certains modèles de routeurs
Ethernet/RNIS. Branchés directement sur le réseau local, ils sont
ainsi visibles de tous les ordinateurs qui y sont aussi raccordés, sans
intermédiaire. Et quand le routeur intègre ce protocole NAT (appelé
SUA chez ZyXEL), le partage d'un accès Internet peut-être configuré
en moins d'un quart d'heure, sans aucune révision de votre abonnement
traditionnel.
- Dans le cas d'un accès par le câble comme celui que fournit
(bien mal) la société Cybercable à ses abonnés, la
liaison étant permanente, pendant très longtemps, les adresses IP
ont été associées à chaque modem-câble en
attendant la mise en place d'un serveur DHCP pour l'attribution dynamique
d'adresse aux clients ayant souscrit un abonnement de type « Résidentiel ».
- Sachez enfin que, à priori, l'utilisation du protocole NAT n'est pas
détectable.
- Si vous désirez approfondir le sujet, ou passer directement à
l'action, nous vous recommandons les sites suivants :
- - le document « RFC »
qui s'y rapporte.
- - Une source tierce.
- - Et quelques programmes, principalement pour Windows,
WinProxy,
Wingate, avec
tout de même de quoi satisfaire les accros d'Unix grâce aux outils
IP-Filter.
- - Sans oublier le magnifique routeur qui l'intègre en standard, le
ZyXEL Prestige 100.
- Les firewalls
- Comparables par certains de leurs aspects techniques aux proxies évoqués
ci-dessus, ils diffèrent essentiellement par leur vocation de protection.
Une raison pour laquelle il peut être délicat de s'y retrouver
dans cette jungle de termes et de technologies est que souvent ces techniques
sont employées conjointement et présentés comme un produit
indivisible.
Par exemple, la plupart des proxies répondant au second cas de figure
expliqué plus haut proposés sous forme purement logicielle (par
opposition à ceux intégrés dans certains routeurs) sont
associés à un proxy comme ceux évoqués dans le
premier cas de figure. Vous pouvez alors aisément imaginer alors à
quel point les confusions sont possibles.
|
 |
Bien entendu, des chiffres évoqués ci-dessus, il est possible
de dégager une tendance, et SEULEMENT une « tendance ».
Il n'existe à notre connaissance aucune technique fiable de quantifier
avec un minimum de réalisme la fréquentation d'un site. En fait,
suivant le site proposé il sera éventuellement possible de mettre
en place des solutions propres à qualifier plus qu'à dénombrer
les visiteurs.
Principe à notre sens
d'autant plus cohérent que dans le cas d'un site commercial, quel intérêt
de savoir qu'un millier de personnes ont admiré les vitrines si on ne
peut distinguer le simple passant du futur client.
Les idées en question ne sont ni très originales, ni très
compliquées à mettre en oeuvre. Elles résultent juste du
bon sens.
La plus évidente d'entre elles consiste juste à proposer au
visiteur réellement intéressé un formulaire (ne serait-ce
que son adresse électronique) à remplir sous prétexte de
lui faire parvenir ponctuellement ou régulièrement un complément
d'information, qu'elles fassent l'objet d'une actualité précise,
d'une promotion commerciale ou d'une offre plus personnalisée.
D'autre part, concernant la mémorisation des documents sur les « proxies » des
FAI, il existe probablement une parade mais qui n'est, en terme de ressources
pur, pas très satisfaisant et qui consiste à utiliser correctement
les notions de date d'expiration des documents en les ramenant à un délai
tellement court (de l'ordre de la seconde) qu'aucun proxy correctement configuré
ne prendra la peine de stocker tant sa durée de vie sur le support du FAI
sera éphémère.
|