Données personnelles

Données personnelles

Quelles sont les enjeux de la collecte des données personnelles ?

L’enjeu des données personnelles

Le Web est créé en 1990 au CERN par Tim Berners – Lee , avec le protocole HTTP chargé de la circulation des informations sur les réseaux Internet et le langage HTML pour afficher ces informations sous forme des pages que nous connaissons tous, avec des liens cliquables permettant de naviguer d’une page-site à un autre : la toile se tisse …

Technologies Web

La conception de sites Web explose en effet. Très vite, le besoin de visibilité au sein de la toile qui ne cesse de s’élargir, se fait sentir. Les annuaires font alors leur apparition. Ils demandent alors une inscription manuelle, avec un descriptif assez succinct en choisissant une des catégories proposées, avec l’adresse du site, en attendant patiemment l’acceptation, pas toujours systématique, de plus en plus souvent payante, de la présence dans l’annuaire. Etant donné, là aussi, de l’accroissement rapide du nombre d’annuaires, la tâche devient de plus en plus fastidieuse. Le métier de Webmaster , lié à la conception/mise à jour de sites Web est né.

A ce stade, les informations publiées dans chaque annuaire restent sous contrôle du Webmaster.

Google, lancé en 1998, va inverser la règle.

Les deux fondateurs Larry Page et Sergey Brin ont l’idée d’alimenter une base de données de manière automatique, d’après l’analyse des pages parcourues en suivant les liens qu’elles contiennent. Les robots d’indexation du Web (Crawlers ) voient le jour, qui ne cessent depuis, de parcourir le Web de manière automatique et invisible, afin d’alimenter ces bases de données. Elles évoluent sans cesse et prolifèrent en effet, en collectant toutes les informations qui leur semble utiles.

Ainsi, plus besoin d’annuaire. La plupart disparaîtront ou feront une conversion vers d’autres services, comme l’a fait Yahoo en son temps, l’un des plus connus.

Pour exploiter ces bases de données, dont le volume de cesse de croître (en route vers le Big Data …), Google met au point un algorithme de recherche révolutionnaire, permettant de trouver très vite n’importe quelle information à partir d’une simple zone de texte, capable de surcroit, d’anticiper de mieux en mieux la saisie des critères de recherche saisis par les utilisateurs. Pour ce faire, tous ces critères sont eux aussi analysés et mémorisés. Ici, le but consiste à organiser les informations et à améliorer les algorithmes de recherche avec une puissance de traitement qui augmente sans cesse grâce au Cloud. Les meilleurs résultats présumés sont obtenus avec des temps de réponse de plus en plus courts. C’est ce que l’on appelle aujourd’hui un moteur de recherche .

Aucune de méfiance donc, car contrairement aux annuaires dont la plupart étaient devenus payants, tout ce système (analyse automatique des pages, classement, stockage, amélioration des algorithmes de recherche, etc.) est entièrement gratuit. Les bases de données s’alimentent ainsi, de plus en plus vite. C’est le début de la collecte des données massive auquel tous les acteurs et surfeurs du Web participent, volontairement ou non.

En contrepartie, étant donné le nombre de sites qui poursuit sa progression, il devient de plus en plus difficile d’apparaître au début des pages de résultats d’une recherche. Des techniques spécifiquement orientées en cas sens, concernant la conception même des pages et bien entendu de leur contenu, s’imposent. Cet ensemble de techniques visent donc à améliorer la visibilité d’un site. On parle alors de son référencement , sans doute de manière abusive car on ne référence rien du tout : on tâche en réalité de concevoir au mieux les pages de façon à ce que les robots les classent à la meilleure position dans les pages de résultats des recherches, d’après les critères (mots clés ) entrés par les utilisateurs

Il s’agit de fournir le maximum d’informations dans les pages pour aller dans ce sens, c’est à dire en suivant le plus près possible les aux règles évolutives principalement édictées par Google. L’objectif étant au final de faciliter la tâche aux robots et non plus de fournir un simple descriptif choisi par le Webmaster, comme au temps des annuaires.

La règle est donc bien inversée : tout est automatique et gratuit, mais il devient crucial de savoir créer des pages avec du contenu pertinent, c’est à dire avec un maximum d’informations organisées conformément aux « standards du Web ». Les agences Web, intègrent désormais ce nouveau type de service de conception de pages, avec du contenu pertinent et bien structuré du point de vue des robots. Les règles grammaticales évoluent : phrases courtes, choix des mots clés, titres accrocheurs, faire des résumés (phénomène accentué un peu plus tard par Twitter ), etc.

Puis, nouvelle surprise : même avec des pages conçues dans les règles de l’art, il est de moins en moins garanti d’apparaître en tête de liste des résultats. Le référencement peut désormais être amélioré en payant. Cette phase s’accompagne avec des bandeaux publicitaires, de plus en plus ciblés en fonction des navigations faites par chaque utilisateur. Qui plus est, tout le monde peut désormais créer un compte de façon à pouvoir bénéficier de nouveaux services, toujours gratuits bien entendu, tels que messagerie avec liste des contacts, planning, etc. Une mine d’informations à haute valeur !

Google entre en bourse en 2004 (qui marque aussi la naissance des GAFA) :

Google entre en bourse en 2004

Survient une nouvelle étape dénommée Web 2 dans le début des années 2000, qui se traduira par l’avènement des Réseaux sociaux lancés par Facebook en 2004. Pour faire simple, il s’agit de ce que l’on nomme aussi le Web participatif . Dès lors, les utilisateurs peuvent, juste avec la création d’un compte, alimenter eux-mêmes le contenu d’un site, sans aucune compétence technique concernant la conception de page Web, c’est-à-dire sans Webmaster. C’est la grande flambée des Blogs en tous genres.

La collecte des données est désormais ouverte, avec une nouvelle source d’informations livrées avec enthousiasme, sans être prévenu de la façon dont on s’empresse de les exploiter à grande échelle et à des fins très variées. Les analyses permettent désormais d’établir des profils avec toutes sortes de critères (âge, sexe, préférences, loisirs, opinions, etc.).

Scandale Facebook Cambridge Analytica

La première exploitation est bien entendu commerciale, de façon à cibler au mieux les utilisateurs avec des publicités liées au profil croisées aux recherches effectuées dans les moteurs de recherche.

Une entreprise peut également obtenir beaucoup d’informations sur ses concurrents, ses employés, ses collaborateurs, etc.

Les données personnelles, notamment les emails, les numéros de téléphone, les noms-prénoms, date et lieu de naissance, etc. sont non seulement utiles dans le cadre de recherches, mais aussi monnayables. Des fichiers avec ces précieuses informations sont en effet constitués, à des fins commerciales avec pignon sur rue (à des fins de prospection marketing par exemple), mais il en existe tout autant, voire plus qui ont été dérobés à des fins de piratage.

Aperçu de l’étendu des attaques

Viennent ensuite les téléphones « intelligents », désignés par le terme Smartphone . Ils existent déjà, mais c’est en 2007, avec l’avènement de l’iPhone de Apple que la mobilité prend son envol.

Nouvelle étape qui confirme et développe les précédentes : les données (coordonnées, contacts, photos, etc.) sont désormais dans les téléphones, mais avec une nouvelle information encore plus précieuse : la position ! Même en l’absence de GPS (ou s’il est désactivé), c’est moins précis, mais les opérateurs peuvent toujours localiser un téléphone dans quartier grâce aux antennes.

Le Web subit quant à lui, une évolution en conséquence, de façon à pouvoir être utilisé à partir d’un Smartphone ou une tablette. Ces dernières sont devenues très accessibles à l’achat si elles ne sont pas offertes, afin de procurer aux utilisateurs le moyen de consommer toutes sortes de services en ligne ensuite.

La crise du Covid-19 (initialement en Corée du sud, puis en Chine,…) met ainsi en lumière ce type d’exploitation dite de « tracking », basée sur le suivi géographique permanent des personnes possédant ce type de téléphone, avec leur état de santé grâce à une application conçue à cet effet.

En réalité, elle existe déjà avec bien d’autres types d’applications, souvent anodines (principalement des jeux), le plus souvent gratuites de façon à pouvoir là aussi, collecter nos précieuses données personnelles malgré quelques messages d’avertissements, généralement incompris ou simplement ignorés…

Une brève histoire des réseaux sociaux


Retour au début de page