Outils d'analyse de la centralisation du Web à partir de données recueillies par Firefox LightBeam.
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
 
Eliott Lavier 3bf2b362c3
Ajout de l'identifiant SPDX.
3 months ago
.gitignore Création innitiale de l'outil 4 months ago
LICENSE Initial commit 5 months ago
README.md Amélioration du README, correction d'une erreur dans la base de données 4 months ago
analyseur.py Ajout de l'identifiant SPDX. 3 months ago
asn_db.py Ajout de l'identifiant SPDX. 3 months ago
centralisation-web.png Ajout Image de présentation 4 months ago
lightbeamData.json Ajout de l'identifiant SPDX. 3 months ago

README.md

Étude de la centralisation du web

Objectif

Ce projet à pour but d'étudier la centralisation du Web par de grandes multinationales en analysant les données récupérées par l'extension Firefox LightBeam.

Fonctionnement

  1. Récupération des noms de domaines 1rst party et 3rd party à partir du fichier produit par LightBeam.

  2. Recherche des adresses IPv4 ou IPv6 associées aux noms de domaines.

  3. Recherche WHOIS sur les adresses IP et récupération de l'ASN (Autonomous System Number).

  4. Comparaison de l'ASN trouvé avec une base de données d'ASN connus et analyse des résultats.

Dépendances

Ce projet nécessite Python 3 avec les dépendances suivantes :

  • IpWhois

À noter qu'il est recommandé d'installer ces dépendances dans un environnement virtuel avec : python3 -m venv .venv/

Utilisation

Pour utiliser le projet, exécutez le fichier python avec en argument le nom du fichier JSON exporté par LightBeam.

Exemple :

./analyseur.py ./lightbeamData.json

Limites

  • La taille de l'échantillon de domaines analysé peut grandement influencer les résultats. Il est recommandé de tester le projet sur des échantillons d'au moins 500 noms de domaines.

  • Pour avoir des données fiables, il est recommandé de tester le projet avec un échantillon d'utilisateurs représentatif de la réalité dans les usages d'internet.