Format : UTF-8, séparateur virgule (RFC 4180). Les lignes commençant par # en début de fichier sont l'en-tête de licence — à ignorer côté parser.
Colonne
Description
Unité
brand_name
Nom de la marque
—
brand_country
Pays du siège
—
controversy_type
Catégorie (13 types possibles)
—
title
Titre court de la controverse
—
year
Année de l'événement principal
année
En bref
5 819
controverses
4 398
marques uniques
73
pays de siège
13
catégories
1961–2025
période couverte
Distribution par type de controverse
Treize catégories couvrant l'éventail des controverses RSE contemporaines. La pollution et le travail forcé concentrent plus de 43% du volume, reflet de la priorité donnée par les ONG et les législateurs à ces thématiques.
Pollution et environnement1 381 (23.7%)
Travail forcé1 168 (20.1%)
Vie privée / RGPD752 (12.9%)
Autres (non classifiées)730 (12.5%)
Évasion / optimisation fiscale707 (12.2%)
Greenwashing448 (7.7%)
Campagne de boycott active141 (2.4%)
Bien-être animal141 (2.4%)
Déforestation123 (2.1%)
Corruption / pots-de-vin86 (1.5%)
Territoires occupés (BDS)63 (1.1%)
Travail des enfants55 (0.9%)
Discrimination24 (0.4%)
Distribution par décennie
Concentration massive sur la décennie 2020 (89% du volume), liée à l'explosion de la documentation ONG, à la généralisation des législations RSE européennes (loi devoir de vigilance 2017, CSRD 2022, CSDDD 2024) et à l'amélioration de la couverture journalistique d'investigation post-Panama Papers.
1960s2
1970s1
1990s4
2000s29
2010s622
2020s5 161
Tendance annuelle 2015-2025
Le pic 2022-2023 (3 958 controverses cumulées) correspond à la vague de documentation des engagements RSE post-COP26, aux audits massifs Brand Audit de Break Free From Plastic et à la généralisation des analyses de supply chain post-LuxLeaks. Le creux 2024-2025 reflète un retard de saisie en cours de rattrapage, pas une baisse réelle des controverses.
2015
35
2016
42
2017
205
2018
180
2019
84
2020
900
2021
148
2022
2136
2023
1822
2024
152
2025
3
Top 20 des marques les plus citées
Une marque cumule des controverses lorsqu'elle est exposée sur plusieurs angles distincts (par exemple Nestlé : eau, plastique, cacao, marketing infantile). Cinq marques cumulent 7 controverses ou plus, toutes opérant sur des chaînes d'approvisionnement mondiales.
#
Marque
Pays
Controverses
1
Nestlé
Suisse
10
2
Coca-Cola
États-Unis
9
3
Shell
Royaume-Uni
8
4
Teva Pharmaceutical
Israël
8
5
Samsung
Corée du Sud
8
6
Alibaba
Chine
7
7
Danone
France
7
8
McKinsey & Company
États-Unis
7
9
Mondelēz
États-Unis
7
10
Carrefour
France
7
11
PepsiCo
États-Unis
6
12
JP Morgan Chase
États-Unis
6
13
TotalEnergies
France
6
14
Puma
Allemagne
6
15
Unilever
Royaume-Uni
6
16
Starbucks
États-Unis
6
17
Amazon
États-Unis
6
18
H&M
Suède
6
19
Temu
États-Unis
6
20
Merck & Co.
États-Unis
6
Top 12 pays par nombre de controverses
Les États-Unis dominent largement (33,5% du volume), suivis par la France (11,1%) et le Royaume-Uni (7,7%). Le poids relatif de la France reflète à la fois le focus éditorial GlobeReviews et la couverture intensive de la presse française sur les multinationales hexagonales. La sous-représentation africaine et latino-américaine signale une limite méthodologique de couverture occidentale, à corriger dans les versions futures.
🇺🇸États-Unis1 948
🇫🇷France646
🇬🇧Royaume-Uni447
🇩🇪Allemagne313
🇨🇳Chine251
🇯🇵Japon195
🇮🇹Italie194
🇨🇭Suisse153
🇮🇳Inde133
🇳🇱Pays-Bas124
🇨🇦Canada102
🇰🇷Corée du Sud90
Six cas emblématiques documentés
Sélection d'affaires emblématiques inclus dans le dataset, présentés ici comme exemples concrets de ce que la base permet d'analyser. Chaque cas est rattaché à plusieurs lignes du CSV (sources, chronologie, suites judiciaires).
Volkswagen — Dieselgate (2015)
POLLUTION
Découverte de logiciels truqueurs sur 11 millions de véhicules diesel pour passer les tests d'émissions. Sanction US dépassant 30 milliards de dollars. Tournant de la régulation européenne sur le diesel.
Sources principales : EPA, ICCT, Süddeutsche Zeitung
Facebook (Meta) — Cambridge Analytica (2018-2019)
DATA_PRIVACY
Exploitation des données personnelles de 87 millions d'utilisateurs Facebook pour la campagne de Donald Trump et Brexit. Amende FTC de 5 milliards $. Catalyseur du GDPR enforcement actif en Europe.
Sources principales : Observer/Guardian, FTC, ICO
Apple — Décision UE Aides d'État (2016)
TAX_EVASION
La Commission européenne ordonne à Apple de rembourser 13 milliards d'euros à l'Irlande pour aides d'État fiscales illégales 2003-2014. Confirmée par la CJUE en septembre 2024 après 8 ans de recours.
Sources principales : Commission européenne, CJUE C-465/20
Nestlé — Marketing du lait infantile dans le Sud (depuis 1977)
BOYCOTT_CAMPAIGN
Boycott historique le plus ancien au monde encore actif. Initialement déclenché par les pratiques marketing agressives de Nestlé dans les pays en développement, où la promotion du lait artificiel a contribué à des décès infantiles évitables.
Sources principales : IBFAN, OMS, Baby Milk Action
Boeing — Crashes 737 MAX (2018-2019)
OTHER
Deux crashes (Lion Air, Ethiopian Airlines) tuant 346 personnes. Mise au jour d'une culture sécurité dégradée et de raccourcis de certification FAA. Suspension mondiale de 20 mois. Coût estimé > 20 milliards $.
Sources principales : NTSB, FAA, US House Transportation Committee
Shein — Travail forcé du coton du Xinjiang (2020-2026)
FORCED_LABOR
Le coton chinois ouïghour utilisé largement par la fast fashion. Documentation ASPI, Sheffield Hallam University, ONU OHCHR. Aux États-Unis : Uyghur Forced Labor Prevention Act (2022). UE : directive CSDDD (2024).
Sources principales : ASPI 2020, Sheffield Hallam 2021, ONU OHCHR 2022
Comment exploiter ce dataset
Quatre cas d'usage récurrents observés chez les premiers utilisateurs du dataset. Tous les exemples utilisent l'URL de téléchargement stable avec mise à jour automatique du cache à chaque ré-export trimestriel.
📊 Analyse sectorielle d'un type de controverse
Étudier l'évolution temporelle d'un type précis (ex : RGPD, pollution plastique) en filtrant controversy_type et en agrégeant par année.
Géocodage à partir de la colonne brand_country pour visualiser la distribution mondiale des controverses sur une carte choroplèthe (Datawrapper ou Flourish).
# Aggrégation par pays
df.groupby('brand_country').size().sort_values(ascending=False).head(20)
# Export prêt pour Datawrapper choropleth
result.to_csv('controversies-by-country.csv')
🏢 Profil de risque d'une marque
Extraire toutes les controverses associées à une marque pour produire un profil de risque ESG (utilisé par les fonds d'investissement, les ONG de plaidoyer, et les départements achats responsables).
Joindre avec INSEE Sirene (SIREN français), Open Corporates (entités étrangères), ICIJ Offshore Leaks Database (sociétés offshore) pour produire des analyses cross-sources sans duplication de saisie.
Cas d'usage observé : production d'un rapport ONG croisant 4 sources, dont la nôtre, pour identifier les groupes français cumulant des controverses RSE et des structures offshore.
Méthodologie de constitution du dataset
Critères d'inclusion
Documentation existante. La controverse doit être attestée par au moins une source primaire publique (rapport ONG, décision réglementaire, étude académique avec comité de lecture, ou investigation journalistique d'un média établi).
Identification claire de la marque. La controverse doit pouvoir être rattachée à une entité commerciale identifiable (raison sociale ou marque grand public reconnue).
Spécificité. Les mentions génériques sectorielles (« l'industrie automobile pollue ») sont exclues. La controverse doit concerner une décision ou pratique précise d'une marque.
Pertinence temporelle. Les controverses antérieures à 2010 sont incluses seulement si elles ont structuré durablement la littérature (Nestlé 1977, AT&T 2013-NSA, etc.).
Sources primaires utilisées
Académiques : Australian Strategic Policy Institute (ASPI), Sheffield Hallam University, Harvard Kennedy School, Université Paris 1 Panthéon-Sorbonne.
ONU et institutions internationales : OHCHR, OIT, OCDE, Commission européenne (décisions Aides d'État).
ONG : Break Free From Plastic (BFFP), BDS National Committee, PETA, Who Profits, Save Uyghur Coalition, Stop EACOP, Greenpeace, Surfrider Foundation, Clean Clothes Campaign, Cruelty Free International, Cohérence des Politiques en Faveur du Développement (CPFD).
Journalisme d'investigation : Le Monde, Mediapart, The Guardian, Reuters, ICIJ (LuxLeaks, Panama Papers, Pandora Papers, FinCEN Files), Süddeutsche Zeitung, Forbidden Stories, OCCRP.
Limites assumées
Biais de couverture occidentale. Sur-représentation des marchés anglophones et francophones (US 33,5%, France 11,1%, UK 7,7% du volume). Les pays du Sud sont mécaniquement sous-représentés faute de couverture médiatique équivalente, pas parce qu'ils ont moins de controverses.
Pas d'évaluation de la résolution. Une controverse peut avoir été résolue (entreprise sortie de la pratique critiquée) sans que la ligne soit retirée du dataset. Le champ year marque la documentation, pas le statut actuel.
Pas d'estimation quantitative. Les dommages (financiers, sanitaires, écologiques) ne sont pas chiffrés dans le dataset principal. Ces données existent pour ~5% des cas (décisions de justice rendues publiques) et feront l'objet d'un dataset complémentaire en 2026.
Granularité variable de l'attribution. Certaines controverses concernent une filiale, un fournisseur tier 2 ou tier 3 plutôt que la marque-mère. La pratique éditoriale est de rattacher à la marque-mère quand le contrôle effectif est démontré, sinon à l'entité opérationnelle directe.
Traduction partielle EN. Sur la version bilingue déposée chez Harvard Dataverse, 78% des titres sont traduits professionnellement, 22% restent en français (préfixés [FR]).
Cycle de mise à jour
Re-export trimestriel à partir de la base de production. Chaque révision majeure (changement de schéma, ajout d'une catégorie) génère une nouvelle version Dataverse avec un DOI distinct. Les versions passées restent accessibles via leur DOI permanent.
Comment citer le dataset
Citation française (APA française)
GlobeReviews (2026). Controverses de marques mondiales — Base complète (2010-2026) [Jeu de données]. https://www.globe-reviews.com/datasets/brand-controversies-full-2026
5 819 controverses documentées sur 4 398 marques uniques, réparties dans 73 pays de siège, entre 1961 et 2025 (concentration massive sur 2020-2025). Les marques retenues sont celles ayant fait l'objet d'une couverture publique vérifiable.
Comment le dataset se distingue-t-il de la base CSRHub ou Sustainalytics ?
Le dataset GlobeReviews est ouvert (CC BY 4.0), gratuit, et focalisé sur les controverses individuelles documentées (pas sur des scores composites propriétaires). CSRHub et Sustainalytics utilisent des modèles fermés et payants. Notre approche complémente plus qu'elle ne remplace : on documente les faits, ils calculent des scores agrégés.
Puis-je l'utiliser dans une publication académique ?
Oui. La licence CC BY 4.0 autorise toute utilisation, y compris commerciale, à condition de citer la source. Le dataset est miroir sur Harvard Dataverse avec un DOI permanent (à compléter une fois publié), citable au format académique standard. Les premières citations sont attendues dans des publications en science de gestion et droit de la consommation à partir de 2027.
Le dataset prend-il position sur les controverses ?
Non. La base documente l'existence d'une couverture publique sourcée d'une controverse, sans jugement de valeur. Une marque peut figurer pour une controverse contestée ou résolue. Les utilisateurs sont invités à consulter les sources primaires citées pour formuler leur propre jugement.
Comment signaler une erreur ou un ajout ?
Via la page contact de GlobeReviews. Toute demande de correction ou suppression est étudiée sur la base des sources primaires. Les marques concernées peuvent demander un droit de réponse documenté, intégré au dataset comme champ additionnel dans une version future.
Y a-t-il une API plutôt qu'un CSV à télécharger ?
Pas encore. Le format CSV est volontairement simple pour maximiser la compatibilité (Excel, Google Sheets, Python, R, outils de viz). Une API REST est en réflexion pour 2026 avec endpoints par catégorie / marque / pays.
Le dataset est-il aussi disponible en RDF / Linked Open Data ?
Pas en version 1.0. Le travail de mapping vers schema.org/Dataset est en cours et alimentera une version JSON-LD à partir de la version 2.0 (planifiée 2026 H2).
Comment puis-je contribuer à enrichir le dataset ?
Trois canaux : (1) signaler des sources primaires manquées sur la page contact, (2) proposer des traductions des titres restant en français (22% du volume), (3) signaler les controverses résolues pour qu'on les marque comme telles dans la version 2.0.
Comment citer ce dataset
GlobeReviews (2026). « Controverses de marques mondiales — Base complète (2010-2026) ». https://www.globe-reviews.com/datasets/brand-controversies-full-2026
Ce dataset est publié sous licence CC BY 4.0. Vous pouvez le copier, redistribuer, transformer et utiliser à des fins commerciales, à condition de citer la source.