Piratage : l’Arcom estime à 1,5 milliard d’euros le manque à gagner pour les contenus audiovisuels

Par : Martin Clavey

29 novembre 2024 à 14:43

IPTV and (don't) chill

Piratage : l’Arcom estime à 1,5 milliard d’euros le manque à gagner pour les contenus audiovisuels

L’autorité de régulation a publié un dossier sur la consommation des contenus culturels et sportifs dématérialisés. Elle y estime le manque à gagner lié à la consommation illicite de contenus audiovisuels à 1,5 milliard d’euros et rapporte les résultats des sondages commandés à l’IFOP.

Alors que le monde de l’audiovisuel en ligne bouge rapidement, l’Arcom a voulu mettre à jour les données sur la consommation illite de ces contenus sur internet en y faisant un focus sur les « contenus sportifs dématérialisés ». Ce dernier coïncide avec l’offensive judiciaire récente des ayants droits comme Canal+ pour bloquer plus efficacement les sites qui diffusent le streaming de retransmission dont ils n’ont pas les droits.

Streaming sportif : la justice ordonne le blocage par les DNS de Google, Cloudflare et Cisco

L’autorité a donc commandé trois sondages (deux à l’IFOP et un à Médiamétrie) et a publié ensuite ses différentes analyses des données collectées.

91 % des internautes consomment des contenus culturel ou sportif dématérialisés

Le premier document [pdf] est un « Baromètre de la consommation des contenus culturels et sportifs dématérialisés ». Elle en constate une hausse générale de la consommation de contenus culturels et sportifs. En effet, « 91 % des internautes ont consommé un contenu culturel ou sportif dématérialisé en 2024, soit 48 millions d’individus ». L’année dernière, ce taux était de 87 %.

Et cette hausse profiterait à l’offre légale, avec 67 % des internautes ayant consommé des contenus culturels et sportifs dématérialisés de façon uniquement légale en 2024, en hausse de 3 points par rapport à 2023.

Le panier moyen mensuel payant, actuellement à 32 euros, serait en baisse de 2 euros par rapport à l’année dernière, après une progression de 5 euros en 2023.

C’est l’argument de la qualité du contenu qui semble faire basculer les internautes vers des offres légales : « 41 % des internautes déclarant consommer davantage de façon légale le font pour accéder à un contenu de meilleure qualité ».

Une estimation de 1,5 milliard d’euros de manque à gagner

Dans un deuxième document [PDF], l’Arcom analyse les secteurs audiovisuels et sportifs affectés par les usages illicites pour comprendre les tendances observées au sein de leurs écosystèmes, en s’appuyant sur ses propres données et celles de Médiamétrie.

Elle y détaille la « chaine de valeur de l’audiovisuel » dans le graphique ci-dessous, ce qui permet de comprendre un peu mieux qui sont les différents acteurs et « ayants droit » du secteur :

L’Arcom y constate que le marché de cette industrie (incluant les événements physiques et les ventes en ligne) a progressé encore de 5 % en 2023, atteignant les 11, 8 milliards d’euros.

Notes : (1) Hors réseaux sociaux et gaming (2) TCAM : Taux de croissance annuel moyen (3) Rupture méthodologique dans le calcul de la TV payante (4) Incluant les recettes des espaces numériques des acteurs de TV gratuites
Source : Données CNC, Données Arcom, Analyse PMP Strategy

Dans ce document, l’Arcom aborde le manque à gagner de cette industrie qui serait dû au piratage. Elle l’estime à 1,5 milliard d’euros, dont 300 millions pour le secteur sportif.

Souvent, les ayants droits font cette estimation en utilisant une corrélation rapide entre le nombre de contenus piratés et le chiffre d’affaires qu’ils auraient pu tirer de leur consommation payante. Ici, l’Arcom, en s’appuyant sur un sondage de Médiamétrie, a mis en place une analyse plus fine.

L’entreprise de sondage a demandé à des internautes déclarant consommer des contenus illicites ce qu’ils auraient fait s’ils n’y avaient pas eu accès (sans oublier les réponses « je ne sais pas » et « je ne l’aurais pas consommé »). Et elle a calculé ce manque à gagner après avoir rassemblé les valeurs moyennes des contenus. Elle en déduit qu’au moins 70 % des utilisateurs de contenus pirates se seraient reportés vers des offres légales :

11 % de consommateurs d’IPTV illicites

Enfin, dans un troisième document [PDF], l’Arcom s’intéresse à l’utilisation de l’IPTV comme solution de « consommation audiovisuelle illicite » via un sondage commandé à l’IFOP. 11 % des internautes français de 15 ans et plus utiliseraient l’IPTV de façon illicite, ce qui représenterait 62 % des utilisateurs de l’IPTV.

L’IPTV reste une pratique de bricolage avec des utilisations assez mixtes pour y trouver le flux qui intéresse l’internaute. En effet, 75 % des utilisateurs y accèdent de plusieurs façons et 38 % utilisent les trois manières d’y accéder proposées (à savoir un logiciel, un boitier ou une clé, ou des liens) :

Piratage : l’Arcom estime à 1,5 milliard d’euros le manque à gagner pour les contenus audiovisuels

29 novembre 2024 à 14:43

IPTV and (don't) chill

L’autorité de régulation a publié un dossier sur la consommation des contenus culturels et sportifs dématérialisés. Elle y estime le manque à gagner lié à la consommation illicite de contenus audiovisuels à 1,5 milliard d’euros et rapporte les résultats des sondages commandés à l’IFOP.

Alors que le monde de l’audiovisuel en ligne bouge rapidement, l’Arcom a voulu mettre à jour les données sur la consommation illicite de ces contenus sur internet en y faisant un focus sur les « contenus sportifs dématérialisés ». Ce dernier coïncide avec l’offensive judiciaire récente des ayants droits comme Canal+ pour bloquer plus efficacement les sites qui diffusent le streaming de retransmission dont ils n’ont pas les droits.

Streaming sportif : la justice ordonne le blocage par les DNS de Google, Cloudflare et Cisco

L’autorité a donc commandé trois sondages (deux à l’IFOP et un à Médiamétrie) et a publié ensuite ses différentes analyses des données collectées.

91 % des internautes consomment des contenus culturel ou sportif dématérialisés

Le premier document [pdf] est un « Baromètre de la consommation des contenus culturels et sportifs dématérialisés ». Elle en constate une hausse générale de la consommation de contenus culturels et sportifs. En effet, « 91 % des internautes ont consommé un contenu culturel ou sportif dématérialisé en 2024, soit 48 millions d’individus ». L’année dernière, ce taux était de 87 %.

Et cette hausse profiterait à l’offre légale, avec 67 % des internautes ayant consommé des contenus culturels et sportifs dématérialisés de façon uniquement légale en 2024, en hausse de 3 points par rapport à 2023.

Le panier moyen mensuel payant, actuellement à 32 euros, serait en baisse de 2 euros par rapport à l’année dernière, après une progression de 5 euros en 2023.

C’est l’argument de la qualité du contenu qui semble faire basculer les internautes vers des offres légales : « 41 % des internautes déclarant consommer davantage de façon légale le font pour accéder à un contenu de meilleure qualité ».

Une estimation de 1,5 milliard d’euros de manque à gagner

Dans un deuxième document [PDF], l’Arcom analyse les secteurs audiovisuels et sportifs affectés par les usages illicites pour comprendre les tendances observées au sein de leurs écosystèmes, en s’appuyant sur ses propres données et celles de Médiamétrie.

Elle y détaille la « chaine de valeur de l’audiovisuel » dans le graphique ci-dessous, ce qui permet de comprendre un peu mieux qui sont les différents acteurs et « ayants droit » du secteur :

L’Arcom y constate que le marché de cette industrie (incluant les événements physiques et les ventes en ligne) a progressé encore de 5 % en 2023, atteignant les 11, 8 milliards d’euros.

Dans ce document, l’Arcom aborde le manque à gagner de cette industrie qui serait dû au piratage. Elle l’estime à 1,5 milliard d’euros, dont 300 millions pour le secteur sportif.

Souvent, les ayants droits font cette estimation en utilisant une corrélation rapide entre le nombre de contenus piratés et le chiffre d’affaires qu’ils auraient pu tirer de leur consommation payante. Ici, l’Arcom, en s’appuyant sur un sondage de Médiamétrie, a mis en place une analyse plus fine.

L’entreprise de sondage a demandé à des internautes déclarant consommer des contenus illicites ce qu’ils auraient fait s’ils n’y avaient pas eu accès (sans oublier les réponses « je ne sais pas » et « je ne l’aurais pas consommé »). Et elle a calculé ce manque à gagner après avoir rassemblé les valeurs moyennes des contenus. Elle en déduit qu’au moins 70 % des utilisateurs de contenus pirates se seraient reportés vers des offres légales :

11 % de consommateurs d’IPTV illicites

Enfin, dans un troisième document [PDF], l’Arcom s’intéresse à l’utilisation de l’IPTV comme solution de « consommation audiovisuelle illicite » via un sondage commandé à l’IFOP. 11 % des internautes français de 15 ans et plus utiliseraient l’IPTV de façon illicite, ce qui représenterait 62 % des utilisateurs de l’IPTV.

L’IPTV reste une pratique de bricolage avec des utilisations assez mixtes pour y trouver le flux qui intéresse l’internaute. En effet, 75 % des utilisateurs y accèdent de plusieurs façons et 38 % utilisent les trois manières d’y accéder proposées (à savoir un logiciel, un boitier ou une clé, ou des liens) :

☕️ Le Conseil constitutionnel se penche sur les éventuelles conséquences de l’IA sur ses travaux

7.1.1 🖥️ Sites principaux

Par : Martin Clavey

29 novembre 2024 à 08:32

Dans un communiqué, le Conseil constitutionnel annonce mettre en place un « schéma stratégique » autour de l’intelligence artificielle.

Une entrée du Conseil constitutionnel — CC Babyaimeesmom

En termes moins administratifs, l’institution va réfléchir aux conséquences de l’arrivée massive de l’IA générative sur le droit, et particulièrement sur les tâches qui lui incombent.

Il se donne cinq axes à explorer :

structuration d’une veille sur les progrès de l’IA susceptibles d’intéresser directement le fonctionnement du Conseil constitutionnel,
déploiement d’une démarche interne continue de sensibilisation et de formation à l’IA,
structuration d’une démarche partenariale avec la recherche en IA,
expérimentation d’un premier axe de travail appliqué dans la gestion administrative du Conseil
et processus interne de révision annuelle de la stratégie adoptée ce jour.

☕️ Le Conseil constitutionnel se penche sur les éventuelles conséquences de l’IA sur ses travaux

29 novembre 2024 à 08:32

Dans un communiqué, le Conseil constitutionnel annonce mettre en place un « schéma stratégique » autour de l’intelligence artificielle.

En termes moins administratifs, l’institution va réfléchir aux conséquences de l’arrivée massive de l’IA générative sur le droit, et particulièrement sur les tâches qui lui incombent.

Il se donne cinq axes à explorer :

structuration d’une veille sur les progrès de l’IA susceptibles d’intéresser directement le fonctionnement du Conseil constitutionnel,
déploiement d’une démarche interne continue de sensibilisation et de formation à l’IA,
structuration d’une démarche partenariale avec la recherche en IA,
expérimentation d’un premier axe de travail appliqué dans la gestion administrative du Conseil
et processus interne de révision annuelle de la stratégie adoptée ce jour.

Un expert judiciaire accusé d’utiliser une IA pour générer son rapport sur les deepfakes

26 novembre 2024 à 17:18

Expertise hallucinée

Un expert judiciaire accusé d’utiliser une IA pour générer son rapport sur les deepfakes

Au Minnesota, un chercheur de l’université de Stanford appelé par la justice pour son expertise sur les deepfakes est accusé d’avoir utilisé une IA générative pour rédiger son expertise. Dans ce procès, une élue républicaine et un youtubeur remettent en question la loi locale contre les deepfakes en politique.

L’élue républicaine Mary Franson et le youtubeur conservateur Christopher Kohls (connu sous le pseudonyme de Mr Reagan) viennent d’attaquer en justice le dispositif légal récemment mis en place par le Minnesota, qui interdit l’utilisation des deepfakes pour influencer une élection. Selon leur plainte [PDF], cette loi violerait notamment la liberté d’expression permise par le premier amendement de la Constitution des États-Unis, et « créerait une plus dangereuse attaque contre la vérité, l’expression et les élections libres que la question qu’il tente de résoudre ».

Un expert sur la désinformation dans le numérique à la barre

Pour défendre sa loi, l’État du Minnesota a, entre autres, demandé l’expertise d’un chercheur en communication de l’Université de Stanford, Jeff Hancock, par ailleurs directeur de son Social Media Lab, et co-directeur de son Cyber Policy Center.

Si ce docteur en psychologie n’est pas un expert technique des deepfakes, il travaille sur la désinformation dans le numérique et ses effets sociaux et ses connaissances peuvent, a priori, être intéressantes pour discuter des effets des deepfakes sur une élection.

Jeff Hancock a donc rendu, le 1er novembre dernier, son expertise [PDF]. Il y explique, en s’appuyant sur le travail de ses collègues britanniques de l’Université de Loughborough, que « les deepfakes peuvent influencer de manière significative les convictions politiques en présentant de faux récits convaincants et difficiles à réfuter. Le réalisme visuel et auditif des deepfakes peut saper la confiance dans les sources médiatiques légitimes et les institutions politiques, entraînant la confusion et la polarisation du public ».

Une expertise à la bibliographie douteuse

Mais, comme l’a relevé le média local Minnesota Reformer, les avocats de Mary Franson et Christopher Kohls ont demandé que cette expertise soit récusée.

En effet, dans son texte, Jeff Hancock explique aussi que « la difficulté à identifier les deepfakes vient de la technologie sophistiquée utilisée pour créer des reproductions homogènes et réalistes de l’apparence et de la voix d’une personne. ».

Pour l’affirmer, il s’appuie sur une étude qui « a montré que même lorsque les individus sont informés de l’existence des deepfakes, ils peuvent avoir du mal à faire la distinction entre un contenu réel et un contenu manipulé. Cette difficulté est exacerbée sur les plateformes de médias sociaux, où les deepfakes peuvent se propager rapidement avant d’être identifiés et supprimés. ».

Sauf que cette étude ne semble pas exister. En effet, dans sa biographie [PDF], celle-ci est indiquée par la référence :

Hwang, J., Zhang, X., & Wang, Y. (2023). The Influence of Deepfake Videos on Political
Attitudes and Behavior. Journal of Information Technology & Politics, 20(2), 165 - 182.
https://doi.org/10.1080/19331681.2022.215123

Or, comme le font remarquer [PDF] les avocats de Mary Franson et Christopher Kohls, cette étude n’existe pas. Aucun article scientifique ne semble exister sous ce titre. Le DOI (url qui permet de référencer un article même si le site de l’éditeur change) ne renvoie à aucun article.

La revue scientifique Journal of Information Technology & Politics existe bel et bien, mais ne contient pas d’article sur le sujet dans les pages du numéro en question.

De potentielles « hallucinations » d’une IA générative

Pour ces avocats, « la citation présente les caractéristiques d’une « hallucination » de l’intelligence artificielle (IA), ce qui suggère qu’au moins cette citation a été générée par un grand modèle de langage comme ChatGPT ». Et, effectivement, comme nous l’avons déjà expliqué, les modèles de langage peuvent créer des citations de sources inexistantes, attributions de textes imaginaires à des personnes réelles et d’autres affirmations fausses.

Et ils en profitent pour remettre en cause toute l’expertise de Jeff Hancock : « les plaignants ne savent pas comment cette hallucination s’est retrouvée dans la déclaration de Hancock, mais elle remet en question l’ensemble du document ».

Il semble que cette référence n’est pas la seule qui figure dans la bibliographie de l’expert. En effet, Minnesota Reformer pointe aussi la citation suivante dont le DOI ne renvoie lui non plus vers aucune page et dont le titre n’existe nulle part :

De keersmaecker, J., & Roets, A. (2023). Deepfakes and the Illusion of Authenticity:
Cognitive Processes Behind Misinformation Acceptance. Computers in Human Behavior,
139, 107569. https://doi.org/10.1016/j.chb.2023.107569

Ni Jeff Hancock ni le Stanford Social Media Lab n’ont répondu au Minnesota Reformer. Le 16 octobre, la Cour a publié [PDF] un ordre accordant la demande d’exclusion de l’expertise de Jeff Hancock.

Streaming sportif : la justice ordonne le blocage par les DNS de Google, Cloudflare et Cisco

26 novembre 2024 à 13:11

Mensonge imposé

Streaming sportif : la justice ordonne le blocage par les DNS de Google, Cloudflare et Cisco

Jusque-là laissés tranquilles par les ayants droit, les fournisseurs de DNS font maintenant partie de leurs cibles juridiques concernant le streaming. Canal+ vient de nouveau de gagner face à Google, Cisco et Cloudflare : dans trois nouvelles décisions, le Tribunal judiciaire de Paris oblige les trois géants du numérique à bloquer l’accès à certains sites, confirmant sa position prise en mai dernier sur le sujet.

Trois nouvelles décisions du Tribunal judiciaire de Paris, prises en septembre et octobre derniers, obligent Google, Cloudflare et Cisco à mettre en place un blocage de sites internet qui diffusent des flux streaming de retransmission des grands prix de Formule 1 organisés par la Fédération Internationale de l’Automobile, de la Ligue des champions et de la Premier League. Le site Torrent Freak a repéré que Cloudflare a mis en ligne les textes de ces trois décisions [PDF, PDF, PDF] sur la base de données spécialisée Lumen.

Une liste de 69 sites supplémentaires

En mai dernier, nos confrères de l’Informé avaient révélé que la justice française avait, pour la première fois, obligé les fournisseurs de DNS qui ne sont pas fournisseurs d’accès à Internet Google, Cloudflare et Cisco, de bloquer plus d’une centaine de sites de streaming diffusant sans autorisation le Top 14 de rugby, la Champions League et la Premier League de football. Canal+ s’est appuyé sur l’article 333 - 10 du Code du Sport qui permet de demander à la justice de prendre « toutes mesures proportionnées propres à prévenir ou à faire cesser » des « atteintes graves et répétées au droit d’exploitation audiovisuelle ».

Après la publication de cette décision, Cisco, propriétaire d’OpenDNS, a décidé de ne plus rendre disponible ce service en France. L’entreprise a fait de même au Portugal suite à un cas similaire.

Mais le groupe Canal+ ne s’est pas contenté de cette première liste. Il a exposé devant le Tribunal judiciaire de Paris que « de nombreux sites internet accessibles depuis la France diffusent de manière quasi-systématique, gratuitement, en streaming et en direct entre autres les matchs de multiples compétitions, notamment de « Formule 1 » ». Et ce, malgré le blocage de ces sites imposé par la justice aux principaux FAI.

Il a donc réitéré sa demande dans les trois actions en justice en listant 15, 18 et 36 sites internet qui hébergent ces retransmissions.

Une portée internationale non proportionnelle selon Google, Cisco et Cloudflare

De leurs côtés, devant le tribunal, Google, Cisco et Cloudflare ont affirmé que ces mesures étaient « inutilement complexes et coûteuses ». Les trois sociétés arguent qu’il existe d’autres mesures pour bloquer « tout accès aux sites litigieux » et « qu’un nombre négligeable d’internautes des compétitions sportives auraient recours à leurs services ».

Surtout, les trois géants du numérique ont soulevé que « ces mesures ne peuvent techniquement être restreintes au territoire français et ont nécessairement une portée internationale ». Cet argument appuie sur un défaut de proportionnalité de la mesure de blocage au niveau de ces services de résolveurs DNS.

Un délai de trois jours

Les entreprises pointent d’ailleurs le fait que les sites litigieux sont distribués via le CDN de Cloudflare. Google a donc demandé que la demande de blocage se fasse à ce niveau avant que ne soit ordonné le blocage au niveau des résolveurs DNS.

Le tribunal n’a cependant pas été convaincu par leurs arguments. Il a ordonné aux trois entreprises de mettre en place une mesure de blocage des sites listés dans les trois demandes de Canal+. Cisco ayant déjà arrêté son service OpenDNS au moment de ces décisions, l’entreprise n’a rien eu à faire d’autre. Mais Cloudflare et Google ont dû se mettre en conformité dans un délai de trois jours. Elles ont mis en place une manipulation de l’espace des noms de domaine, aboutissant à ce que certains appellent des « DNS menteurs ».

☕️ Phishing de comptes Telegram de députés : l’Office anti-cybercriminalité mène l’enquête

26 novembre 2024 à 09:19

Selon Politico, la justice a déclenché l’enquête sur le piratage de comptes Telegram de plusieurs parlementaires. L’Office anti-cybercriminalité (OFAC), créé il y a moins d’un an, a été saisi par le parquet.

Le média explique que, parmi eux, le député Alexis Corbière (affilé au groupe Écologiste et Social à l’Assemblée) a reconnu avoir été piégé par le phishing, son compte Telegram ayant ensuite envoyé des dizaines de spams à ses contacts. D’autres parlementaires français (sénateurs comme députés) seraient également touchés.

Le message de phishing propose de découvrir « une photo de votre professeure d’école primaire » ou de votre « première amoureuse », puis demande le numéro de téléphone et un code de validation, soulignent les services de l’Assemblée.

La direction des systèmes d’information du Sénat préconise aux élus de la Chambre haute la sécurisation par double authentification et de privilégier la messagerie Tchap.

Les sous-titres de plus de 53 000 films et 85 000 épisodes de séries utilisés pour entraîner des IA

25 novembre 2024 à 14:20

I'll be back

Les sous-titres de plus de 53 000 films et 85 000 épisodes de séries utilisés pour entraîner des IA

Inclus dans la fameuse archive The Pile, un ensemble de sous-titres tirés du site OpenSubtitles est utilisé depuis plusieurs années par des entreprises comme Apple, Anthropic, Meta ou Nvidia pour entraîner leurs IA génératives.

Pour entrainer les modèles de langage, les entreprises d’IA génératives ont besoin de quantités massives de données pour que leurs outils puissent générer des contenus les plus proches possibles de contenus créés par des humains.

Elles utilisent le travail des « data workers » pour obtenir des données. Mais, comme nous l’avons plusieurs fois évoqué ici, elles puisent aussi dans des bases de données de contenus dont la légalité est discutée.

Le système de production de l’IA reproduit et amplifie les dépendances économiques historiques

En début d’année, nous montrions que Midjourney recrache, parfois sans même qu’on le lui demande, des images Pixar et d’œuvres protégées.

Les IA génératives entrainées sur les dialogues du Parrain ou de Pulp Fiction

La semaine dernière, The Atlantic a expliqué que plusieurs de ces modèles utilisent des milliers de sous-titres de films pour leur entrainement. Cela expliquerait que des auteurs de dialogues puissent régulièrement retrouver leur travail dans les réponses des chatbots comme ChatGPT.

Pour le vérifier, le média américain a téléchargé The Pile, une archive déjà pointée du doigt, par exemple dans un procès contre NVIDIA, pour compiler des livres numériques protégés par le copyright. The Atlantic y a recensé plus de 53 000 fichiers de sous-titres de films et 85 000 d’épisodes de séries. Y figurent des films comme Le Parrain, Pulp Fiction ou encore Star Wars: Clone Wars.

IA générative : NVIDIA attaquée pour violation du Copyright

Tous ces sous-titres viennent, de fait, du site de téléchargement de sous-titres Opensubtitles. Si les auteurs de The Pile n’ont pas caché avoir rassemblé près de 20Go de données venant de ce site, l’information a été peu (si ce n’est pas) relevée.

De GPT-3 à de récents modèles d’Apple

L’archive The Pile n’a pas seulement été utilisée par NVIDIA. GPT-3 d’OpenAI est cité comme exemple par le site du groupe de recherche EleutherAI qui a créé l’archive, même si OpenAI a détruit les jeux de données avec lesquels elle a entrainé ses premiers modèles.

Les modèles OPT de Meta, en 2022, et les modèles OpenELM d’Apple, créés en avril dernier, s’appuient aussi sur The Pile, expliquent dans leurs articles les chercheurs des deux entreprises [PDF, PDF]. Et sur Hugging Face, plus de 220 modèles utilisant cette archive sont recensés.

Les sous-titres, une source pour le rythme et le style des discussions orales

Si les livres utilisés par les entreprises d’IA génératives pour entraîner leurs IA leur permettent de générer des textes proches de ce que peuvent créer les écrivains, les sous-titres leur amènent d’autres données précieuses sur la langue. Ils sont une source d’information importante sur la façon dont sont rythmées nos conversations, ainsi que le style linguistique que les humains utilisent à l’oral.

Sur son site, le syndicat des auteurs britanniques WGGB a réagi en affirmant que les écrivains « sont à juste titre en colère et préoccupés par cette nouvelle ». Il indique s’opposer « fermement à cette mainmise sur le travail des écrivains et a mené une campagne et un lobbying acharnés sur cette question ». Il demande à ce que les auteurs soient rémunérés pour l’utilisation de leur travail de cette manière et qu’un organisme de régulation soit mis en place.

The Atlantic a créé un petit outil permettant de rechercher les sous-titres de tel film, telle autrice ou tel acteur.

☕️ Indisponibilité des modèles multimodaux de Meta : la CNIL dénonce un « exercice de communication »

25 novembre 2024 à 11:34

Dans une interview au journal Le Monde, Marie-Laure Denis, présidente de la CNIL, appelle à relativiser le discours de Meta à propos de l’impossibilité d’entrainer ses IA génératives sur les contenus de ses réseaux et de distribuer ses modèles en Europe. L’entreprise a affirmé en juillet dernier qu’elle ne distribuerait ni ses modèles ni des outils qui les utilisent (comme les lunettes co-fabriquées avec Rayban) en évoquant « la nature imprévisible de l’environnement réglementaire européen ».

des nuages de données s'échappent des cheminées de petites maisons dessinées en rang d'oignon

Pour elle, il ne faut pas « se laisser abuser par un exercice de communication qui intervient à un moment où la gouvernance européenne est en transition et où se négocient les modalités d’application des réglementations numériques de l’UE : le Digital Markets Act, le Digital Services Act et l’AI Act ».

« Ce n’est pas parce que des données ont été rendues publiques qu’elles ne peuvent pas être personnelles », réaffirme la responsable de l’autorité française. Dès lors, les entreprises qui voudraient utiliser ces données doivent s’appuyer sur une base légale prévue par le RGPD pour avoir l’autorisation de traiter ces éventuelles données personnelles.

Dans cette même interview, Marie-Laure Denis explique que « la CNIL est tout à fait en phase » avec la proposition du gouvernement de simplifier ses procédures d’autorisation et de favoriser les simples déclarations de conformité pour les recherches en IA sur des données de santé.

Concernant l’hébergement de la plateforme de données Health Data Hub par Microsoft, elle affirme que « la CNIL a toujours appelé à son hébergement souverain ». Elle rappelle l’existence de la nouvelle loi de mai 2024 visant à « sécuriser et à réguler l’espace numérique » et explique que la CNIL doit encore rendre un avis sur les conditions d’application de ce texte. « En attendant, nous avons autorisé ponctuellement une trentaine de projets sur cette plateforme, afin de ne pas bloquer la recherche », ajoute-t-elle.

Vue lecture

IPTV and (don't) chill

91 % des internautes consomment des contenus culturel ou sportif dématérialisés

Une estimation de 1,5 milliard d’euros de manque à gagner

11 % de consommateurs d’IPTV illicites

IPTV and (don't) chill

91 % des internautes consomment des contenus culturel ou sportif dématérialisés

Une estimation de 1,5 milliard d’euros de manque à gagner

11 % de consommateurs d’IPTV illicites

Expertise hallucinée

Un expert sur la désinformation dans le numérique à la barre

Une expertise à la bibliographie douteuse

De potentielles « hallucinations » d’une IA générative

Mensonge imposé

Une liste de 69 sites supplémentaires

Une portée internationale non proportionnelle selon Google, Cisco et Cloudflare

Un délai de trois jours

I'll be back

Les IA génératives entrainées sur les dialogues du Parrain ou de Pulp Fiction

De GPT-3 à de récents modèles d’Apple

Les sous-titres, une source pour le rythme et le style des discussions orales