Hackaviz 2022 : financement par la copie privée en France.
Not speaking french? Please find the english version.
Mimi and Eunice, You may be right, CC-BY-SA Nina Paley, mars 2011
Nous vous proposons dans un jeu de données inédit issu du site AidesCreation.org. Ce site compile une base de données des financements collectés et distribués par les organismes de gestion collective des droits d’auteur, au titre de la rémunération pour copie privée.
Ce jeu de données est réparti sur trois fichiers. Il est possible de faire de belles visualisations à partir d’un seul de ces fichiers. Vous pouvez aussi les combiner, mais il n’est pas certain que la plus belle histoire ait besoin de toutes ces données.
Cette année, pas de données géographiques, mais des données à exploiter sous forme de texte. C’est l’occasion de découvrir le vaste domaine de l’analyse lexicale ou d’affûter vos meilleurs algorithmes.
Retrouvez les règles et les modes d’évaluation sur la page des règles de l'Hackaviz de l’association Toulouse DataViz (TDV).
N’hésitez pas à nous contacter sur le discord du Toulouse DataViz pour discuter entre participants, si vous avez besoin d’aide à propos des données ou pour rapporter des erreurs dans le jeu de données.
Bonne chance !
Description générale des données
Chaque jeu de données est disponible sous forme de deux fichiers, l’un sous
forme de données tabulaires au format
.csv
pour
votre outil de traitement de données préféré, et l’autre au format ouvert
.xlsx
pour Microsoft Excel,
LibreOffice ou votre tableur préféré.
Pour télécharger un fichier de données, placez la souris sur le nom du fichier, faites un clic droit et choisir “Enregistrer la cible du lien sous …”.
Format de fichiers CSV
Fichier de données | Contenu |
---|---|
actions_culturelles_soutenues.csv |
actions culturelles soutenues par la rémunération sur la copie privée |
agregation_par_organisme.csv |
résumé par organisme collecteur et par type d’aide |
collecteurs.csv |
descriptif des organismes collecteurs |
Une archive (.zip
) est aussi disponible pour
télécharger
toutes les données.
- Les fichiers sont encodés en UTF-8.
- Les fichiers
csv
utilisent le séparateur de colonne “,
” et le caractère décimal “.
”. - Ces
csv
ont été exportés depuis un paramètre régional anglais. Pensez à modifier les paramètres d’import de votre logiciel préféré ! - Si vous avez des difficultés à importer ces
csv
, nous vous proposons une alternative sous forme de fichier au format Microsoft Excel.
Format de fichiers XLSX
Fichier de données | Contenu |
---|---|
actions_culturelles_soutenues.xlsx |
actions culturelles soutenues par la rémunération sur la copie privée |
agregation_par_organisme.xlsx |
résumé par organisme collecteur et par type d’aide |
collecteurs.xlsx |
descriptif des organismes collecteurs |
Jointures
- Nous avons pris le soin d’unifier le nom de la colonne
collecteur
des fichiers afin que vous puissiez faire des jointures. - Vous n’avez aucune obligation à fusionner ces fichiers : pensez d’abord à l’histoire que vous voulez raconter !
- Pour joindre deux
csv
, vous pouvez utiliser un modèle ObservableHQ, des librairies comme python Pandas ou R dplyr ou le coder directement.
Format des valeurs
- Les montants ont été arrondis à l’euro près.
- Les dates sont des années au format AAAA.
Description détaillée des données
Description du fichier actions_culturelles_soutenues.csv
Actions culturelles soutenues par la rémunération pour copie privée
-
Ce fichier contient la description de bénéficiaires (auteurs, société de production ou tout autre membre de l’organisme collecteur), le projet culturel et le montant associé.
-
Définitions
- Organisme collecteur : société par laquelle des auteurs peuvent gérer les droits d’auteur associés à leur œuvre. En centralisant cette gestion, ces sociétés facilitent la collecte et le versement des droits d’auteur.
- Œuvre : Une œuvre d’art est une création artistique ou esthétique.
- Droit d’auteur : ensemble des droits sur l’utilisation et à la diffusion d’une œuvre d’art.
- Bénéficiaire : auteur ou auteure de l’œuvre d’art ou ses ayants droit : éditeur, société de production ou héritiers
- Copie privée : exception au droit d’auteur, qui permet aux particuliers de copier des œuvres pour leur usage privé. Une part du prix d’un support d’enregistrement ou d’un appareil de reproduction de l’œuvre sert à rémunérer les auteurs et auteures.
-
Notes sur les données
- Les projets bénéficiaires sont recueillis de l’année 2016 à 2021.
- Les noms des bénéficiaires ont été consolidés au mieux (exemple:
les variations
1d Zik
,1D Zik
,1D ZIK
,1D ZIK production
,1D ZIK prod
sont regroupées sous le nom1d Zik
) mais il est possible qu’il reste des valeurs non consolidées. - De la même manière, la description des projets a été consolidée.
- Les descriptions trop longues peuvent être tronquées.
- Le règlement de l’Hackaviz stipule qu’il vous est interdit de récupérer des données autres que celles fournies : vous pouvez vous renseigner sur un chanteur ou une société de production pour raconter votre histoire mais vous ne pouvez inclure ni sa bibliographie, ni sa discographie dans votre dataviz.
Cette description est disponible sous forme de fichier .csv
meta_actions_culturelles_soutenues.csv.
nom colonne | description | type_valeur | exemple |
---|---|---|---|
collecteur | code de l’organisme collecteur sous forme d’acronyme | chaîne de caractères | SACEM |
annee | année du projet recevant la collecte des droits d’auteur | entier | 2017 |
aide | type de soutien | chaîne de caractères | diffusion du spectacle vivant |
beneficiaire | nom du bénéficiaire | chaîne de caractères | 03H50 |
projet | description du projet | chaîne de caractères | Tournées et showcases hors France - musiques actuelles et jazz - Marianne Dissard |
montant | montant reçu en euros | entier | 1500 |
oeuvre | type d’oeuvre d’art soutenue | chaîne de caractères | Concert |
Description du fichier agregation_par_organisme.csv
Résumé par organisme collecteur et par type d’aide, année par année
- Ce fichier contient une ligne pour chaque organisme collecteur et pour chaque type d’aide.
- Les colonnes sont, pour chaque année, le nombre de bénéficiaires et la somme totale versée.
Cette description est disponible sous forme de fichier .csv
meta_agregation_par_organisme.csv.
nom colonne | description | type_valeur | exemple |
---|---|---|---|
collecteur | code de l’organisme collecteur sous forme d’acronyme | chaîne de caractères | SACEM |
type_daide | type de soutien | chaîne de caractères | diffusion du spectacle vivant |
nb_aides_2016 | nombre d’aides délivrées pour l’année 2016 | entier | 160 |
montant_2016 | montant total en euros des aides délivrées en 2016 | entier | 1725108 |
nb_aides_2017, montant_2017, … | idem pour les années suivantes | 223 |
Description du fichier collecteurs.csv
Description des organismes collecteurs
- Ce fichier contient la description des organismes collecteurs.
- Les membres d’un organisme sont les artistes couverts par cet organisme. Ils sont classés par ordre alphabétique et sont séparés par une virgule.
Cette description est disponible sous forme de fichier .csv
meta_collecteurs.csv.
colonne | description | type_valeur | exemple |
---|---|---|---|
collecteur | code de l’organisme collecteur sous forme d’acronyme | chaîne de caractères | SACEM |
libelle | nom complet de l’organisme | chaîne de caractères | Société Des Auteurs, Compositeurs Et Éditeurs De Musique |
œuvre | type d’œuvre d’art couvert par l’organisme | chaîne de caractères | Musique |
date_creation | année de création de l’organisme | entier | 1851 |
membres | artistes ou producteurs et productrices, membres de l’organisme | chaîne de caractères | arrangeur,auteur,auteur de doublage sous titrage,auteurs réalisateur,compositeur,éditeur |
nb_membres | nombre de membres | entier | 182520 |
nb_membres_annee | année où ce nombre de membres a été relevé | entier | 2021 |
URL | adresse du site Internet | chaîne de caractères | https://www.sacem.fr/ |
Sources des données
- Les données issues du site AidesCreation.org.
- Ce site est édité par l’association “la Culture avec la Copie privée” qui a pour but de promouvoir la rémunération par la copie privée. La directrice de publication n’est autre que la présidente d’un des organismes collecteurs (SOFIA). Enfin, cette association a pour membres, les 17 organismes collecteurs qui alimentent la base de données.
Historique des versions
- Décembre 2021: consolidation des fichiers et génération du readme et export sous R et Visual Studio Code.
Conditions générales d’utilisation
-
Ce jeu de données est proposé par l’association Toulouse DataViz dans le cadre du concours Hackaviz afin de promouvoir la visualisation de données. Ce jeu de données est utilisé à des fins pédagogiques en permettant aux participants et participantes de créer leurs visualisations.
-
Les données sources proviennent d’organisations officielles qui les publient sur Internet sans licence connue. Ces données, énumérées dans la section précédente, ont été traitées par l’équipe de l’association Toulouse Dataviz pour enrichir leur contenu informationnel. L’association Toulouse Dataviz ne saurait garantir l’exactitude, la complétude et l’actualité ni des jeux de données sources ni des traitements effectués sur ces données.
-
Les visualisations produites à l’issue de ce concours en temps limité n’engagent pas la responsabilité de l’association Toulouse Dataviz.
-
Le jeu de données est à l’usage exclusif de l’Hackaviz. Pour toutes autres utilisations, veuillez contacter l’association Toulouse Dataviz.