6  Organisation du code et manipulations avancées

Ce chapitre vise surtout à synthétiser quelques trucs et astuces pour se faciliter la vie dans l’utilisation de R.

6.1 La notion de “projet” dans RStudio

Tout au long de ces chapitres, nous avons créé différents scripts R rassemblés dans un dossier “Formation R”. Une bonne pratique est de créer un “projet” pointant vers le dossier des scripts qui ont une cohérence ensemble (un projet de recherche par exemple), les données afférentes, etc.

Ce dossier projet peut être créé en cliquant en haut à droite sur “Project: (None)”, puis “New Project” et ici “Existing Directory” (on sélectionnera alors le dossier Formation R.

Ce dossier peut contenir plusieurs sous-dossiers :

  • Script

  • Data

  • Output (là où éventuellement on rassemble ses graphiques et autres jolis tableaux)

L’intérêt de fonctionner par projet est que RStudio va ensuite automatiquement pointer vers le dossier racine (Formation R) quand le projet est ouvert et on accèdera plus facilement à ses fichiers dans le Files et en écrivant le chemin d’accès dans ses scripts.

6.2 Organiser son code et ses fichiers

Il est assez courant de commencer un projet et d’y revenir des mois voire des années plus tard.

Que faire quand on a tout oublié ?

Si on a bien structuré son code, ce qu’on peut faire en ajoutant des sections, dans son script, on s’y retrouve plus facilement :

# Ceci marque une section ------------------------------

On peut aussi commenter allégrement ses différentes opérations pour s’y retrouver :

#Le dièse permet d'initier un commentaire
# Quand on doit faire un long commentaire,
# on peut écrire sans dièse, puis surligner le tout,
# et taper Cmd (ou Ctrl)+Maj+C et le bloc sera mis en
# commentaire !

Il est aussi assez courant de créer différents scripts pour différents types d’opérations (mais ça dépend de ses habitudes), par exemple :

  • Un script ou des script(s) où je réalise tous les recodages nécessaires à l’analyse et j’enregistre ma base avec les nouvelles variables (en format R, rds plutôt).

  • Un ou des script(s) où je réalise toutes les opérations d’analyse.

On pourra si on le souhaite créer différents fichiers suivant l’avancement du projet et indiquer la date dans le titre. Ainsi, le fichier de recodage pourra s’appeler “20250602Recodages.R” (la date est mise dans le format AAAAMMJJ pour être sur que les fichiers soient présentés du plus ancien au plus récent dans le dossier où ils sont stockés.

6.3 Obtenir de l’aide

Listons ici quelques manières d’avoir de l’aide quand le script buggue :

  • Le premier réflexe est de chercher comment s’utilise une fonction dans R :
?mean #le point d'interrogation ouvre la page de description de la fonction
  • On peut aussi taper son problème dans son moteur de recherche, qui renvoie souvent vers le forum Stackoverflow (mais pas que) où le problème auquel on fait face a été discuté (généralement, en anglais)

  • On peut consulter les guides de formation à R mentionnés sur la page de présentation de ce guide.

6.4 La jointure de différents fichiers statistiques

Nous n’avons pas ici parlé de la jointure de différents fichiers statistiques, opération pourtant courante. Cette page de utilitR est très complète pour mener ces opérations sans trop se prendre la tête : https://book.utilitr.org/03_Fiches_thematiques/Fiche_joindre_donnees.html.

6.5 Les étiquettes de variables et de valeurs

Enfin, nous avons ici travaillé à partir de variables qui n’ont pas d’étiquettes et dont les modalités des variables catégorielles n’ont pas de labels. C’est pourtant possible (voire courant, si on charge un fichier Stata dans R) et plutôt pratique :

  • On a ainsi des étiquettes déjà prêtes pour les tableaux / graphiques

  • On va bien plus vite dans le recodage et surtout on évite les erreurs (recoder 1 en 3 va plus vite et comprend moins de risque d’erreur que recoder “Cadres et professions scientifiques” en “Classes supérieures”).

On se reportera aux Chapitres 11 et 12 de guide-R qui introduisent à ces concepts et leur usage.

6.6 Exercices

Exercice

Créer un Projet pointant sur le dossier de la Formation R. Commenter et créer des sections dans l’un de ses scripts. Pas facile ? D’où l’intérêt de le faire au fur et à mesure :)