# Ceci marque une section ------------------------------
6 Organisation du code et manipulations avancées
Ce chapitre vise surtout à synthétiser quelques trucs et astuces pour se faciliter la vie dans l’utilisation de R.
6.1 La notion de “projet” dans RStudio
Tout au long de ces chapitres, nous avons créé différents scripts R rassemblés dans un dossier “Formation R”. Une bonne pratique est de créer un “projet” pointant vers le dossier des scripts qui ont une cohérence ensemble (un projet de recherche par exemple), les données afférentes, etc.
Ce dossier projet peut être créé en cliquant en haut à droite sur “Project: (None)”, puis “New Project” et ici “Existing Directory” (on sélectionnera alors le dossier Formation R.
Ce dossier peut contenir plusieurs sous-dossiers :
Script
Data
Output (là où éventuellement on rassemble ses graphiques et autres jolis tableaux)
L’intérêt de fonctionner par projet est que RStudio va ensuite automatiquement pointer vers le dossier racine (Formation R) quand le projet est ouvert et on accèdera plus facilement à ses fichiers dans le Files et en écrivant le chemin d’accès dans ses scripts.
6.2 Organiser son code et ses fichiers
Il est assez courant de commencer un projet et d’y revenir des mois voire des années plus tard.
Que faire quand on a tout oublié ?
Si on a bien structuré son code, ce qu’on peut faire en ajoutant des sections, dans son script, on s’y retrouve plus facilement :
On peut aussi commenter allégrement ses différentes opérations pour s’y retrouver :
#Le dièse permet d'initier un commentaire
# Quand on doit faire un long commentaire,
# on peut écrire sans dièse, puis surligner le tout,
# et taper Cmd (ou Ctrl)+Maj+C et le bloc sera mis en
# commentaire !
Il est aussi assez courant de créer différents scripts pour différents types d’opérations (mais ça dépend de ses habitudes), par exemple :
Un script ou des script(s) où je réalise tous les recodages nécessaires à l’analyse et j’enregistre ma base avec les nouvelles variables (en format R, rds plutôt).
Un ou des script(s) où je réalise toutes les opérations d’analyse.
On pourra si on le souhaite créer différents fichiers suivant l’avancement du projet et indiquer la date dans le titre. Ainsi, le fichier de recodage pourra s’appeler “20250602Recodages.R” (la date est mise dans le format AAAAMMJJ pour être sur que les fichiers soient présentés du plus ancien au plus récent dans le dossier où ils sont stockés.
6.3 Obtenir de l’aide
Listons ici quelques manières d’avoir de l’aide quand le script buggue :
- Le premier réflexe est de chercher comment s’utilise une fonction dans R :
#le point d'interrogation ouvre la page de description de la fonction ?mean
On peut aussi taper son problème dans son moteur de recherche, qui renvoie souvent vers le forum Stackoverflow (mais pas que) où le problème auquel on fait face a été discuté (généralement, en anglais)
On peut consulter les guides de formation à R mentionnés sur la page de présentation de ce guide.
…
6.4 La jointure de différents fichiers statistiques
Nous n’avons pas ici parlé de la jointure de différents fichiers statistiques, opération pourtant courante. Cette page de utilitR est très complète pour mener ces opérations sans trop se prendre la tête : https://book.utilitr.org/03_Fiches_thematiques/Fiche_joindre_donnees.html.
6.5 Les étiquettes de variables et de valeurs
Enfin, nous avons ici travaillé à partir de variables qui n’ont pas d’étiquettes et dont les modalités des variables catégorielles n’ont pas de labels. C’est pourtant possible (voire courant, si on charge un fichier Stata dans R) et plutôt pratique :
On a ainsi des étiquettes déjà prêtes pour les tableaux / graphiques
On va bien plus vite dans le recodage et surtout on évite les erreurs (recoder 1 en 3 va plus vite et comprend moins de risque d’erreur que recoder “Cadres et professions scientifiques” en “Classes supérieures”).
On se reportera aux Chapitres 11 et 12 de guide-R qui introduisent à ces concepts et leur usage.