Pour ce projet, le contexte était qu’en tant que deux jeunes d’une association, nous souhaitions sensibiliser aux dangers routiers. Afin de mener à bien notre mission, nous avions en notre possession une base de données officielle d’accidents réalisés en France allant de 2005 à 2021. Cette base de données a été réalisée par des officiers de police durant cette période. Chaque duo s’est vu attribuer des domaines de recherche plus précis afin de mener une campagne plus précise. Nous avons donc eu à réaliser une étude pour les personnes de plus de 65 ans dans la région Nouvelle-Aquitaine.
Pendant cette première partie, nous avons en premier lieu commencé par examiner la base de données fournie ainsi que les différents attributs la constituant. Suite à ce premier examen, nous avons pu remarquer que la base de données comportait parfois des erreurs de saisie mais aussi une différence de format pour certains attributs. Nous avons donc dû nettoyer cette base de données afin de créer des tables SQL comportant les différentes informations nécessaires à notre étude, tout en supprimant celles qui ne nous concernaient pas. Durant cette partie, nous avons été aidés par le sujet qui nous a guidés afin de mener à bien ce processus. Une fois les tables contenant les informations désirées, il a fallu les exporter sous un format CSV afin que ces données puissent être utilisées en R.
Une fois le tri et l’extraction de données réalisés en SQL, il a fallu observer ces données et créer des paramètres intéressants afin de créer des graphiques en langage R. Ces graphiques devaient apporter des informations correctes et pertinentes pour notre cas d’étude. Cependant, il nous a vite semblé qu’il manquait un certain nombre de données essentielles afin de produire des graphiques pertinents. Nous avons notamment regretté qu’il n’y ait pas de données sur le nombre d’usagers total par tranche d'âge, cette inconnue nous empêchant un grand nombre d’analyses pertinentes. Il y a donc eu un long travail de recherche mais aussi d’apprentissage car le R est un langage dans lequel nous avons que très peu de connaissances et d’affinités, mon binôme et moi. Une fois ce travail de création de graphiques, nous avons généré un PDF contenant ces graphiques ainsi que leur analyse en anglais.
Ainsi, au cours de ce projet, nous avons trié, transformé, extrait et analysé une base de données afin de produire un compte rendu complet en anglais ayant pour but de sensibiliser les personnes de plus de 65 ans dans la région Nouvelle-Aquitaine aux risques auxquels elles sont le plus exposées sur la route.