You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

sujet.org 3.0KB

4 years ago
3 years ago
4 years ago
1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253
  1. #+TITLE: Sujet UE Entropôt
  2. #+SUBTITLE: Construction d'un entrepôt
  3. #+AUTHOR: Maxime Wack et Anne-Sophie Jannot
  4. #+date: 24 novembre 2020
  5. * Objectif
  6. Intégrer des données dans un entrepôt de données *au format i2b2*.
  7. * Données à intégrer
  8. Datasets =pbc= et =pbcseq= provenant du package =survival= de *R*.
  9. * Consignes
  10. *Tous les patients* doivent être intégrés.
  11. *Toutes les données* concernant ces patients et contenues dans les deux datasets doivent être intégrées :
  12. - données démographiques
  13. - visites
  14. - diagnostique (considérée consultation)
  15. - de suivi (consultations et/ou hospitalisations)
  16. - dernière visite (hospitalisation ou consultation)
  17. - diagnostics
  18. - biologies
  19. - traitements
  20. Ceci doit être fait de telle manière que toutes les relations entre les tables fonctionnent. Les données doivent pouvoir être requêtables depuis l'interface web.
  21. *Bien lire* les pages d'aide des datasets pour obtenir le détail des variables recueillies, leur codage, les conditions de recueil, etc.
  22. Il vous faudra transformer, manipuler et augmenter les données afin de correspondre aux schémas des tables i2b2 et simuler le processus d'acquisition des données sous forme de visites à l'hôpital.
  23. Vous devrez également faire des choix sur les méthodes de représentation des données à intégrer. Vous pouvez créer de nouveaux codes ou vocabulaires si nécessaire, mais il doit être fait une utilisation au mieux des options de représentation fournies dans cette version d'i2b2. Le cas échéant les nouveaux codes et vocabulaires doivent être fonctionnels et requêtables depuis l'interface web.
  24. Vous devrez expliciter vos choix de représentation des données, et de production des tables à intégrer.
  25. * Format de rendu
  26. Vous devrez produire des fichiers contenant les données prêtes à être intégrées à l'aide de [[https://www.postgresql.org/docs/9.2/sql-copy.html][la commande ~COPY (…) FROM~ de postgresql]], avec la convention de nommage suivante :
  27. ~bdd.table.csv~
  28. Ces fichiers contiendront les données à ajouter respectivement à chaque /table/ de chaque /bdd,/ pour chaque fichier que vous fournirez. Ils doivent être au format CSV US (séparateur de champs = "=,=", séparateur de décimales = "=.=").
  29. Vous devrez produire un rapport expliquant votre stratégie d'intégration et justifiant vos choix de représentation, de formatage, et de transformation des données.
  30. Vous préparerez une présentation orale de 10 minutes exposant ces mêmes points et dans laquelle vous présenterez une implémentation fonctionnelle de votre intégration de données dans une VM i2b2, avec des exemples de requêtes via l'interface web comportant de multiples critères croisés (pensez à amener de quoi vous brancher en VGA pour projeter si vous comptez faire une démonstration live (/attention aux démos live, c'est risqué !/))
  31. * Bonus
  32. Reproduction d'un ou plusieurs des résultats descriptifs de l'article référencé dans les pages d'aide des datasets, à partir d'extractions de votre entrepôt.