====== Rassemblement des données et idées sur l'Applied 4800 ====== (pour connaître la syntaxe d'écriture sur dokuwiki voir : [[wiki:syntax | ici]]) Dans ce document seront rassemblées les différentes données et idées susceptibles d'aider à l'intégration de la gestion du spectromètre Applied 4800 MALDI ToF-ToF dans ePims (et à la gestion des données avec cet appareil de manière générale). Plusieurs particularités dans ce type de machine : * Contrairement aux autres machines Applied qui génèrent des fichier WIFF, la série des 4000 utilise une base de données Oracle pour le stockage des analyses. L'accès aux spectres est donc plus compliqué. * l'applied 4800 est de type MALDI (Matrix Assisted Laser Desorption Ionisation) et utilise donc des plaques (les matrices) sur lesquelles sont déposées un ou plusieurs échantillons répartis sur plusieurs centaines de spot (jusqu'à 1600 spots par plaque). 1 plaque est utilisée dans 1 série d'analyse. * Des méthodes d'analyses (Acquisitions/Processing/Interprétation pour MSMS) sont utilisées et doivent être sauvegardées ===== Les différents composants et logiciels de la problématique ===== ==== La base de données (Oracle) ==== Version : (?) \\ Login/MdP n°1 : tsquared/ts \\ Login/MdP n°2 : system/ts \\ Les bases contenues sur le serveur présent sur la machine de l'applied à la plateforme du CHU de Grenoble sont : {{wiki:epims4_0m2:admin:oracle-db.jpg}} A voir si le cas est identique sur les autres installations de l'applied? === Rôle de chaque base === Apparemment CIB-MS4800 et TSQUARED sont 2 copies (ou 2 instances) de la même base. Selon Veronique Hourdel, WALLACEDB serait une autre copie servant d'accès à ProteinPilot (le logiciel d'analyse des résultats) (a modifier si j'ai mal compris ^^). === Schémas === {{wiki:epims4_0m2:admin:schema_db_tsquared.png?510x485}} (cliquer pour voir le schéma dans sa taille originel) Liste des tables des bases CIB-MS4800, TSQUARED et probablement WALLACEDB 1 ADMIN_SETTING 2 ADMIN_SETTING_DEF 3 ARCHIVE_HISTORY 4 ARCHIVE_HISTORY_DETAIL 5 ARCHIVE_KEY 6 ARCHIVE_OBJECT 7 BROWSER 8 BROWSER_COLUMN 9 BROWSER_COLUMN_DEF 10 CAL_MATRIX 11 CAL_PARAM_DEF 12 COMPOUND 13 FOLDER_OBJECT 14 JOB 15 JOB_ITEM 16 JOB_RUN 17 JOB_RUN_ITEM 18 LCMALDI_PEAK 19 LCMALDI_PEAK_LIST 20 MALDI_PLATE 21 MALDI_PLATE_INSTANCE 22 MALDI_PLATE_TYPE 23 METHOD 24 METHOD_SET_ITEM 25 OBJECT_TYPE 26 OVERRIDE_PARAM_SET 27 OVERRIDE_PARAM_VALUE 28 PARAMETER 29 PARAM_VALUE 30 PEAK 31 PEAK_COMPOUND_MAP 32 PEAK_LIST 33 QUERY 34 QUERY_ATTR 35 QUERY_ATTR_DEF 36 REF_MASS 37 RESULT 38 RUN_STATUS_DEF 39 SAMPLE_INSTANCE 40 SEARCH_PATTERN 41 SOURCE_CONTAINER 42 SPECTRUM 43 SPOT 44 SPOT_INFO 45 SPOT_SET 46 SPOT_SET_MAP 47 SPOT_SET_TEMPLATE 48 SPOT_TYPE 49 TEMP_DIRECTORY_LIST 50 TEMP_KEY 51 TEMP_METHOD_LIST 52 TEMP_PARM_LIST 53 TEMP_PATH_LIST 54 TEMP_PLATE_LIST 55 TSQUARED_LOG 56 TSQUARED_USER 57 UI_TAG 58 UI_TAG_ENUM === Les dumps === == Dump complet de la base == (a compléter) == Dump d'un spotset en particulier == Fichier de la forme spotset_[spotset_name].dmp accompagné d'un .log. \\ Tables concernées par le dump : 1 ADMIN_SETTING 2 ADMIN_SETTING_DEF 3 ARCHIVE_HISTORY 4 ARCHIVE_HISTORY_DETAIL 5 CAL_MATRIX 6 CAL_PARAM_DEF 7 FOLDER_OBJECT 8 JOB 9 JOB_ITEM 10 JOB_RUN 11 JOB_RUN_ITEM 12 LCMALDI_PEAK 13 LCMALDI_PEAK_LIST 14 MALDI_PLATE 15 MALDI_PLATE_INSTANCE 16 MALDI_PLATE_TYPE 17 METHOD 18 OBJECT_TYPE 19 PARAMETER 20 PARAM_VALUE 21 PEAK 22 PEAK_LIST 23 REF_MASS 24 RESULT 25 RUN_STATUS_DEF 26 SAMPLE_INSTANCE 27 SOURCE_CONTAINER 28 SPECTRUM 29 SPOT 30 SPOT_INFO 31 SPOT_SET 32 SPOT_SET_MAP 33 SPOT_TYPE 34 TSQUARED_USER Tables non concernées par le dump (différence par rapport à la liste des tables des bases CIB-MS4800, TSQUARED et probablement WALLACEDB) 1 ARCHIVE_KEY 2 ARCHIVE_OBJECT 3 BROWSER 4 BROWSER_COLUMN 5 BROWSER_COLUMN_DEF 6 COMPOUND 7 METHOD_SET_ITEM 8 OVERRIDE_PARAM_SET 9 OVERRIDE_PARAM_VALUE 10 PEAK_COMPOUND_MAP 11 QUERY 12 QUERY_ATTR 13 QUERY_ATTR_DEF 14 SEARCH_PATTERN 15 SPOT 16 SPOT_SET_TEMPLATE 17 TEMP_DIRECTORY_LIST 18 TEMP_KEY 19 TEMP_METHOD_LIST 20 TEMP_PARM_LIST 21 TEMP_PATH_LIST 22 TEMP_PLATE_LIST 23 TSQUARED_LOG 24 UI_TAG ==== 4000 Series Explorer (4000SE) ==== Le logiciel permettant le pilotage du 4800 permet d'exporter un certains nombres d'informations. - Description du spotset (XML) - Description des méthodes d'acquisition/processing/interprétation (XML) - Spectre de chaque acquisition (T2D) ==== T2D Extractor ==== ===== Extraction et formats de données disponibles ===== **Nota :** \\ Concernant le CHU de Grenoble les données à sauvegarder doivent être : * les fichiers T2D (les spectres) * la description du spotset (l'ensemble des spots de la plaque sous 4000 Series Explorer (4000SE) * la description des méthodes d'analyse * le lien avec l'échantillon dans ePims * si possible le numéro de la cible utilisée ==== Fichiers de spectres (.T2D) ==== plusieurs possibilités existent pour les extraire de la base de données. - Utiliser T2DE en stand-alone : les utilisateurs extraient "manuellement" l'ensemble des spectres d'un spotset choisi. - Intégrer la logique de T2DE dans eP-Back : extraction automatique des T2D de la base pour les spotset choisi. - Utiliser 4000SE : export manuel des T2D associés à chaque acquisition (sélection et export de masse possible) Afin de faire le lien avec le reste des données il faudra selon la méthode d'extraction choisi : - (T2DE stand-alone) se baser sur le nom du fichier et/ou sur le nom du répertoire de stockage des fichiers. T2DE créé, dans le dossier spécifié //spectra_dest_dir//dans le fichier de configuration t2de.ini, une arborescence commençant par le nom du spotset choisi. Les .T2D se trouvent sous les dossiers : * [spectra_dest_dir]/[spotset_name]/spectra/MS/T2D * [spectra_dest_dir]/[spotset_name]/spectra/MSMS/T2D * Les fichiers sont nommé de la façon suivante : * Spectre MS : Fa_20080603-Well_A1_27340_1811305.t2d => [spotset_name]-Well_[spot_label]_[job_id]_[job_item_id].t2d * Spectre MS/MS : Fa_20080603-Well_A1_524,13_27342_1811316.t2d => [spotset_name]-Well_[spot_label]_[precursor_mass]_[job_id]_[job_item_id].t2d - (T2DE intégré a eP-back) se baser sur le choix du spotset de l'utilisateur et aller rechercher dans la base les T2D. **/!\A compléter (schéma de la base etc...)** - (4000SE) Sur le nom du fichier et/ou sur le nom du répertoire de stockage des fichiers. 4000SE extrait les T2D dans un chemin à la racine de l'application. Chemin correspondant au chemin spécifié dans l'application. Exemple : [4000SE_home]/Morgane/test methodes/[spotset_name] * Les fichiers sont nommé de la façon suivante : * Spectre MS : **/!\A Chercher** * Spectre MS/MS : 1008_MSMS_1075.5363_6.t2d + un fichier .cal au nom identique (avec rajout de "-1" à la fin) => [spot_label]_[analysis_type]_[precursor_mass]_[un_chiffre].t2d ==== Description des Spotset ==== Les spotset contiennent des informations sur l'ensemble des analyses effectuées sur chaque spot. Ces informations peuvent être extraites de 2 façons différentes : **1.** Dans le 4000SE : Exporter un fichier XML contenant la description complète du **SpotSet**. (méthode d'export : File -> Database export -> Add -> Spotset -> Choisir le Spotset voulu). Ce fichier XML contient les informations suivantes (entres beaucoup d'autres) : * Une liste des run effectués sur ce spotset (**JobRun**). Dans chaque run : * un //id// * le job sur lequel il à été effectué : //jobId// * numéro du run (1er run du spotset : 1; 2e run : 2; etc...) : //jobRunNumber// * méthode d'interprétation pour les run MS : //jobWideInterpretMethod// * Une description de la plaque : **SpottedPlate**. Contenant : * l' //id// de la plaque * le nom de la plaque : //name// * tout les spots : **Spot**. Les 1ers sont dédiés aux spot de calibration. Un spot contient : * un //id// * un //label// * un nom : //name// * type du spot : //spotType//. Valeurs : L pour les spots de calibration. U pour tout les autres. * spot d'alignement ou pas? : //isAlignSpot//. Valeur Y pour les spots d'alignement. N pour tout les autres. * le temps de rétention LC : //retentionTime// * le numéro de la fraction LC : //fractionNumber// * il peut contenir aussi un ou plusieurs **JobRunItem** qui représente les acquisitions faites sur ce spot lors des différents runs. Un JobRunItem contient : * un //id// * le JobRun auquel il se rapporte (voir plus haut) : //jobRunID//. * un //jobItemId// (unique, pas trouvé à quoi il se rapporte) * le statut de l'acquisition : //acqStatus// (code) et //acqStatusText//. Valeurs : 10 et OK pour tous. * le statut du processing : //procStatus// (code) et //procStatusText//. Valeurs : 10 et OK pour tous. * l'état d'une possible interprétation : //interpStatus// (code) et //interpStatusText//. Valeurs : 2 et SKIPPED pour les acquisition MS/MS. 10 et OK ou 14 et OK JW pour les acquisitions MS. * //numSpectrums// : signification? Valeur : 1 pour tout le monde. * une indication sur le fichier de données (correspond au champ DATAFILE_PATHNAME de la table JOB_RUN_ITEM) : //dataFilePath//. Valeur : [chiffre_hexadecimal].T2D, exemple : f67e11.T2D. * Type du spot : //spotType//. Valeurs : L pour les spots de calibration. U pour tout les autres. * type de l'acquisition : //acqType//. Valeurs : 2 pour les acquisitions MS. 4 pour les MS/MS. * masse du précurseur : //precursorMass//. Valeurs : 0 pour les acquisitions MS. Un flottant avec un nombre variable de chiffres après la virgule pour les MS/MS. * //operatingModeID// : signification? Peut-être à voir avec la méthode d'acquisition, à creuser. * id du jobRun de l'acquisition parente : //interpParentJobRunID// * id de l'acquisition parente : //interpParentJobRunItemID// * id de la peak list parente : //interpParentPeakListID// * méthode d'acquisition utilisée : //acqMethodId// & //acqMethodName// (A noter : le nom porte toujours un "\" devant) * méthode de processing utilisée : //procMethodId// & //procMethodName// (A noter : le nom porte toujours un "\" devant) * méthode d'interprétation utilisée : //interpMethodId// & //interpMethodName//. Attribut inexistant pour les acquisition MS/MS. * doMethods : signification? Valeur : AP pour tout le monde. * commentaires : //comment// \\ **Nota :** 1/ Les balises sont données en **gras**. Les attributs sont donné en //italique//. 2/ Les valeurs donnée en exemple ne représente que celles trouvés dans les données à notre dispositions. **2.** Dans la base de données : à partir de la table XXX (?) ==== Description des Méthodes ==== ===== Installation base oracle test ===== [[wiki:baseTest |installation]]