This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
wiki:epims4_0m2:admin:4800applied [2008/06/12 17:30] barthe |
wiki:epims4_0m2:admin:4800applied [2008/10/02 10:21] (current) |
||
---|---|---|---|
Line 1: | Line 1: | ||
====== Rassemblement des données et idées sur l'Applied 4800 ====== | ====== Rassemblement des données et idées sur l'Applied 4800 ====== | ||
- | Dans ce document seront rassemblées les différentes données et idées susceptibles d'aider à l'intégration de la gestion du spectromètre Applied 4800 MALDI ToF-ToFdans ePims (et à la gestion des données avec cet appareil de manière générale) | ||
(pour connaître la syntaxe d'écriture sur dokuwiki voir : [[wiki:syntax | ici]]) | (pour connaître la syntaxe d'écriture sur dokuwiki voir : [[wiki:syntax | ici]]) | ||
+ | Dans ce document seront rassemblées les différentes données et idées susceptibles d'aider à l'intégration de la gestion du spectromètre Applied 4800 MALDI ToF-ToF dans ePims (et à la gestion des données avec cet appareil de manière générale). Plusieurs particularités dans ce type de machine : | ||
+ | * Contrairement aux autres machines Applied qui génèrent des fichier WIFF, la série des 4000 utilise une base de données Oracle pour le stockage des analyses. L'accès aux spectres est donc plus compliqué. | ||
+ | * l'applied 4800 est de type MALDI (Matrix Assisted Laser Desorption Ionisation) et utilise donc des plaques (les matrices) sur lesquelles sont déposées un ou plusieurs échantillons répartis sur plusieurs centaines de spot (jusqu'à 1600 spots par plaque). 1 plaque est utilisée dans 1 série d'analyse. | ||
+ | * Des méthodes d'analyses (Acquisitions/Processing/Interprétation pour MSMS) sont utilisées et doivent être sauvegardées | ||
- | ===== La base de données (Oracle) ===== | + | ===== Les différents composants et logiciels de la problématique ===== |
+ | |||
+ | |||
+ | ==== La base de données (Oracle) ==== | ||
Version : (?) \\ | Version : (?) \\ | ||
Login/MdP n°1 : tsquared/ts \\ | Login/MdP n°1 : tsquared/ts \\ | ||
Line 16: | Line 22: | ||
Les bases contenues sur le serveur présent sur la machine de l'applied à la plateforme du CHU de Grenoble sont : | Les bases contenues sur le serveur présent sur la machine de l'applied à la plateforme du CHU de Grenoble sont : | ||
- | {{wiki:epims4_0m2:admin:oracle-db.jpg|}} | + | {{wiki:epims4_0m2:admin:oracle-db.jpg}} |
A voir si le cas est identique sur les autres installations de l'applied? | A voir si le cas est identique sur les autres installations de l'applied? | ||
Line 25: | Line 32: | ||
=== Schémas === | === Schémas === | ||
+ | |||
+ | {{wiki:epims4_0m2:admin:schema_db_tsquared.png?510x485}} | ||
+ | |||
+ | (cliquer pour voir le schéma dans sa taille originel) | ||
+ | |||
Liste des tables des bases CIB-MS4800, TSQUARED et probablement WALLACEDB | Liste des tables des bases CIB-MS4800, TSQUARED et probablement WALLACEDB | ||
<code> | <code> | ||
Line 107: | Line 119: | ||
11 JOB_RUN_ITEM | 11 JOB_RUN_ITEM | ||
12 LCMALDI_PEAK | 12 LCMALDI_PEAK | ||
- | 13 LCMALDI_PEAK | + | 13 LCMALDI_PEAK_LIST |
- | 14 LCMALDI_PEAK_LIST | + | 14 MALDI_PLATE |
- | 15 MALDI_PLATE | + | 15 MALDI_PLATE_INSTANCE |
- | 16 MALDI_PLATE_INSTANCE | + | 16 MALDI_PLATE_TYPE |
- | 17 MALDI_PLATE_TYPE | + | 17 METHOD |
- | 18 METHOD | + | 18 OBJECT_TYPE |
- | 19 OBJECT_TYPE | + | 19 PARAMETER |
- | 20 PARAMETER | + | 20 PARAM_VALUE |
- | 21 PARAM_VALUE | + | 21 PEAK |
- | 22 PEAK | + | 22 PEAK_LIST |
- | 23 PEAK_LIST | + | 23 REF_MASS |
- | 24 REF_MASS | + | 24 RESULT |
- | 25 RESULT | + | 25 RUN_STATUS_DEF |
- | 26 RUN_STATUS_DEF | + | 26 SAMPLE_INSTANCE |
- | 27 SAMPLE_INSTANCE | + | 27 SOURCE_CONTAINER |
- | 28 SOURCE_CONTAINER | + | 28 SPECTRUM |
- | 29 SPECTRUM | + | 29 SPOT |
- | 30 SPECTRUM | + | 30 SPOT_INFO |
- | 31 SPOT | + | 31 SPOT_SET |
- | 32 SPOT_INFO | + | 32 SPOT_SET_MAP |
- | 33 SPOT_SET | + | 33 SPOT_TYPE |
- | 34 SPOT_SET_MAP | + | 34 TSQUARED_USER |
- | 35 SPOT_TYPE | + | </code> |
- | 36 TSQUARED_USER | + | |
+ | Tables non concernées par le dump (différence par rapport à la liste des tables des bases CIB-MS4800, TSQUARED et probablement WALLACEDB) | ||
+ | <code> | ||
+ | 1 ARCHIVE_KEY | ||
+ | 2 ARCHIVE_OBJECT | ||
+ | 3 BROWSER | ||
+ | 4 BROWSER_COLUMN | ||
+ | 5 BROWSER_COLUMN_DEF | ||
+ | 6 COMPOUND | ||
+ | 7 METHOD_SET_ITEM | ||
+ | 8 OVERRIDE_PARAM_SET | ||
+ | 9 OVERRIDE_PARAM_VALUE | ||
+ | 10 PEAK_COMPOUND_MAP | ||
+ | 11 QUERY | ||
+ | 12 QUERY_ATTR | ||
+ | 13 QUERY_ATTR_DEF | ||
+ | 14 SEARCH_PATTERN | ||
+ | 15 SPOT | ||
+ | 16 SPOT_SET_TEMPLATE | ||
+ | 17 TEMP_DIRECTORY_LIST | ||
+ | 18 TEMP_KEY | ||
+ | 19 TEMP_METHOD_LIST | ||
+ | 20 TEMP_PARM_LIST | ||
+ | 21 TEMP_PATH_LIST | ||
+ | 22 TEMP_PLATE_LIST | ||
+ | 23 TSQUARED_LOG | ||
+ | 24 UI_TAG | ||
</code> | </code> | ||
Line 142: | Line 180: | ||
==== T2D Extractor ==== | ==== T2D Extractor ==== | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ===== Extraction et formats de données disponibles ===== | ||
+ | |||
+ | **Nota :** \\ | ||
+ | Concernant le CHU de Grenoble les données à sauvegarder doivent être : | ||
+ | |||
+ | * les fichiers T2D (les spectres) | ||
+ | * la description du spotset (l'ensemble des spots de la plaque sous 4000 Series Explorer (4000SE) | ||
+ | * la description des méthodes d'analyse | ||
+ | * le lien avec l'échantillon dans ePims | ||
+ | * si possible le numéro de la cible utilisée | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ==== Fichiers de spectres (.T2D) ==== | ||
+ | |||
+ | plusieurs possibilités existent pour les extraire de la base de données. | ||
+ | |||
+ | - Utiliser T2DE en stand-alone : les utilisateurs extraient "manuellement" l'ensemble des spectres d'un spotset choisi. | ||
+ | - Intégrer la logique de T2DE dans eP-Back : extraction automatique des T2D de la base pour les spotset choisi. | ||
+ | - Utiliser 4000SE : export manuel des T2D associés à chaque acquisition (sélection et export de masse possible) | ||
+ | |||
+ | Afin de faire le lien avec le reste des données il faudra selon la méthode d'extraction choisi : | ||
+ | |||
+ | - (T2DE stand-alone) se baser sur le nom du fichier et/ou sur le nom du répertoire de stockage des fichiers. T2DE créé, dans le dossier spécifié //spectra_dest_dir//dans le fichier de configuration t2de.ini, une arborescence commençant par le nom du spotset choisi. Les .T2D se trouvent sous les dossiers : | ||
+ | * [spectra_dest_dir]/[spotset_name]/spectra/MS/T2D | ||
+ | * [spectra_dest_dir]/[spotset_name]/spectra/MSMS/T2D | ||
+ | |||
+ | * Les fichiers sont nommé de la façon suivante : | ||
+ | * Spectre MS : Fa_20080603-Well_A1_27340_1811305.t2d => [spotset_name]-Well_[spot_label]_[job_id]_[job_item_id].t2d | ||
+ | * Spectre MS/MS : Fa_20080603-Well_A1_524,13_27342_1811316.t2d => [spotset_name]-Well_[spot_label]_[precursor_mass]_[job_id]_[job_item_id].t2d | ||
+ | |||
+ | - (T2DE intégré a eP-back) se baser sur le choix du spotset de l'utilisateur et aller rechercher dans la base les T2D. **/!\A compléter (schéma de la base etc...)** | ||
+ | - (4000SE) Sur le nom du fichier et/ou sur le nom du répertoire de stockage des fichiers. 4000SE extrait les T2D dans un chemin à la racine de l'application. Chemin correspondant au chemin spécifié dans l'application. Exemple : [4000SE_home]/Morgane/test methodes/[spotset_name] | ||
+ | |||
+ | * Les fichiers sont nommé de la façon suivante : | ||
+ | * Spectre MS : **/!\A Chercher** | ||
+ | * Spectre MS/MS : 1008_MSMS_1075.5363_6.t2d + un fichier .cal au nom identique (avec rajout de "-1" à la fin) => [spot_label]_[analysis_type]_[precursor_mass]_[un_chiffre].t2d | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ==== Description des Spotset ==== | ||
+ | |||
+ | Les spotset contiennent des informations sur l'ensemble des analyses effectuées sur chaque spot. Ces informations peuvent être extraites de 2 façons différentes : | ||
+ | |||
+ | **1.** Dans le 4000SE : Exporter un fichier XML contenant la description complète du **SpotSet**. (méthode d'export : File -> Database export -> Add -> Spotset -> Choisir le Spotset voulu). Ce fichier XML contient les informations suivantes (entres beaucoup d'autres) : | ||
+ | * Une liste des run effectués sur ce spotset (**JobRun**). Dans chaque run : | ||
+ | * un //id// | ||
+ | * le job sur lequel il à été effectué : //jobId// | ||
+ | * numéro du run (1er run du spotset : 1; 2e run : 2; etc...) : //jobRunNumber// | ||
+ | * méthode d'interprétation pour les run MS : //jobWideInterpretMethod// | ||
+ | * Une description de la plaque : **SpottedPlate**. Contenant : | ||
+ | * l' //id// de la plaque | ||
+ | * le nom de la plaque : //name// | ||
+ | * tout les spots : **Spot**. Les 1ers sont dédiés aux spot de calibration. Un spot contient : | ||
+ | * un //id// | ||
+ | * un //label// | ||
+ | * un nom : //name// | ||
+ | * type du spot : //spotType//. Valeurs : L pour les spots de calibration. U pour tout les autres. | ||
+ | * spot d'alignement ou pas? : //isAlignSpot//. Valeur Y pour les spots d'alignement. N pour tout les autres. | ||
+ | * le temps de rétention LC : //retentionTime// | ||
+ | * le numéro de la fraction LC : //fractionNumber// | ||
+ | * il peut contenir aussi un ou plusieurs **JobRunItem** qui représente les acquisitions faites sur ce spot lors des différents runs. Un JobRunItem contient : | ||
+ | * un //id// | ||
+ | * le JobRun auquel il se rapporte (voir plus haut) : //jobRunID//. | ||
+ | * un //jobItemId// (unique, pas trouvé à quoi il se rapporte) | ||
+ | * le statut de l'acquisition : //acqStatus// (code) et //acqStatusText//. Valeurs : 10 et OK pour tous. | ||
+ | * le statut du processing : //procStatus// (code) et //procStatusText//. Valeurs : 10 et OK pour tous. | ||
+ | * l'état d'une possible interprétation : //interpStatus// (code) et //interpStatusText//. Valeurs : 2 et SKIPPED pour les acquisition MS/MS. 10 et OK ou 14 et OK JW pour les acquisitions MS. | ||
+ | * //numSpectrums// : signification? Valeur : 1 pour tout le monde. | ||
+ | * une indication sur le fichier de données (correspond au champ DATAFILE_PATHNAME de la table JOB_RUN_ITEM) : //dataFilePath//. Valeur : [chiffre_hexadecimal].T2D, exemple : f67e11.T2D. | ||
+ | * Type du spot : //spotType//. Valeurs : L pour les spots de calibration. U pour tout les autres. | ||
+ | * type de l'acquisition : //acqType//. Valeurs : 2 pour les acquisitions MS. 4 pour les MS/MS. | ||
+ | * masse du précurseur : //precursorMass//. Valeurs : 0 pour les acquisitions MS. Un flottant avec un nombre variable de chiffres après la virgule pour les MS/MS. | ||
+ | * //operatingModeID// : signification? Peut-être à voir avec la méthode d'acquisition, à creuser. | ||
+ | * id du jobRun de l'acquisition parente : //interpParentJobRunID// | ||
+ | * id de l'acquisition parente : //interpParentJobRunItemID// | ||
+ | * id de la peak list parente : //interpParentPeakListID// | ||
+ | * méthode d'acquisition utilisée : //acqMethodId// & //acqMethodName// (A noter : le nom porte toujours un "\" devant) | ||
+ | * méthode de processing utilisée : //procMethodId// & //procMethodName// (A noter : le nom porte toujours un "\" devant) | ||
+ | * méthode d'interprétation utilisée : //interpMethodId// & //interpMethodName//. Attribut inexistant pour les acquisition MS/MS. | ||
+ | * doMethods : signification? Valeur : AP pour tout le monde. | ||
+ | * commentaires : //comment// | ||
+ | |||
+ | \\ **Nota :** 1/ Les balises sont données en **gras**. Les attributs sont donné en //italique//. 2/ Les valeurs donnée en exemple ne représente que celles trouvés dans les données à notre dispositions. | ||
+ | |||
+ | |||
+ | **2.** Dans la base de données : à partir de la table XXX (?) | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ==== Description des Méthodes ==== | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ===== Installation base oracle test ===== | ||
+ | [[wiki:baseTest |installation]] |