====== Rassemblement des données et idées sur l'Applied 4800 ======
(pour connaître la syntaxe d'écriture sur dokuwiki voir : [[wiki:syntax | ici]])
Dans ce document seront rassemblées les différentes données et idées susceptibles d'aider à l'intégration de la gestion du spectromètre Applied 4800 MALDI ToF-ToF dans ePims (et à la gestion des données avec cet appareil de manière générale). Plusieurs particularités dans ce type de machine :
* Contrairement aux autres machines Applied qui génèrent des fichier WIFF, la série des 4000 utilise une base de données Oracle pour le stockage des analyses. L'accès aux spectres est donc plus compliqué.
* l'applied 4800 est de type MALDI (Matrix Assisted Laser Desorption Ionisation) et utilise donc des plaques (les matrices) sur lesquelles sont déposées un ou plusieurs échantillons répartis sur plusieurs centaines de spot (jusqu'à 1600 spots par plaque). 1 plaque est utilisée dans 1 série d'analyse.
* Des méthodes d'analyses (Acquisitions/Processing/Interprétation pour MSMS) sont utilisées et doivent être sauvegardées
===== Les différents composants et logiciels de la problématique =====
==== La base de données (Oracle) ====
Version : (?) \\
Login/MdP n°1 : tsquared/ts \\
Login/MdP n°2 : system/ts \\
Les bases contenues sur le serveur présent sur la machine de l'applied à la plateforme du CHU de Grenoble sont :
{{wiki:epims4_0m2:admin:oracle-db.jpg}}
A voir si le cas est identique sur les autres installations de l'applied?
=== Rôle de chaque base ===
Apparemment CIB-MS4800 et TSQUARED sont 2 copies (ou 2 instances) de la même base.
Selon Veronique Hourdel, WALLACEDB serait une autre copie servant d'accès à ProteinPilot (le logiciel d'analyse des résultats) (a modifier si j'ai mal compris ^^).
=== Schémas ===
{{wiki:epims4_0m2:admin:schema_db_tsquared.png?510x485}}
(cliquer pour voir le schéma dans sa taille originel)
Liste des tables des bases CIB-MS4800, TSQUARED et probablement WALLACEDB
1 ADMIN_SETTING
2 ADMIN_SETTING_DEF
3 ARCHIVE_HISTORY
4 ARCHIVE_HISTORY_DETAIL
5 ARCHIVE_KEY
6 ARCHIVE_OBJECT
7 BROWSER
8 BROWSER_COLUMN
9 BROWSER_COLUMN_DEF
10 CAL_MATRIX
11 CAL_PARAM_DEF
12 COMPOUND
13 FOLDER_OBJECT
14 JOB
15 JOB_ITEM
16 JOB_RUN
17 JOB_RUN_ITEM
18 LCMALDI_PEAK
19 LCMALDI_PEAK_LIST
20 MALDI_PLATE
21 MALDI_PLATE_INSTANCE
22 MALDI_PLATE_TYPE
23 METHOD
24 METHOD_SET_ITEM
25 OBJECT_TYPE
26 OVERRIDE_PARAM_SET
27 OVERRIDE_PARAM_VALUE
28 PARAMETER
29 PARAM_VALUE
30 PEAK
31 PEAK_COMPOUND_MAP
32 PEAK_LIST
33 QUERY
34 QUERY_ATTR
35 QUERY_ATTR_DEF
36 REF_MASS
37 RESULT
38 RUN_STATUS_DEF
39 SAMPLE_INSTANCE
40 SEARCH_PATTERN
41 SOURCE_CONTAINER
42 SPECTRUM
43 SPOT
44 SPOT_INFO
45 SPOT_SET
46 SPOT_SET_MAP
47 SPOT_SET_TEMPLATE
48 SPOT_TYPE
49 TEMP_DIRECTORY_LIST
50 TEMP_KEY
51 TEMP_METHOD_LIST
52 TEMP_PARM_LIST
53 TEMP_PATH_LIST
54 TEMP_PLATE_LIST
55 TSQUARED_LOG
56 TSQUARED_USER
57 UI_TAG
58 UI_TAG_ENUM
=== Les dumps ===
== Dump complet de la base ==
(a compléter)
== Dump d'un spotset en particulier ==
Fichier de la forme spotset_[spotset_name].dmp accompagné d'un .log. \\
Tables concernées par le dump :
1 ADMIN_SETTING
2 ADMIN_SETTING_DEF
3 ARCHIVE_HISTORY
4 ARCHIVE_HISTORY_DETAIL
5 CAL_MATRIX
6 CAL_PARAM_DEF
7 FOLDER_OBJECT
8 JOB
9 JOB_ITEM
10 JOB_RUN
11 JOB_RUN_ITEM
12 LCMALDI_PEAK
13 LCMALDI_PEAK_LIST
14 MALDI_PLATE
15 MALDI_PLATE_INSTANCE
16 MALDI_PLATE_TYPE
17 METHOD
18 OBJECT_TYPE
19 PARAMETER
20 PARAM_VALUE
21 PEAK
22 PEAK_LIST
23 REF_MASS
24 RESULT
25 RUN_STATUS_DEF
26 SAMPLE_INSTANCE
27 SOURCE_CONTAINER
28 SPECTRUM
29 SPOT
30 SPOT_INFO
31 SPOT_SET
32 SPOT_SET_MAP
33 SPOT_TYPE
34 TSQUARED_USER
Tables non concernées par le dump (différence par rapport à la liste des tables des bases CIB-MS4800, TSQUARED et probablement WALLACEDB)
1 ARCHIVE_KEY
2 ARCHIVE_OBJECT
3 BROWSER
4 BROWSER_COLUMN
5 BROWSER_COLUMN_DEF
6 COMPOUND
7 METHOD_SET_ITEM
8 OVERRIDE_PARAM_SET
9 OVERRIDE_PARAM_VALUE
10 PEAK_COMPOUND_MAP
11 QUERY
12 QUERY_ATTR
13 QUERY_ATTR_DEF
14 SEARCH_PATTERN
15 SPOT
16 SPOT_SET_TEMPLATE
17 TEMP_DIRECTORY_LIST
18 TEMP_KEY
19 TEMP_METHOD_LIST
20 TEMP_PARM_LIST
21 TEMP_PATH_LIST
22 TEMP_PLATE_LIST
23 TSQUARED_LOG
24 UI_TAG
==== 4000 Series Explorer (4000SE) ====
Le logiciel permettant le pilotage du 4800 permet d'exporter un certains nombres d'informations.
- Description du spotset (XML)
- Description des méthodes d'acquisition/processing/interprétation (XML)
- Spectre de chaque acquisition (T2D)
==== T2D Extractor ====
===== Extraction et formats de données disponibles =====
**Nota :** \\
Concernant le CHU de Grenoble les données à sauvegarder doivent être :
* les fichiers T2D (les spectres)
* la description du spotset (l'ensemble des spots de la plaque sous 4000 Series Explorer (4000SE)
* la description des méthodes d'analyse
* le lien avec l'échantillon dans ePims
* si possible le numéro de la cible utilisée
==== Fichiers de spectres (.T2D) ====
plusieurs possibilités existent pour les extraire de la base de données.
- Utiliser T2DE en stand-alone : les utilisateurs extraient "manuellement" l'ensemble des spectres d'un spotset choisi.
- Intégrer la logique de T2DE dans eP-Back : extraction automatique des T2D de la base pour les spotset choisi.
- Utiliser 4000SE : export manuel des T2D associés à chaque acquisition (sélection et export de masse possible)
Afin de faire le lien avec le reste des données il faudra selon la méthode d'extraction choisi :
- (T2DE stand-alone) se baser sur le nom du fichier et/ou sur le nom du répertoire de stockage des fichiers. T2DE créé, dans le dossier spécifié //spectra_dest_dir//dans le fichier de configuration t2de.ini, une arborescence commençant par le nom du spotset choisi. Les .T2D se trouvent sous les dossiers :
* [spectra_dest_dir]/[spotset_name]/spectra/MS/T2D
* [spectra_dest_dir]/[spotset_name]/spectra/MSMS/T2D
* Les fichiers sont nommé de la façon suivante :
* Spectre MS : Fa_20080603-Well_A1_27340_1811305.t2d => [spotset_name]-Well_[spot_label]_[job_id]_[job_item_id].t2d
* Spectre MS/MS : Fa_20080603-Well_A1_524,13_27342_1811316.t2d => [spotset_name]-Well_[spot_label]_[precursor_mass]_[job_id]_[job_item_id].t2d
- (T2DE intégré a eP-back) se baser sur le choix du spotset de l'utilisateur et aller rechercher dans la base les T2D. **/!\A compléter (schéma de la base etc...)**
- (4000SE) Sur le nom du fichier et/ou sur le nom du répertoire de stockage des fichiers. 4000SE extrait les T2D dans un chemin à la racine de l'application. Chemin correspondant au chemin spécifié dans l'application. Exemple : [4000SE_home]/Morgane/test methodes/[spotset_name]
* Les fichiers sont nommé de la façon suivante :
* Spectre MS : **/!\A Chercher**
* Spectre MS/MS : 1008_MSMS_1075.5363_6.t2d + un fichier .cal au nom identique (avec rajout de "-1" à la fin) => [spot_label]_[analysis_type]_[precursor_mass]_[un_chiffre].t2d
==== Description des Spotset ====
Les spotset contiennent des informations sur l'ensemble des analyses effectuées sur chaque spot. Ces informations peuvent être extraites de 2 façons différentes :
**1.** Dans le 4000SE : Exporter un fichier XML contenant la description complète du **SpotSet**. (méthode d'export : File -> Database export -> Add -> Spotset -> Choisir le Spotset voulu). Ce fichier XML contient les informations suivantes (entres beaucoup d'autres) :
* Une liste des run effectués sur ce spotset (**JobRun**). Dans chaque run :
* un //id//
* le job sur lequel il à été effectué : //jobId//
* numéro du run (1er run du spotset : 1; 2e run : 2; etc...) : //jobRunNumber//
* méthode d'interprétation pour les run MS : //jobWideInterpretMethod//
* Une description de la plaque : **SpottedPlate**. Contenant :
* l' //id// de la plaque
* le nom de la plaque : //name//
* tout les spots : **Spot**. Les 1ers sont dédiés aux spot de calibration. Un spot contient :
* un //id//
* un //label//
* un nom : //name//
* type du spot : //spotType//. Valeurs : L pour les spots de calibration. U pour tout les autres.
* spot d'alignement ou pas? : //isAlignSpot//. Valeur Y pour les spots d'alignement. N pour tout les autres.
* le temps de rétention LC : //retentionTime//
* le numéro de la fraction LC : //fractionNumber//
* il peut contenir aussi un ou plusieurs **JobRunItem** qui représente les acquisitions faites sur ce spot lors des différents runs. Un JobRunItem contient :
* un //id//
* le JobRun auquel il se rapporte (voir plus haut) : //jobRunID//.
* un //jobItemId// (unique, pas trouvé à quoi il se rapporte)
* le statut de l'acquisition : //acqStatus// (code) et //acqStatusText//. Valeurs : 10 et OK pour tous.
* le statut du processing : //procStatus// (code) et //procStatusText//. Valeurs : 10 et OK pour tous.
* l'état d'une possible interprétation : //interpStatus// (code) et //interpStatusText//. Valeurs : 2 et SKIPPED pour les acquisition MS/MS. 10 et OK ou 14 et OK JW pour les acquisitions MS.
* //numSpectrums// : signification? Valeur : 1 pour tout le monde.
* une indication sur le fichier de données (correspond au champ DATAFILE_PATHNAME de la table JOB_RUN_ITEM) : //dataFilePath//. Valeur : [chiffre_hexadecimal].T2D, exemple : f67e11.T2D.
* Type du spot : //spotType//. Valeurs : L pour les spots de calibration. U pour tout les autres.
* type de l'acquisition : //acqType//. Valeurs : 2 pour les acquisitions MS. 4 pour les MS/MS.
* masse du précurseur : //precursorMass//. Valeurs : 0 pour les acquisitions MS. Un flottant avec un nombre variable de chiffres après la virgule pour les MS/MS.
* //operatingModeID// : signification? Peut-être à voir avec la méthode d'acquisition, à creuser.
* id du jobRun de l'acquisition parente : //interpParentJobRunID//
* id de l'acquisition parente : //interpParentJobRunItemID//
* id de la peak list parente : //interpParentPeakListID//
* méthode d'acquisition utilisée : //acqMethodId// & //acqMethodName// (A noter : le nom porte toujours un "\" devant)
* méthode de processing utilisée : //procMethodId// & //procMethodName// (A noter : le nom porte toujours un "\" devant)
* méthode d'interprétation utilisée : //interpMethodId// & //interpMethodName//. Attribut inexistant pour les acquisition MS/MS.
* doMethods : signification? Valeur : AP pour tout le monde.
* commentaires : //comment//
\\ **Nota :** 1/ Les balises sont données en **gras**. Les attributs sont donné en //italique//. 2/ Les valeurs donnée en exemple ne représente que celles trouvés dans les données à notre dispositions.
**2.** Dans la base de données : à partir de la table XXX (?)
==== Description des Méthodes ====
===== Installation base oracle test =====
[[wiki:baseTest |installation]]