====== Rassemblement des données et idées sur l'Applied 4800 ======

(pour connaître la syntaxe d'écriture sur dokuwiki voir : [[wiki:syntax | ici]])

Dans ce document seront rassemblées les différentes données et idées susceptibles d'aider à l'intégration de la gestion du spectromètre Applied 4800 MALDI ToF-ToF dans ePims (et à la gestion des données avec cet appareil de manière générale). Plusieurs particularités dans ce type de machine :

  * Contrairement aux autres machines Applied qui génèrent des fichier WIFF, la série des 4000 utilise une base de données Oracle pour le stockage des analyses. L'accès aux spectres est donc plus compliqué.
  * l'applied 4800 est de type MALDI (Matrix Assisted Laser Desorption Ionisation) et utilise donc des plaques (les matrices) sur lesquelles sont déposées un ou plusieurs échantillons répartis sur plusieurs centaines de spot (jusqu'à 1600 spots par plaque). 1 plaque est utilisée dans 1 série d'analyse.
  * Des méthodes d'analyses (Acquisitions/Processing/Interprétation pour MSMS) sont utilisées et doivent être sauvegardées


===== Les différents composants et logiciels de la problématique =====


==== La base de données (Oracle) ====
Version : (?) \\ 
Login/MdP n°1 : tsquared/ts \\ 
Login/MdP n°2 : system/ts \\ 

Les bases contenues sur le serveur présent sur la machine de l'applied à la plateforme du CHU de Grenoble sont :

{{wiki:epims4_0m2:admin:oracle-db.jpg}}


A voir si le cas est identique sur les autres installations de l'applied?

=== Rôle de chaque base ===
Apparemment CIB-MS4800 et TSQUARED sont 2 copies (ou 2 instances) de la même base. 
Selon Veronique Hourdel, WALLACEDB serait une autre copie servant d'accès à ProteinPilot (le logiciel d'analyse des résultats) (a modifier si j'ai mal compris ^^).

=== Schémas ===

{{wiki:epims4_0m2:admin:schema_db_tsquared.png?510x485}}

(cliquer pour voir le schéma dans sa taille originel)

Liste des tables des bases CIB-MS4800, TSQUARED et probablement WALLACEDB
<code>
1	ADMIN_SETTING
2	ADMIN_SETTING_DEF
3	ARCHIVE_HISTORY
4	ARCHIVE_HISTORY_DETAIL
5	ARCHIVE_KEY
6	ARCHIVE_OBJECT
7	BROWSER
8	BROWSER_COLUMN
9	BROWSER_COLUMN_DEF
10	CAL_MATRIX
11	CAL_PARAM_DEF
12	COMPOUND
13	FOLDER_OBJECT
14	JOB
15	JOB_ITEM
16	JOB_RUN
17	JOB_RUN_ITEM
18	LCMALDI_PEAK
19	LCMALDI_PEAK_LIST
20	MALDI_PLATE
21	MALDI_PLATE_INSTANCE
22	MALDI_PLATE_TYPE
23	METHOD
24	METHOD_SET_ITEM
25	OBJECT_TYPE
26	OVERRIDE_PARAM_SET
27	OVERRIDE_PARAM_VALUE
28	PARAMETER
29	PARAM_VALUE
30	PEAK
31	PEAK_COMPOUND_MAP
32	PEAK_LIST
33	QUERY
34	QUERY_ATTR
35	QUERY_ATTR_DEF
36	REF_MASS
37	RESULT
38	RUN_STATUS_DEF
39	SAMPLE_INSTANCE
40	SEARCH_PATTERN
41	SOURCE_CONTAINER
42	SPECTRUM
43	SPOT
44	SPOT_INFO
45	SPOT_SET
46	SPOT_SET_MAP
47	SPOT_SET_TEMPLATE
48	SPOT_TYPE
49	TEMP_DIRECTORY_LIST
50	TEMP_KEY
51	TEMP_METHOD_LIST
52	TEMP_PARM_LIST
53	TEMP_PATH_LIST
54	TEMP_PLATE_LIST
55	TSQUARED_LOG
56	TSQUARED_USER
57	UI_TAG
58	UI_TAG_ENUM

</code>
=== Les dumps ===

== Dump complet de la base ==
(a compléter)
== Dump d'un spotset en particulier ==
Fichier de la forme spotset_[spotset_name].dmp accompagné d'un .log. \\ 
Tables concernées par le dump :
<code>
1	ADMIN_SETTING
2	ADMIN_SETTING_DEF
3	ARCHIVE_HISTORY
4	ARCHIVE_HISTORY_DETAIL
5	CAL_MATRIX
6	CAL_PARAM_DEF
7	FOLDER_OBJECT
8	JOB
9	JOB_ITEM
10	JOB_RUN
11	JOB_RUN_ITEM
12	LCMALDI_PEAK
13	LCMALDI_PEAK_LIST
14	MALDI_PLATE
15	MALDI_PLATE_INSTANCE
16	MALDI_PLATE_TYPE
17	METHOD
18	OBJECT_TYPE
19	PARAMETER
20	PARAM_VALUE
21	PEAK
22	PEAK_LIST
23	REF_MASS
24	RESULT
25	RUN_STATUS_DEF
26	SAMPLE_INSTANCE
27	SOURCE_CONTAINER
28	SPECTRUM
29	SPOT
30	SPOT_INFO
31	SPOT_SET
32	SPOT_SET_MAP
33	SPOT_TYPE
34	TSQUARED_USER
</code>

Tables non concernées par le dump (différence par rapport à la liste des tables des bases CIB-MS4800, TSQUARED et probablement WALLACEDB)
<code>
1	ARCHIVE_KEY
2	ARCHIVE_OBJECT
3	BROWSER
4	BROWSER_COLUMN
5	BROWSER_COLUMN_DEF
6	COMPOUND
7	METHOD_SET_ITEM
8	OVERRIDE_PARAM_SET
9	OVERRIDE_PARAM_VALUE
10	PEAK_COMPOUND_MAP
11	QUERY
12	QUERY_ATTR
13	QUERY_ATTR_DEF
14	SEARCH_PATTERN
15	SPOT
16	SPOT_SET_TEMPLATE
17	TEMP_DIRECTORY_LIST
18	TEMP_KEY
19	TEMP_METHOD_LIST
20	TEMP_PARM_LIST
21	TEMP_PATH_LIST
22	TEMP_PLATE_LIST
23	TSQUARED_LOG
24	UI_TAG
</code>


==== 4000 Series Explorer (4000SE) ====
Le logiciel permettant le pilotage du 4800 permet d'exporter un certains nombres d'informations.
  - Description du spotset (XML)
  - Description des méthodes d'acquisition/processing/interprétation (XML)
  - Spectre de chaque acquisition (T2D)

==== T2D Extractor ====


===== Extraction et formats de données disponibles =====

**Nota :** \\ 
Concernant le CHU de Grenoble les données à sauvegarder doivent être :

  * les fichiers T2D (les spectres)
  * la description du spotset (l'ensemble des spots de la plaque sous 4000 Series Explorer (4000SE)
  * la description des méthodes d'analyse
  * le lien avec l'échantillon dans ePims
  * si possible le numéro de la cible utilisée


==== Fichiers de spectres (.T2D) ====

plusieurs possibilités existent pour les extraire de la base de données.

  - Utiliser T2DE en stand-alone : les utilisateurs extraient "manuellement" l'ensemble des spectres d'un spotset choisi.
  - Intégrer la logique de T2DE dans eP-Back : extraction automatique des T2D de la base pour les spotset choisi.
  - Utiliser 4000SE : export manuel des T2D associés à chaque acquisition (sélection et export de masse possible)

Afin de faire le lien avec le reste des données il faudra selon la méthode d'extraction choisi :

  - (T2DE stand-alone) se baser sur le nom du fichier et/ou sur le nom du répertoire de stockage des fichiers. T2DE créé, dans le dossier spécifié //spectra_dest_dir//dans le fichier de configuration t2de.ini, une arborescence commençant par le nom du spotset choisi. Les .T2D se trouvent sous les dossiers :
    * [spectra_dest_dir]/[spotset_name]/spectra/MS/T2D
    * [spectra_dest_dir]/[spotset_name]/spectra/MSMS/T2D

  * Les fichiers sont nommé de la façon suivante :
    * Spectre MS : Fa_20080603-Well_A1_27340_1811305.t2d => [spotset_name]-Well_[spot_label]_[job_id]_[job_item_id].t2d
    * Spectre MS/MS : Fa_20080603-Well_A1_524,13_27342_1811316.t2d => [spotset_name]-Well_[spot_label]_[precursor_mass]_[job_id]_[job_item_id].t2d

  - (T2DE intégré a eP-back) se baser sur le choix du spotset de l'utilisateur et aller rechercher dans la base les T2D. **/!\A compléter (schéma de la base etc...)**
  - (4000SE) Sur le nom du fichier et/ou sur le nom du répertoire de stockage des fichiers. 4000SE extrait les T2D dans un chemin à la racine de l'application. Chemin correspondant au chemin spécifié dans l'application. Exemple : [4000SE_home]/Morgane/test methodes/[spotset_name]

  * Les fichiers sont nommé de la façon suivante :
    * Spectre MS : **/!\A Chercher**
    * Spectre MS/MS : 1008_MSMS_1075.5363_6.t2d + un fichier .cal au nom identique (avec rajout de "-1" à la fin) =>  [spot_label]_[analysis_type]_[precursor_mass]_[un_chiffre].t2d


==== Description des Spotset ====

Les spotset contiennent des informations sur l'ensemble des analyses effectuées sur chaque spot. Ces informations peuvent être extraites de 2 façons différentes :

 **1.** Dans le 4000SE : Exporter un fichier XML contenant la description complète du **SpotSet**. (méthode d'export : File -> Database export -> Add -> Spotset -> Choisir le Spotset voulu). Ce fichier XML contient les informations suivantes (entres beaucoup d'autres) :
    * Une liste des run effectués sur ce spotset (**JobRun**). Dans chaque run :
      * un //id//
      * le job sur lequel il à été effectué : //jobId//
      * numéro du run (1er run du spotset : 1; 2e run : 2; etc...) : //jobRunNumber//
      * méthode d'interprétation pour les run MS : //jobWideInterpretMethod//
    * Une description de la plaque : **SpottedPlate**. Contenant :
      * l' //id// de la plaque
      * le nom de la plaque : //name//
      * tout les spots : **Spot**. Les 1ers sont dédiés aux spot de calibration. Un spot contient :
        * un //id//
        * un //label//
        * un nom : //name//
        * type du spot : //spotType//. Valeurs : L pour les spots de calibration. U pour tout les autres.
        * spot d'alignement ou pas? : //isAlignSpot//. Valeur Y pour les spots d'alignement. N pour tout les autres.
        * le temps de rétention LC : //retentionTime//
        * le numéro de la fraction LC : //fractionNumber//
        * il peut contenir aussi un ou plusieurs **JobRunItem** qui représente les acquisitions faites sur ce spot lors des différents runs. Un JobRunItem contient :
          * un //id//
          * le JobRun auquel il se rapporte (voir plus haut) : //jobRunID//.
          * un //jobItemId// (unique, pas trouvé à quoi il se rapporte)
          * le statut de l'acquisition : //acqStatus// (code) et //acqStatusText//. Valeurs : 10 et OK pour tous.
          * le statut du processing : //procStatus// (code) et //procStatusText//. Valeurs : 10 et OK pour tous.
          * l'état d'une possible interprétation : //interpStatus// (code) et //interpStatusText//. Valeurs : 2 et SKIPPED pour les acquisition MS/MS. 10 et OK ou 14 et OK JW pour les acquisitions MS.
          * //numSpectrums// : signification? Valeur : 1 pour tout le monde.
          * une indication sur le fichier de données (correspond au champ DATAFILE_PATHNAME de la table JOB_RUN_ITEM) : //dataFilePath//. Valeur : [chiffre_hexadecimal].T2D, exemple : f67e11.T2D.
          * Type du spot : //spotType//. Valeurs : L pour les spots de calibration. U pour tout les autres.
          * type de l'acquisition : //acqType//. Valeurs : 2 pour les acquisitions MS. 4 pour les MS/MS.
          * masse du précurseur : //precursorMass//. Valeurs : 0 pour les acquisitions MS. Un flottant avec un nombre variable de chiffres après la virgule pour les MS/MS.
          * //operatingModeID// : signification? Peut-être à voir avec la méthode d'acquisition, à creuser.
          * id du jobRun de l'acquisition parente : //interpParentJobRunID//
          * id de l'acquisition parente : //interpParentJobRunItemID//
          * id de la peak list parente : //interpParentPeakListID//
          * méthode d'acquisition utilisée : //acqMethodId// & //acqMethodName// (A noter : le nom porte toujours un "\" devant)
          * méthode de processing utilisée : //procMethodId// & //procMethodName// (A noter : le nom porte toujours un "\" devant)
          * méthode d'interprétation utilisée : //interpMethodId// & //interpMethodName//. Attribut inexistant pour les acquisition MS/MS.
          * doMethods : signification? Valeur : AP pour tout le monde.
          * commentaires : //comment//

\\ **Nota :** 1/ Les balises sont données en **gras**. Les attributs sont donné en //italique//. 2/ Les valeurs donnée en exemple ne représente que celles trouvés dans les données à notre dispositions.


 **2.** Dans la base de données : à partir de la table XXX (?)


==== Description des Méthodes ====


===== Installation base oracle test =====
[[wiki:baseTest |installation]]