User Tools

Site Tools


batchuserguide

This is an old revision of the document!


Mode Batch

Le mode batch permet d'enchainer un ensemble d'opérations de façon automatique, et cela sur un ensemble d'identifications Mascot ou de projets IRMa préalablement sauvegardés. Toutes les opérations sont exécutées sur le premier fichier de données, puis c'est le second qui est entièrement traité…

Présentation générale

L'interface d'IRMa Batch est consitituée de la liste des fichiers à traiter sur la partir gauche et du script à exécuter sur la partie droite. Les fichiers peuvent être soit des projets IRMa, soit des résultats d'identification Mascot. Tous les fichiers doivent néanmoins être du même type et le script exécuté doit correspondre à ce format.

Les données

Pour ajouter des données, il suffit de faire glisser un ou plusieurs résultats d'identification ( fichier *.dat) ou projets IRMa (répertoire *.irma) dans la partie gauche de l'interface. On peut ajouter autant de données que désiré. Il est également possible de supprimer un ou plusieurs fichiers ou même d'effacer la liste en utilisant les boutons adéquats (au dessus de la liste)

Le script

La partie de droite de l'interface permet de saisir le script a exécuter. Il est possible soit

  • de charger un script existant. Cliquer sur le bouton au-dessus de la zone de texte pour rechercher le script sur le disque
  • de créer entièrement le script en saisissant les opérations dans la zone de texte
  • de partir d'un script existant (en le chargeant d'abord) puis de le modifier directement dans la zone de texte. Attention, les modifications ne sont pas sauvegardées et il n'est pas possible de les enregistrer depuis l'inertface. Si vous voulez les conserver, vous devez soit modifier le script dans un éditeur de texte classique, soit copier coller le script depuis la zone de texte dans un éditeur.

Dans tous les cas, le format du script doit correspondre aux spécifications données ci-dessous.

L'exécution

Une fois la liste des données chargée et le script créer, il suffit de cliquer sur le bouton Execute en bas de la fenêtre. Un fenêtre affichant le log de l'execution en cours apparait…

Spécification du script

Le script est au format XML. C'est à dire, en très simplifier, qu'il est constitué de bloc, successifs et/ou imbriqués, de description. Chaque bloc est délimité par une balise ouvrante et une balise fermante :

<script> // Balise ouvrante du bloc script
   ... // Contenu du bloc 
</script> // Balise fermante du bloc script

Tous script doit être décrit dans un bloc script, comme indiqué ci-dessus. Le script est constitué de plusieurs actions correspondantes aux opérations que l'on souhaite exécuter. L'ordre de définition de ces actions sera l'ordre d'exécution des opérations associées.

Une description sommaire est donnée ici. Toutes les actions décrites correspondant à des fonctionnalités générales d'IRMa, plus de détail est donné dans le guide utilisateur d'IRMa.

Parse d'un résultat Mascot

Cette opération n'est possible que si les données en entrée sont des résultats d'identification Mascot et non des projets IRMa. Elle correspond au parse Mascot réaliser dans IRMa avec les paramètres saisies dans la boite de dialogue (Report Settings/Parser Properties)

La bloc parse est défini comme illustré ci-dessous: une balise parse, suivi d'une balise parameters qui encapsule tous les paramètres et autant de balise parameter que de paramètres à définir. Pour chaque paramètre, il est nécessaire de donner son nom et sa valeur

Exemple de bloc parse :

   <parse>
    <parameters>
      <parameter name="is.hit.count.auto">
        <value class="boolean">true</value>
      </parameter>
      <parameter name="protein.cutoff">
        <value class="double">0.05</value>
      </parameter>
      <parameter name="ions.score.cutoff">
        <value class="int">0</value>
      </parameter>
      <parameter name="subset.threshold">
        <value class="double">0.5</value>
      </parameter>
      <parameter name="read.sequence">
        <value class="string">masters</value>
      </parameter>
    </parameters>
  </parse>

liste des paramètres possibles:

  • nom: is.hit.count.auto; valeurs autorisées false ou true ; spécifie comment l'on souhaite obtenir la liste des hits. En fixant le nombre absolue de hit (false) ou en spécifiant une p value (true)
    • nom: protein.cutoff; valeur décimale ; spécifie la p value à utiliser pour obtenir la liste des hits. paramètre utile que si is.hit.count.auto = true
    • nom: hit.count; valeur entière; spécifie le nombre de hits désirés. paramètre utile que si is.hit.count.auto = false
  • nom: ions.score.cutoff; valeur entière ; spécifie le score minimale d'un peptide pour qu'il soit pris en compte
  • nom: subset.threshold; valeur entière ; spécifie le threshold à utiliser pour importer ou non les protéines subset. Pour qu'une proteine subset soit considérée il faut que : Subset_Prot_score >= Master_Prot_score * (1-subset.threshold)
  • nom: read.sequence; valeurs autorisées: never, masters ou always; spécifie le mode de lecture des séquences des protéines (valeur connue que si elle est dans le fichier d'identification, valeur récupérée auprès du serveur pour les masters protéines au moins, valeur récupérée auprès du serveur pour toutes les protéines)
batchuserguide.1223454674.txt.gz · Last modified: 2008/10/08 10:31 by dupierris