top of page

TD4 : recherche et analyse de séquences nucléotidiques et protéiques

Objectifs

Il s'agit dans ce TD de se familliariser avec le portail du NCBI et particulièrement avec la recherche d'informations dans les bases de données "GENE", "Nucleotide", "Protein" et "PubMed central".

La recherche et la collecte d'informations à partir de ce type de bases de données est courante en laboratoire et vous devez en maîtriser les bases.

I- Collecte d'informations relatives au gène LacZ d’Escherichia coli

Cette recherche sera ciblée sur le Gène LacZ de la  β-galactosidase d’Escherichia coli (str. K-12 substr. MG1655)

 

  • Choisir la base de donnée adaptée   

  • Inscrire la requête dans la barre de recherche : « Escherichia coli lacZ»

Une page de résultats apparaît.

  • Cliquer sur le lien pertinent.

  • Une nouvelle page est créée au format «Full report».

  • Explorer cette page pour découvrir les fonctionnalités proposées (contexte génomique, références bibliographiques, voies métaboliques impliquées, informations sur la protéine et l’ARNm.

NB : il est important de bien connaître l’organisation de cette page «Full report», puisqu’elle est sera identique pour toute recherche concernant un gène (base de données GENE).

1- Contexte génomique du gène lacZ

  • Identifier les gènes situés à proximité de lacZ.

  • Conclure par rapport au type d’organisation mise en évidence.

  • Donner l’intérêt d’une telle organisation.

2- Rôles métaboliques de la β-galactosidase

  • Identifier les voies métaboliques dans lesquelles la β-galactosidase est impliquée.

3- Collecte d'informations

 

  • Relever le numéro d’accession de la protéine codée par lacZ (NP ...........).

  • Relever son numéro de commission enzymatique (EC Number)

  • Cliquer sur le lien (NP...........), et à partir de la nouvelle page au format «Genpept», retrouver les informations suivantes :

  1. Rechercher le N° d’accession (NC.............) correspondant à la séquence du génome de E. coli (DB Source) .

  2. Cliquer sur ce lien, afin d'ouvrir la page dans un nouvel onglet

  3. Noter la taille de ce génome.

  4. Explorer rapidement la fiche au format GenBank. Que présente-elle?

  • Revenir sur la page au format GenPept, puis :

  1.  Relever la taille de la protéine (en acides-aminés)

  2.  Cliquer sur le lien "Protein", pour surligner la séquence complète en acide aminés de la protéine.

  3.  Dans le menu contextuel en bas à droite, choisir l'affichage (Display) "FASTA", dans un nouvel onglet (clic droit).

  4.  Copier et coller cette séquence dans votre compte-rendu.

  •   Revenir au format «GenPept», et cette fois-ci, cliquer sur le lien "CDS" et choisir l'affichage "GenBank", dans le menu contextuel. L'ouvrir dans un nouvel onglet , (clic droit).

  1. Relever la taille du gène (en paires de bases) et celle de la séquence codante (CDS).

  2. Revenir au format «GenPept», cliquer sur le lien "CDS" et  cette fois-ci choisir l'affichage "FASTA", dans le menu contextuel. L'ouvrir dans un nouvel onglet , (clic droit)..

  3. Copier et coller la séquence du gène dans votre compte-rendu.

  4. Repérer en couleur, le codon initiateur « ATG » et le codon stop « TAA ».

 

NB : il est important de bien connaître l’organisation de cette page au format «Genpept» ou «GenBank», puisqu’elle est sera identique pour toute recherche concernant une protéine ou un gène. (bases de données PROTEIN ou NUCLEOTIDE)

II- Collecte d'informations relatives à la Taq polymérase

 

La Taq polymerase est une ADN polymerase thermostable extraite de Thermus aquaticus. Elle est utilisée dans les réactions d’amplification génique (PCR) et dans le séquençage de l’ADN.

A partir de la page d’accueil du site NCBI, vous rechercherez les réponses aux questions suivantes et compléterez au fur et à mesure le tableau de réponse (tableau récupération infos Taq-1.docx)

     o Retrouver la séquence d’ADN du gène codant l’ADN polymerase de Thermus aquaticus utilisée en PCR à partir de la banque de séquences «Nucléotides». (requête : Thermus aquaticus PolI)
    o Noter le code GenBank du gène et le numéro de classification de l’enzyme (EC number).
    o Noter les références complètes (Nom des auteurs,titre de la publication, nom du journal, pages, volume, année de publication) de la publication concernant l’isolation et la caractérisation de la Taq pol.

     o Trouver la taille de la séquence du gène (séquence d’ADN).
    o Trouver la taille de la séquence codante « CDS » CoDing Sequence.
    o Enregistrer dans votre compte-rendu la séquence du gène au format FASTA.
    o Revenir sur la page au format «GenBank» et cliquer sur le lien de la protéine (AAA27507.1)

 

A partir de cette nouvelle page :

    o Relever le nombre d’acides aminés qui composent la séquence.
   o Enregistrer la séquence au format FASTA dans votre compte-rendu.

Dans PubMedCentral, retrouver la publication de Kermekchiev MB et al. parue en 2003 dans la revue Nucleic Acids Res.

A partir de l'abstract, Expliquer en quelques phrases leurs travaux, et l’intérêt de leur démarche.

NB : rappels sur PubMed et PubMed Central : ici

Dans un document de synthèse rédigé, vous reprendrez l’ensemble des informations recueillies dans le tableau au sujet de la Taq Pol. En introduction vous présenterez le germe Thermus aquaticus (lieu d’isolement, année de découverte......) et l’intérêt de l’utilisation de la polymérase de cet organisme en PCR. Puis vous décrirez le gène de la Taq pol. et la protéine en insistant sur les points recherchés. Vous terminerez votre exposé en précisant que certains mutants ont été obtenus pour améliorer encore l’efficacité de cette enzyme, et vous illustrerez par l’exemple étudié précédemment. En conclusion vous montrerez que les améliorations de la PCR sont nombreuses (en vous basant sur des exemples) et que cette technique est devenue incontournable.

bottom of page