UE Biologische Datenbanken, Endprüfungsfragen WS 2007/08
Aus BioSalzburg
Inhaltsverzeichnis |
Biologische Datenbanken Prüfungsfragen von 22.1.08
- Aufgabe 1:
Die folgende Nukleotidsequenz entstammt einer cDNA-Bank von Homo sapiens und beschreibt ein 3'-EST:
GGCAAAAGCCTTGGGTTTTGGGTGATCCATATTAACTACAGACAGATGCCTGGTTAATAATATTTCTGAATTCCTTT CCTTTTGTTAATGGGTTAATACACATTATACCTTTTCCTAAAATTCTAAGGACAAGGACACTTAGGCTTTGGGTGTT ACCCGGGGACACCAGGGGAATCTGTGAAACTCCTAAAATCACATATATGATTTTGTATGTGTGTGTATCTGTGCATT TTTTCTGGGCATAGAATGTTTACTTTT
- a. Geben Sie den UniGene-Cluster an, dem dieses EST zugeordnet ist. (1 Punkt)
- b. Wie heißt das zugehörige Gen und in welchem Gewebe wird es (laut EST-Analyse) besonders stark exprimiert? (2 Punkte)
- c. Bestimmen Sie den Ort der EST-Sequenz auf der genomischen DNA (Angabe des Chromosoms und der Nukleotidpositionen von Beginn und Ende). (1 Punkt)
Ergebniss:
- a, Es Handelt sich um den UniGen Cluster UGID:225827 Transthyrettin
- b, Das Gen Heißt TTR GeneID: 7276 die Höchste Expression findet im Pankreas statt.
- c, Das EST befindet sich nach Vergleich mit, alternate assembly (based on HuRef) auf Homo sapiens chromosome 18 Position 26030168-26030421
- Aufgabe 2:
Suchen Sie die Proteinstruktur mit dem PDB Code 1kvb in der Strukturdatenbank. Welche Auflösung hat diese Struktur? (1 Punkt) Finden Sie eine Struktur mit 99% Sequenzidentität zu 1kvb, die mittels NMR bestimmt wurde.
- a, Wieviele NMR Modelle stehen für diese Proteinstruktur zur Verfügung?(2 Punkte)
- b, Wieviele Prozent der Aminosäuren von 1kvb liegen im Ramachandranplot im favorisierten Bereich,
- c, wieviel im zugelassenen? Gibt es Ausreißer, wenn ja wieviele? (1 Punkt)
Ergebniss:
- a, 1.90 Angström
- b, es Handelt sich um 1rch mit 8 verfügbaren NMR Strukturen.
- c, 93.5% (143/153) liegen im favorisierten Bereich,
98.0% (150/153) liegen im zugelassenen Berich. Es gibt 3 Ausreißer: 3Lys; 123 Gly; 154 Glu;
- Aufgabe 3:
Die Proteinstruktur mit dem PDB code 2an8 ist das Ergebnis einer Proteinstrukturvorhersage mit Hilfe von homology modelling. Validieren Sie die Kette A dieses Modells mit ProSA-web und interpretieren Sie kurz das Ergebnis. (2 Punkte)
Ergebniss:
Die Struktur hat mit 1,4 einen sehr schlechten z-Score welcher auch das Energiediagramm ist immer im Positiven Beriech.--> man kann dem model eher nicht vertrauen.
- Aufgabe 4:
Finden Sie ein 5'-EST im Cluster Hs.24115, das ausschließlich im nicht-translatierten Bereich der mRNA mit dem Accession Code BC109081 liegt. (2 Punkte)
Ergebniss:
Die CDS der mRNA reicht von Position 510 - 722 und der EST der länge 516 bp mit der Accesion Number : CN280358.1 liegt auf Position 1752 bis 2267außerhalb dieser.
- Aufgabe 5:
Gegeben seien die folgenden drei Proteinstrukturen durch ihre PDB Codes:
- 1jxg Kette A,
- 1b11 Kette A,
- 1mda Kette A
Welche beiden Strukturen sind zueinander strukturell ähnlich und wie hoch ist die Sequenzidentität? (2 Punkte)
Ergebniss:
1jxg und 1b11 weisen eine Strukturelle Ähnlichkeit von 33 AA bei einer Sequenzlänge con 100 bzw 113 AA auf. Die Sequenzidentität beträgt aber nur 3% 1b11 und 1mda weisen eine Strukturelle Ähnlichkeit von 76 AA bei einer Sequenzlänge con 100 bzw 103 AA auf. Die Sequenzidentität beträgt hier 26%. Diese 2 Proteine stimmen damit von allen möglichen kombinationen am besten überein. 1jxg und 1mda weisen eine Strukturelle Ähnlichkeit von 29 AA bei einer Sequenzlänge con 113bzw 103 AA auf. Die Sequenzidentität beträgt hier nur10%
Prüfung 23.01.2008
- Frage 1:
Eine große und ungelöste Frage in der Biologie ist, wie man aus einer Proteinsequenz deren dreidimensionale Struktur vorhersagen kann. Ein Ansatz dazu bedient sich der zufälligen Generierung vieler passender Strukturen, üblicherweise mehrere tausend, aus denen dann einige wenige ausgewählt werden. Im folgenden finden Sie drei Links zu solchen Strukturen. Laden Sie diese auf ihren Rechner, wählen Sie mithilfe ProSA-web die beste Struktur aus und begründen Ihre Auswahl. (2 Punkte)
Decoy1
Decoy2
Decoy3
Antwort:
Decoy1:
Z-Score: -6,62; liegt komplett im negativen Bereich
Decoy2:
Z-Score: -3,87; liegt zum großen Teil im negativen Bereich
Decoy3:
Z-Score: -1,47; liegt im positiven Bereich
je negativer der Z-Score ist, umso energetisch günstiger ist die Struktur. Daher weist Decoy1 die beste Struktur auf.
- Frage 2:
Suchen Sie die Proteinstruktur mit dem PDB Code 1mkt in der Strukturdatenbank.
a) Welche Auflösung hat diese Struktur? (1 Punkt)
b) Finden Sie eine Struktur mit 100% Sequenzidentität zu 1mkt, die mittels NMR bestimmt wurde. Wieviele NMR Modelle stehen für diese Proteinstruktur zur Verfügung? (2 Punkte)
c) Wieviele Prozent der Aminosäuren von 1mkt liegen im Ramachandranplot im favorisierten Bereich, wieviel im zugelassenen? Gibt es Ausreißer, wenn ja wieviele? (1 Punkt)
Antwort:
a) Auflösung von 1mkt: 1,72 Angström
b) 1bvm mit 20 Modellen
c) 96,7 % liegen im favorisierten Bereich
99,2 % im zugelassenen Bereich
es gibt einen Ausreißer: 120Lys
- Frage 3:
Gegeben seien die folgenden drei Proteinstrukturen durch ihre PDB Codes:
1jxg Kette A,
1b11 Kette A,
1mda Kette A
Welche beiden Strukturen sind einander strukturell ähnlich und wie hoch ist die Sequenzidentität? (2 Punkte)
Antwort:
1jxg: 100 AS
1b11: 113 AS
1mda: 103 AS
1jxg und 1b11 weisen eine strukturelle Ähnlichkeit von 33 AS auf. Die Sequenzidentität beträgt 3 %.
1b11 und 1mda weisen eine strukturelle Ähnlichkeit von 29 AS auf. Die Sequenzidentität beträgt 10 %.
1jxg und 1mda weisen eine strukturelle Ähnlichkeit von 76 AS auf. Die Sequenzidentität beträgt 26 %. Diese beiden sind sich strukturell am ähnlichsten und weisen auch die höchste Sequenzidentität auf.
- Frage 4:
Finden Sie ein 5'-EST im Cluster Dm.20295, das ausschließlich im nicht-translatierten Bereich der mRNA mit dem Accession Code AB051842 liegt. (2 Punkte)
Antwort:
CK657332.1 es handelt sich um eine non-coding nuclear RNA - d.h. es gibt keine cds - mit der Länge von 3390 bp (1 - 3390). das 5'-EST mit einer Länge von 700bp reicht von 699 - 1398, liegt also genau in diesem Bereich
- Frage 5:
Die folgende Nukleotidsequenz entstammt einer cDNA-Bank von Homo sapiens und beschreibt ein 5'-EST:
ATGCTAGGTAACAAGCGACTGGGGCTGTCCGGACTGACCCTCGCCCTGTCCCTGCTCGTGTGC CTGGGTGCGCTGGCCGAGGCGTACCCCTCCAAGCCGGACAACCCGGGCGAGGACGCACCAGCG GAGGACATGGCCAGATACTACTCGGCGCTGCGACACTACATCAACCTCATCA
a) Geben Sie den UniGene-Cluster an, dem dieses EST zugeordnet ist. (1 Punkt)
b) Wie heißt das zugehörige Gen und in welchem Gewebe wird es (laut EST-Analyse) besonders stark exprimiert? (2 Punkte)
c) Bestimmen Sie den Ort der EST-Sequenz auf der genomischen DNA (Angabe des Chromosoms und der Nukleotidpositionen von Beginn und Ende). (1 Punkt)
Antwort:
a) Hs1832
UGID:131093
b) Neuropeptide Y (NPY); besonders stark exprimiert in den Nerven
c) chromosome: 7; Location: 7p15.1
es liegt genau auf Nukleotidposition 24291385 - 24291562
Biologische Datenbanken Prüfungsfragen vom 25.6.09
- Aufgabe 1:
Der Phage Lambda besitzt ein langes Schwanzrohr, mit welchem er seine DNA in die Wirtszelle (E.coli) überträgt. An der Ausbildung dieses Schwanzrohr-Komplexes sind unzählige Proteine beteiligt. Eines der wichtigsten Proteine dabei, gpV, wurde erstmals im März 2009 im Journal PNAS (Proceedings of the National Academy of Sciences of the United States of America) veröffentlicht. Die Koordinaten der N-terminalen Domäne dieses Proteins wurden schon Juni 2008 in der PDB abgelegt.
a. Wie lautet der entsprechende PDB code? [1 Punkt]
b. Warum ist für die Struktur aus Frage (1) keine Auflösung angegeben? [0.5 Punkte]
c. Aus wie vielen Proteinketten und COPS-Domänen besteht das Protein aus Frage (1) [0.5 Punkte]?
d. Bewerten Sie mit Hilfe von ProSA die Qualität der unter (1) gefundenen Proteinkette? Nennen Sie den ProSA Z-Score. [1 Punkt]
e. Finden Sie in COPS eine Domäne mit struktureller Ähnlichkeit zu dem in (1) gefundenen Protein, die eine Auflösung zwischen 2.5 und 2.9 Angström hat, und aus einem nicht-viralen Organismus stammt. Nennen Sie den COPS-Namen der entsprechenden Domäne. [1 Punkt]
f. Wie hoch ist die relative strukturelle Ähnlichkeit der in (1) und (5) gefundenen Domänen? Wie viel Prozent der beiden Proteinsequenzen sind identisch (ausgehend vom Strukturalignment)? [2 Punkte]
g. Wenn Sie das Strukturalignment aus Frage (6) betrachten, sehen Sie einen langen nicht-alignten Loop in der Struktur aus Frage (1). Der Loop beinhaltet zwei Beta-Strands und hat eine Länge von mehr als 20 Aminosäuren. Nennen Sie die exakte Länge, sowie die PDB-Nummerierung der Start- und End-Aminosäure des Loops. [1 Punkt]
h. Messen Sie im Loop aus Frage (7) einen Phi oder Psi Winkel. Starten Sie Ihre Messung an der Aminosäure Threonin an Position 73. Nennen Sie den exakten Winkel. [2 Punkte]
i. Nennen Sie mindestens 3 Aminosäuren der unter (5) gefundenen Proteinstruktur, die nicht in den erlaubten Regionen des Ramachandran-Diagramms liegen. [1 Punkt]
- Aufgabe 2:
Die folgende Nukleotidsequenz entstammt einer cDNA-Bank von Homo sapiens und beschreibt ein 3'-EST:
GGCGGCAGGAAGGGCTGCTGGGGCTGCGGCTGGGGCTGCTGGCCGGCGCCGGCAGCTC CATCTTGGCAGAGCTTTCCATGCGCCGGCGGCCAAGGAGTCGCGGAATCAGAGCGATC CGGGACGCGAGGTGCGGGGCCCGCGAGGGGACACAGAGAGAACTTGGGTGCAGGAACA GAGAGGGAAAGAAAAGGAAATATGAAGCGGGACCCTGACGGAAGTTAAAAAATATATA CAAAATCCCCGGGAGACTT
a. Geben Sie den UniGene-Cluster an, dem dieses EST zugeordnet ist. (1 Punkt)
b. Wie heißt das zugehörige Gen und in welchem Gewebe wird es (laut EST-Analyse) besonders stark exprimiert? (2 Punkte)
c. Bestimmen Sie den Ort der EST-Sequenz auf der genomischen DNA (Angabe des Chromosoms und der Nukleotidpositionen von Beginn und Ende). (1 Punkt)
