hundreds of thousands of protein sequences found in current databases, only a small percentage correspond to molecules that have actually been isolated by somebody or experimented upon.
That’s because determiningthe sequence of a protein is much more difficult than sequencing DNA — but all the proteins that a given organism (whether microbe or human being) can synthesize are encoded in the DNA sequence of its genome. Thus, the smart shortcut that molecular biologists have been using is to read protein sequences directly at the information source: in the DNA sequence! This way, we can pretend to know the amino-acid sequence of a protein that has never been isolated in a test tube.
من بين مئات الآلاف من سلاسل البروتين الموجودة في قواعد البيانات الحالية ، هناك نسبة صغيرة فقط تتوافق مع الجزيئات التي تم عزلها بالفعل من قبل شخص ما أو تم تجربتها.
ذلك لأن تحديد تسلسل البروتين أصعب بكثير من تحديد تسلسل الحمض النووي - ولكن جميع البروتينات التي يستطيع كائن حي معين (سواء أكان ميكروبًا أو إنسانًا) أن يصنعها يتم ترميزها في تسلسل الحمض النووي لجينومه. وبالتالي ، فإن الاختصار الذكي الذي استخدمه علماء الأحياء الجزيئية هو قراءة تسلسل البروتين مباشرة في مصدر المعلومات: في تسلسل الحمض النووي! بهذه الطريقة ، يمكننا التظاهر بمعرفة تسلسل الأحماض الأمينية لبروتين لم يتم عزله في أنبوب اختبار.
Analyzing DNA,RNA Sequences L4