Información

¿Todos los seres humanos tienen una secuencia de nucleótidos idéntica para ciertas proteínas, por ejemplo, la hemoglobina?

¿Todos los seres humanos tienen una secuencia de nucleótidos idéntica para ciertas proteínas, por ejemplo, la hemoglobina?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Todos los humanos tenemos el mismo tipo de proteínas en nuestro cuerpo. Tomemos la hemoglobina, por ejemplo.

¿El gen que codifica la hemoglobina en mi cuerpo es idéntico al gen de todos los demás o hay ligeras variaciones en la secuencia de nucleótidos?

¿Hay ejemplos de proteínas que se conservan siempre por completo a nivel de población?


Los humanos tenemos muchas variantes

Hay variación. El proyecto que utilizo para ayudar a comprender esta variación natural es gnomAD. Usando VarMap y un archivo gnomAD ligeramente desactualizado, conté 16007805 variantes de codificación de proteínas en todo el genoma humano. Este número solo aumentará con el tiempo.

De hecho, el proyecto 1000 Genome encontró que, en promedio, cada persona tiene entre 250 y 300 variantes de proteínas con pérdida de función que no se encuentran en sus padres (The 1000 Genomes Project Consortium, 2010).

Este es un concepto importante para la salud humana. ClinVar es uno de los muchos proyectos que tiene como objetivo catalogar y estudiar cuándo estas variaciones conducen a una enfermedad en un contexto clínico. Otro es el proyecto de 100.000 genomas de Genomics England, que estudia los datos de pacientes del NHS en casos de enfermedades raras y cáncer.

La hemoglobina tiene variantes, incluidas variantes de la enfermedad.

En el momento de escribir este artículo, HBA1 (gen de la subunidad alfa de la hemoglobina) tiene 183 variantes de gnomAD y 17 variantes patogénicas en ClinVar (procedente de gnomAD). Nuevamente, es probable que ambos números aumenten porque los datos cubrirán a más personas.

Restricciones en proteínas de gran importancia.

Pero la pregunta subyacente es, creo, "¿Hay algunas proteínas que son tan importantes que la vida las mantiene muy limitadas?" es decir cualquier variación dará lugar a una célula inválida o un fenotipo de enfermedad. gnomAD intenta agregar métricas "restringidas" a cada registro de proteína, y algunas son más restringidas que otras.

Por ejemplo:

  • La hemoglobina puntúa un pLI de 0,01 (las puntuaciones más altas son más intolerantes a la variación, específicamente a la pérdida de variación de la función).

  • p53 es un guardián del ciclo celular, cuyos mutantes son comunes en las células cancerosas. Tiene una puntuación pLI de 0,53, lo que significa que es muy intolerante a la variación en comparación con la hemoglobina.

  • La proteína ribosómica L5 tiene un pLI de 0,998, lo que implica que puede tolerar poca o ninguna variación. El ribosoma es fundamental en la producción de proteínas, por lo que su alteración puede provocar una ruptura completa de la vida celular.

Variación y evolución

Existe una diferencia casi filosófica entre la variación humana y la evolución humana. La variación es una instantánea estática de nuestra secuencia de proteínas de un individuo a otro. La evolución en el sentido de una matriz Dayhoff requiere mirar hacia atrás millones o miles de millones de años comparando secuencias de proteínas similares en muchas especies.


Es muy poco probable que exista alguna proteína que esté hecha de secuencias de nucleótidos completamente idénticas en toda la población humana. Ciertamente, habrá regiones dentro de un gen que estén altamente conservadas, pero hay poca presión evolutiva para conservar la secuencia de nucleótidos de un gen completo en toda la población.

Esto se debe en parte al hecho de que diferentes codones pueden traducirse en el mismo aminoácido. Aun asi si una proteína es (fenotípicamente) idéntica en toda la población humana, los genes que la hacen pueden usar diferentes secuencias para codificar los mismos aminoácidos. Esto por sí solo puede permitir una cantidad increíblemente grande de posibles variaciones genéticas que pueden codificar una proteína idéntica.


Recursos relacionados: mutación neutra (wikipedia) y la teoría neutra de la evolución molecular (wikipedia)


A nivel de gen completo, hay probable no hay conservación absoluta de ningún gen codificador de proteínas humanas a nivel de población, aunque podría haber una conservación completa entre los individuos. Tenga en cuenta que la mayoría de los genes humanos tienen una longitud del orden de decenas de miles de pares de bases, y solo una parte de esa longitud codifica motivos funcionales. Sin embargo, existen elementos ultraconservados del orden de cientos de pares de bases que son idénticos entre humanos, ratas y ratones. La mayoría de estos elementos no son codificantes y algunos se transcriben como ncRNA funcionales.


Ningún gen y ningún par de bases son inmunes a la mutación. Es la presión de selección natural la que mantiene relativamente constante a algún gen. Las mutaciones neutrales no están sujetas a presiones, por lo que todo cambia. Y luego, hay mutaciones "casi neutrales" que también pasan de largo.


Proteína

Las proteínas son moléculas de gran tamaño (macromoléculas), polímeros de unidades estructurales llamadas aminoácidos. Existe un total de 20 aminoácidos diferentes en las proteínas y de cientos a miles de estos aminoácidos se unen entre sí en largas cadenas para formar una proteína. Los aminoácidos pueden liberarse de las proteínas por hidrólisis. (La hidrólisis es la ruptura de un enlace covalente mediante la adición de agua en condiciones adecuadas).

Debido a su gran tamaño, las proteínas forman obligatoriamente coloides cuando se dispersan en un disolvente adecuado. Esta propiedad distingue de manera característica a las proteínas de las soluciones que contienen moléculas de pequeño tamaño.

Dado que los aminoácidos son los "bloques de construcción" de las proteínas, su estructura y propiedades se considerarán en primer lugar.


B. Parámetros de búsqueda BLAST

Límite por organismo

Una búsqueda BLAST puede estar limitada por el organismo. El campo de entrada sugerirá que se completen una vez que el usuario comience a escribir. Una casilla de verificación excluirá en lugar de incluir el organismo en la búsqueda.

Limitar por consulta de Entrez

Una búsqueda BLAST puede limitarse al resultado de una consulta Entrez contra la base de datos elegida. Esto restringe la búsqueda a un subconjunto de entradas de esa base de datos que se ajustan al requisito de la consulta Entrez. Los términos normalmente aceptados por las búsquedas de nucleótidos o proteínas de Entrez se aceptan aquí. A continuación se dan algunos ejemplos.

    proteasa NO vih1 [organismo]

Esto limitará una búsqueda BLAST a todas las proteasas, excepto a las del VIH 1.

Esto limita la búsqueda a entradas con longitudes entre 1000 y 2000 bases para entradas de nucleótidos, o entre 1000 y 2000 residuos para entradas de proteínas.

Esto limita la búsqueda a las entradas de ARNm de ratón en la base de datos. Para organismos comunes, también se puede seleccionar del menú desplegable.

Este es otro ejemplo de uso, que limita la búsqueda a secuencias de proteínas con un peso molecular calculado entre 10 kD y 100 kD.

Esto limita la búsqueda a las entradas que están anotadas con un calificador / specimen_voucher en la función de origen.

Para obtener ayuda en la construcción de consultas de Entrez, consulte la sección "Redacción de sentencias de búsqueda avanzada" del documento de ayuda de Entrez. Es importante conocer el contenido de una base de datos y aplicar los términos de Entrez en consecuencia. Por ejemplo, biomol_mrna [prop] no debe aplicarse a htgs o bases de datos de cromosomas ya que no contienen entradas de ARNm.

Ajustes de composición

Las matrices de sustitución de aminoácidos pueden ajustarse de diversas formas para compensar las composiciones de aminoácidos de las secuencias que se comparan. El ajuste más simple es escalar todos los puntajes de sustitución por una constante determinada analíticamente, mientras que dejando fijos los puntajes de brecha, este procedimiento se denomina "estadísticas basadas en la composición" (Schaffer et al., 2001). Las puntuaciones escaladas resultantes producen valores E más precisos que las puntuaciones estándar sin escala. Un enfoque más sofisticado ajusta cada puntuación en una matriz de sustitución estándar por separado para compensar las composiciones de las dos secuencias que se comparan (Yu et al., 2003 Yu y Altschul, 2005 Altschul et al., 2005). Este "ajuste de la matriz de puntuación de composición" puede invocarse sólo en determinadas condiciones específicas para las que se ha determinado empíricamente que es beneficioso (Altschul et al., 2005). En todas las demás condiciones, se utilizan estadísticas basadas en la composición. Alternativamente, el ajuste compositivo puede invocarse universalmente.

[1] Schaffer, A.A., Aravind, L., Madden, T.L., Shavirin, S., Spouge, J.L., Wolf, Y.I., Koonin, E.V. y Altschul, S.F. (2001) "Mejora de la precisión de las búsquedas en la base de datos de proteínas PSI-BLAST con estadísticas basadas en la composición y otras mejoras", Nucleic Acids Res. 29: 2994-3005.
[2] Yu, Y.-K., Wootton, J.C. y Altschul, S.F. (2003) "El ajuste composicional de las matrices de sustitución de aminoácidos", Proc. Natl. Acad. Sci. USA 100: 15688-15693.
[3] Yu, Y.-K. y Altschul, S.F. (2005) "La construcción de matrices de sustitución de aminoácidos para la comparación de proteínas con composiciones no estándar", Bioinformatics 21: 902-911.
[4] Altschul, S.F., Wootton, J.C., Gertz, E.M., Agarwala, R., Morgulis, A., Schaffer, A.A. y Yu, Y.-K. (2005) "Búsquedas en bases de datos de proteínas usando matrices de sustitución ajustadas en composición", FEBS J 272 (20): 5101-9.

Filtrar

Esta función enmascara los segmentos de la secuencia de consulta que tienen baja complejidad compositiva, según lo determinado por el programa SEG de Wootton y Federhen (Computers and Chemistry, 1993) o, para BLASTN, por el programa DUST de Tatusov y Lipman. El filtrado puede eliminar informes estadísticamente significativos pero biológicamente poco interesantes de la salida de la explosión (p. Ej., Impactos contra regiones ricas en ácido, básico o prolina), dejando las regiones más interesantes desde el punto de vista biológico de la secuencia de consulta disponibles para la comparación específica con las secuencias de la base de datos.

El filtrado solo se aplica a la secuencia de consulta (o sus productos de traducción), no a las secuencias de la base de datos. El filtrado predeterminado es DUST para BLASTN, SEG para otros programas.

No es inusual que SEG no enmascare absolutamente nada cuando se aplica a secuencias en SWISS-PROT o refseq, por lo que no se debe esperar que el filtrado siempre produzca un efecto. Además, en algunos casos, las secuencias están enmascaradas en su totalidad, lo que indica que la importancia estadística de cualquier coincidencia informada con la secuencia de consulta sin filtrar debe ser sospechosa. Esto también dará lugar a un error de búsqueda cuando se utilice la configuración predeterminada.

Esta opción enmascara las repeticiones humanas (LINE, SINE, más repeticiones retrovirales) y es útil para secuencias humanas que pueden contener estas repeticiones. El filtrado de repeticiones puede aumentar la velocidad de una búsqueda, especialmente con secuencias muy largas (& gt100 kb) y contra bases de datos que contienen un gran número de repeticiones (htgs). Este filtro debe comprobarse en busca de consultas genómicas para evitar problemas potenciales que puedan surgir de las numerosas coincidencias, a menudo falsas, con esos elementos repetidos.

Para obtener más información, consulte "¿Por qué se agota el tiempo de espera de mi búsqueda en los servidores BLAST?" en las Preguntas frecuentes de BLAST.

Filtro (máscara para tabla de búsqueda solamente)

Las búsquedas BLAST constan de dos fases, encontrar resultados basados ​​en una tabla de búsqueda y luego extenderlos. Esta opción se enmascara solo con el propósito de construir la tabla de búsqueda utilizada por BLAST para que no se encuentren coincidencias basadas en secuencias de baja complejidad o repeticiones (si se marca el filtro de repetición). Las extensiones BLAST se realizan sin enmascaramiento, por lo que se pueden extender a través de una secuencia de baja complejidad.

Con esta opción seleccionada, puede cortar y pegar una secuencia FASTA en mayúsculas y denotar las áreas que le gustaría filtrar con minúsculas. Esto le permite personalizar lo que se filtra de la secuencia durante la comparación con las bases de datos BLAST.

Se pueden usar diferentes combinaciones de las opciones de filtro anteriores para lograr un resultado de búsqueda óptimo.

Tamaño de la palabra

BLAST es una heurística que funciona encontrando coincidencias de palabras entre la consulta y las secuencias de la base de datos. Uno puede pensar en este proceso como encontrar "puntos calientes" que BLAST puede usar para iniciar extensiones que eventualmente podrían conducir a alineaciones en toda regla. Para búsquedas de nucleótido-nucleótido (es decir, "blastn") se requiere una coincidencia exacta de la palabra completa antes de que se inicie una extensión, de modo que normalmente se regula la sensibilidad y velocidad de la búsqueda aumentando o disminuyendo el tamaño de la palabra. Para otras búsquedas BLAST, se tienen en cuenta las coincidencias de palabras no exactas en función de la similitud entre palabras. La cantidad de similitud se puede variar. La página web permite los tamaños de palabra 2, 3 y 6.

Suponer

Esta configuración especifica el umbral de significación estadística para informar coincidencias con las secuencias de la base de datos. El valor predeterminado (10) significa que se espera que 10 de tales coincidencias se encuentren simplemente por casualidad, según el modelo estocástico de Karlin y Altschul (1990). Si la significación estadística atribuida a una coincidencia es mayor que el umbral EXPECT, la coincidencia no se informará. Los umbrales de EXPECT más bajos son más estrictos, lo que lleva a que se notifiquen menos coincidencias.

Recompensa y penalización por programas de nucleótidos

Muchas búsquedas de nucleótidos utilizan un sistema de puntuación simple que consiste en una "recompensa" por una coincidencia y una "penalización" por una falta de coincidencia. La relación (absoluta) de recompensa / penalización debe aumentarse a medida que se observan secuencias más divergentes. Una proporción de 0.33 (1 / -3) es apropiada para secuencias que están conservadas en aproximadamente un 99% una proporción de 0.5 (1 / -2) es mejor para secuencias que están conservadas en un 95% una proporción de aproximadamente uno (1 / -1) es mejor para secuencias conservadas en un 75% [1]. Leer más aquí

[1] Estados DJ, Gish W y Altschul SF (1991) METHODS: Un compañero de Methods in Enzymology 3: 66-70.

Costos de matriz y brecha

Un elemento clave en la evaluación de la calidad de un alineamiento de secuencia por pares es la "matriz de sustitución", que asigna una puntuación para alinear cualquier posible par de residuos. La matriz utilizada en una búsqueda BLAST se puede cambiar según el tipo de secuencias con las que esté buscando (consulte las Preguntas frecuentes sobre BLAST). Consulte más información sobre las matrices de sustitución BLAST.

El menú desplegable muestra los costos de brecha para la matriz elegida. Solo puede haber un número limitado de opciones para estos parámetros. El aumento de los costos de las brechas dará como resultado alineaciones que disminuyen el número de brechas introducidas.

PSI-BLAST puede guardar la Matriz de puntuación específica de posición construida a través de iteraciones. El PSSM así construido se puede utilizar en búsquedas en otras bases de datos con la misma consulta copiando y pegando el texto codificado en el campo PSSM.

  1. Ejecute una búsqueda de proteínas BLAST.
  2. Marque la casilla PSI-BLAST en la página de formato.
  3. Haga clic en el botón "Formato".
  4. En la página de resultados de PSI-BLAST, haga clic en el botón "Ejecutar iteración 2 de PSI-BLAST".
  5. Seleccione el enlace Descargar en la parte superior de la página y descargue el PSSM a su computadora.

Para utilizar el PSSM en una nueva búsqueda BLAST de proteínas con otras bases de datos:

  1. Abra una nueva página de proteína BLAST.
  2. Seleccione PSI-BLAST como algoritmo en "Selección de programa" (es posible que ya esté configurado).
  3. Seleccione el "+" junto a "Parámetros de algoritmo" en la parte inferior de la página de búsqueda.
  4. Desplácese hasta la sección "PSI / PHI / DELTA BLAST" y use el botón "Elegir archivo" para cargar el PSSM que guardó en el paso 5 anterior.
  5. Seleccione una base de datos de destino diferente.
  6. Haga clic en el botón "EXPLOSIÓN" para iniciar la búsqueda

Patrón PHI-BLAST

PHI-BLAST (BLAST iniciado por patrón-golpe) es un programa de búsqueda que combina la coincidencia de expresiones regulares con alineaciones locales que rodean la coincidencia. Dada una secuencia de proteína S y un patrón de expresión regular P que ocurre en S, PHI-BLAST ayuda a responder la pregunta:


ADN y Proteínas

¿Qué es el ADN?
El ADN significa ácido desoxirribonucleico y es el portador de información genética dentro de una célula. A molécula de ADN consta de dos cadenas que se envuelven entre sí. Las cadenas se retuercen para formar una doble hélice. Cada cadena se compone de subunidades repetidas llamadas nucleótidos que se mantienen unidos por enlaces químicos. Hay cuatro tipos diferentes de nucleótidos en el ADN, y se diferencian entre sí por el tipo de base que está presente: adenina (A), timina (T), guanina (G) y citosina (C). Una base de una de las cadenas que componen el ADN está unida químicamente a una base de la otra cadena. Este vínculo mantiene unidas las dos cadenas. Además, existen reglas de emparejamiento de bases que determinan qué bases pueden unirse entre sí. La adenina y la timina forman pares de bases que se mantienen unidas por dos enlaces, mientras que la citosina y la guanina forman pares de bases que se mantienen unidas por tres enlaces. Las bases que se unen se conocen como complementarias.

Cómo el ADN codifica las proteínas:

1. Transcripción: ADN a ARNm

Durante la transcripción, el ADN se convierte en ARN mensajero (ARNm) mediante una enzima llamada ARN polimerasa. El ARN es una molécula químicamente similar al ADN y también contiene subunidades de nucleótidos repetidos. Sin embargo, las "bases" del ARN difieren de las del ADN en que la timina (T) se reemplaza por uracilo (U) en el ARN. Las bases de ADN y ARN también se mantienen juntas mediante enlaces químicos y tienen reglas específicas de emparejamiento de bases. En el emparejamiento de bases de ADN / ARN, la adenina (A) se empareja con el uracilo (U) y la citosina (C) se empareja con la guanina (G). La conversión de ADN en ARNm se produce cuando una ARN polimerasa hace una copia de ARNm complementaria de una secuencia de "molde" de ADN. Una vez sintetizada la molécula de ARNm, se deben realizar modificaciones químicas específicas que permitan traducir el ARNm en proteína.

2. Traducción: ARNm a proteína

Durante la traducción, el ARNm se convierte en proteína. Un grupo de tres nucleótidos de ARNm codifica un aminoácido específico y se llama codón. Cada ARNm corresponde a una secuencia de aminoácidos específica y forma la proteína resultante. Dos codones, llamados codones de inicio y finalización, señalan el comienzo y el final de la traducción. El producto proteico final se forma después de alcanzar el codón de terminación. Se puede hacer referencia a una tabla llamada código genético para ver qué codones codifican qué aminoácidos específicos. Varios de los codones terminan codificando el mismo aminoácido, un proceso que se denomina redundancia en el código genético.


14.2 Estructura y secuenciación del ADN

Al final de esta sección, podrá hacer lo siguiente:

  • Describe la estructura del ADN.
  • Explica el método Sanger de secuenciación de ADN.
  • Discutir las similitudes y diferencias entre el ADN eucariota y procariota

Los componentes básicos del ADN son los nucleótidos. Los componentes importantes del nucleótido son una base nitrogenada (portadora de nitrógeno), un azúcar de 5 carbonos (pentosa) y un grupo fosfato (Figura 14.5). El nombre del nucleótido depende de la base nitrogenada. La base nitrogenada puede ser una purina como adenina (A) y guanina (G), o una pirimidina como citosina (C) y timina (T).

Conexión visual

Las imágenes de arriba ilustran las cinco bases de ADN y ARN. Examine las imágenes y explique por qué se denominan "bases nitrogenadas". ¿En qué se diferencian las purinas de las pirimidinas? ¿En qué se diferencia una purina o pirimidina de otra, por ejemplo, adenina de guanina? ¿En qué se diferencia un nucleósido de un nucleótido?

Las purinas tienen una estructura de doble anillo con un anillo de seis miembros fusionado a un anillo de cinco miembros. Las pirimidinas son de tamaño más pequeño y tienen una estructura de anillo única de seis miembros.

El azúcar es desoxirribosa en el ADN y ribosa en el ARN. Los átomos de carbono del azúcar de cinco carbonos se numeran 1 ', 2', 3 ', 4' y 5 '(1' se lee como “un primo”). El fosfato, que hace que el ADN y el ARN sean ácidos, se conecta al carbono 5 'del azúcar mediante la formación de un enlace éster entre el ácido fosfórico y el grupo 5'-OH (un éster es un ácido + un alcohol). En los nucleótidos de ADN, el carbono 3 'del azúcar desoxirribosa está unido a un grupo hidroxilo (OH). En los nucleótidos de ARN, el carbono 2 'de la ribosa del azúcar también contiene un grupo hidroxilo. La base está adherida al 1'carbono del azúcar.

Los nucleótidos se combinan entre sí para producir enlaces fosfodiéster. El residuo de fosfato unido al carbono 5 'del azúcar de un nucleótido forma un segundo enlace éster con el grupo hidroxilo del carbono 3' del azúcar del siguiente nucleótido, formando así un enlace fosfodiéster 5'-3 '. En un polinucleótido, un extremo de la cadena tiene un fosfato 5 'libre y el otro extremo tiene un 3'-OH libre. Estos se llaman los extremos 5 'y 3' de la cadena.

En la década de 1950, Francis Crick y James Watson trabajaron juntos para determinar la estructura del ADN en la Universidad de Cambridge, Inglaterra. Otros científicos como Linus Pauling y Maurice Wilkins también estaban explorando activamente este campo. Pauling había descubierto previamente la estructura secundaria de las proteínas mediante cristalografía de rayos X. En el laboratorio de Wilkins, la investigadora Rosalind Franklin estaba usando métodos de difracción de rayos X para comprender la estructura del ADN. Watson y Crick pudieron armar el rompecabezas de la molécula de ADN sobre la base de los datos de Franklin porque Crick también había estudiado la difracción de rayos X (figura 14.6). En 1962, James Watson, Francis Crick y Maurice Wilkins recibieron el Premio Nobel de Medicina. Desafortunadamente, para entonces Franklin había muerto y los premios Nobel no se otorgan póstumamente.

Watson y Crick propusieron que el ADN está formado por dos hebras que se enrollan entre sí para formar una hélice a la derecha. El emparejamiento de bases tiene lugar entre una purina y pirimidina en hebras opuestas, de modo que A se empareja con T y G se empareja con C (sugerido por las reglas de Chargaff). Por tanto, la adenina y la timina son pares de bases complementarios, y la citosina y la guanina también son pares de bases complementarios. Los pares de bases están estabilizados por enlaces de hidrógeno: la adenina y la timina forman dos enlaces de hidrógeno y la citosina y la guanina forman tres enlaces de hidrógeno. Las dos hebras son de naturaleza antiparalela, es decir, el extremo 3 'de una hebra mira hacia el extremo 5' de la otra hebra. El azúcar y el fosfato de los nucleótidos forman la columna vertebral de la estructura, mientras que las bases nitrogenadas se apilan en el interior, como los peldaños de una escalera. Cada par de bases está separado del siguiente par de bases por una distancia de 0,34 nm, y cada vuelta de la hélice mide 3,4 nm. Por lo tanto, están presentes 10 pares de bases por vuelta de la hélice. El diámetro de la doble hélice del ADN es de 2 nm y es uniforme en toda su extensión. Solo el emparejamiento entre una purina y pirimidina y la orientación antiparalela de las dos cadenas de ADN pueden explicar el diámetro uniforme. La torsión de las dos hebras entre sí da como resultado la formación de ranuras mayores y menores uniformemente espaciadas (Figura 14.7).

Técnicas de secuenciación de ADN

Hasta la década de 1990, la secuenciación del ADN (leer la secuencia del ADN) era un proceso relativamente costoso y largo. El uso de nucleótidos radiomarcados también agravó el problema por motivos de seguridad. Con la tecnología disponible actualmente y las máquinas automatizadas, el proceso es más barato, más seguro y se puede completar en cuestión de horas. Fred Sanger desarrolló el método de secuenciación utilizado para el proyecto de secuenciación del genoma humano, que se utiliza ampliamente en la actualidad (Figura 14.8).

Enlace al aprendizaje

Visite este sitio para ver un video que explica la técnica de lectura de secuencias de ADN que resultó del trabajo de Sanger.

El método de secuenciación se conoce como método de terminación de cadena didesoxi. El método se basa en el uso de terminadores de cadena, los didesoxinucleótidos (ddNTP). Los ddNTPS se diferencian de los desoxinucleótidos por la falta de un grupo 3 'OH libre en el azúcar de cinco carbonos. Si se agrega un ddNTP a una cadena de ADN en crecimiento, la cadena no se puede extender más porque el grupo 3 'OH libre necesario para agregar otro nucleótido no está disponible. Usando una proporción predeterminada de desoxinucleótidos a didesoxinucleótidos, es posible generar fragmentos de ADN de diferentes tamaños.

La muestra de ADN que se va a secuenciar se desnaturaliza (se separa en dos hebras calentándola a altas temperaturas). El ADN se divide en cuatro tubos en los que se añaden un cebador, la ADN polimerasa y los cuatro nucleósidos trifosfatos (A, T, G y C). Además, se añaden cantidades limitadas de uno de los cuatro trifosfatos de didesoxinucleósido (ddCTP, ddATP, ddGTP y ddTTP) a cada tubo, respectivamente. Los tubos están etiquetados como A, T, G y C de acuerdo con el ddNTP agregado. Para fines de detección, cada uno de los cuatro didesoxinucleótidos lleva una etiqueta fluorescente diferente. El alargamiento de la cadena continúa hasta que se incorpora un didesoxi nucleótido fluorescente, después de lo cual no tiene lugar ningún alargamiento adicional. Una vez finalizada la reacción, se realiza la electroforesis. Incluso se puede detectar una diferencia en la longitud de una sola base. La secuencia se lee en un escáner láser que detecta el marcador fluorescente de cada fragmento. Por su trabajo en la secuenciación del ADN, Sanger recibió un Premio Nobel de Química en 1980.

Enlace al aprendizaje

La secuenciación del genoma de Sanger ha llevado a una carrera para secuenciar genomas humanos a gran velocidad y bajo costo. Obtenga más información viendo la animación aquí.

La electroforesis en gel es una técnica que se utiliza para separar fragmentos de ADN de diferentes tamaños. Por lo general, el gel está hecho de una sustancia química llamada agarosa (un polímero de polisacárido extraído de algas marinas con alto contenido de residuos de galactosa). Se añade agarosa en polvo a un tampón y se calienta. Después de enfriar, la solución de gel se vierte en una bandeja de colada. Una vez que el gel se ha solidificado, el ADN se carga en el gel y se aplica corriente eléctrica. El ADN tiene una carga neta negativa y se mueve desde el electrodo negativo hacia el electrodo positivo. La corriente eléctrica se aplica durante el tiempo suficiente para permitir que el ADN se separe según el tamaño, los fragmentos más pequeños estarán más lejos del pozo (donde se cargó el ADN) y los fragmentos de peso molecular más pesado estarán más cerca del pozo. Una vez que se separa el ADN, el gel se tiñe con un tinte específico de ADN para verlo (Figura 14.9).

Conexión Evolution

Genoma neandertal: ¿cómo nos relacionamos?

El primer borrador de secuencia del genoma neandertal fue publicado recientemente por Richard E. Green et al. en 2010. 1 Los neandertales son los antepasados ​​más cercanos de los humanos actuales. Se sabía que habían vivido en Europa y Asia occidental (y ahora, quizás, en el norte de África) antes de que desaparecieran de los registros fósiles hace aproximadamente 30.000 años. El equipo de Green estudió restos fósiles de casi 40.000 años que fueron seleccionados de sitios en todo el mundo. Se emplearon medios extremadamente sofisticados de preparación de muestras y secuenciación de ADN debido a la naturaleza frágil de los huesos y la fuerte contaminación microbiana. En su estudio, los científicos pudieron secuenciar unos cuatro mil millones de pares de bases. La secuencia neandertal se comparó con la de los humanos actuales de todo el mundo. Después de comparar las secuencias, los investigadores encontraron que el genoma del neandertal tenía entre un 2 y un 3 por ciento más de similitud con las personas que viven fuera de África que con las personas en África. Si bien las teorías actuales han sugerido que todos los humanos de hoy en día se pueden rastrear hasta una pequeña población ancestral en África, los datos del genoma neandertal sugieren cierto mestizaje entre los neandertales y los primeros humanos modernos.

Green y sus colegas también descubrieron segmentos de ADN entre personas en Europa y Asia que son más similares a las secuencias de Neandertal que a otras secuencias humanas contemporáneas. Otra observación interesante fue que los neandertales están tan estrechamente relacionados con la gente de Papúa Nueva Guinea como con los de China o Francia. Esto es sorprendente porque los restos fósiles de neandertales se han localizado solo en Europa y Asia occidental. Lo más probable es que el intercambio genético tuvo lugar entre los neandertales y los humanos modernos cuando los humanos modernos emergieron de África, antes de la divergencia de europeos, asiáticos orientales y Papúa Nueva Guinea.

Varios genes parecen haber sufrido cambios con respecto a los neandertales durante la evolución de los humanos actuales. Estos genes están involucrados en la estructura craneal, el metabolismo, la morfología de la piel y el desarrollo cognitivo. Uno de los genes de especial interés es RUNX2, que es diferente en los humanos y los neandertales de hoy en día. Este gen es responsable del hueso frontal prominente, la caja torácica en forma de campana y las diferencias dentales que se observan en los neandertales. Se especula que un cambio evolutivo en RUNX2 fue importante en el origen de los seres humanos de hoy en día, y esto afectó el cráneo y la parte superior del cuerpo.

Enlace al aprendizaje

Vea la charla de Svante Pääbo que explica la investigación del genoma neandertal en la conferencia anual TED (Tecnología, Entretenimiento, Diseño) de 2011.

Empaquetado de ADN en células

Los procariotas son mucho más simples que los eucariotas en muchas de sus características (figura 14.10). La mayoría de los procariotas contienen un cromosoma circular único que se encuentra en un área del citoplasma llamada región nucleoide.

Conexión visual

En las células eucariotas, la síntesis de ADN y ARN se produce en un compartimento separado de la síntesis de proteínas. En las células procariotas, ambos procesos ocurren juntos. ¿Qué ventajas podría tener separar los procesos? ¿Qué ventajas podría tener que ocurran juntos?

El tamaño del genoma en uno de los procariotas mejor estudiados, E. coli, es de 4,6 millones de pares de bases (aproximadamente 1,1 mm, si se corta y se estira). Entonces, ¿cómo encaja esto dentro de una pequeña célula bacteriana? El ADN se tuerce mediante lo que se conoce como superenrollamiento. El superenrollamiento sugiere que el ADN está "subenrollado" (menos de una vuelta de la hélice por cada 10 pares de bases) o "sobreenrollado" (más de 1 vuelta por cada 10 pares de bases) de su estado relajado normal. Se sabe que algunas proteínas están involucradas en el superenrollamiento de otras proteínas y enzimas como la ADN girasa ayudan a mantener la estructura superenrollada.

Los eucariotas, cuyos cromosomas consisten cada uno en una molécula de ADN lineal, emplean un tipo diferente de estrategia de empaquetamiento para encajar su ADN dentro del núcleo (Figura 14.11). En el nivel más básico, el ADN está envuelto alrededor de proteínas conocidas como histonas para formar estructuras llamadas nucleosomas. Las histonas son proteínas conservadas evolutivamente que son ricas en aminoácidos básicos y forman un octámero compuesto por dos moléculas de cada una de cuatro histonas diferentes. El ADN (recuerde, está cargado negativamente debido a los grupos fosfato) está envuelto firmemente alrededor del núcleo de histonas. Este nucleosoma se vincula al siguiente con la ayuda de un ADN enlazador. Esto también se conoce como estructura de “cuentas en una cuerda”. Con la ayuda de una quinta histona, una cadena de nucleosomas se compacta aún más en una fibra de 30 nm, que es el diámetro de la estructura. Los cromosomas en metafase se condensan aún más por asociación con proteínas de andamiaje. En la etapa de metafase, los cromosomas son más compactos, aproximadamente 700 nm de ancho.

En la interfase, los cromosomas eucariotas tienen dos regiones distintas que se pueden distinguir por tinción. La región compacta se conoce como heterocromatina y la región menos densa se conoce como eucromatina. La heterocromatina generalmente contiene genes que no se expresan y se encuentra en las regiones del centrómero y los telómeros. La eucromatina generalmente contiene genes que se transcriben, con ADN empaquetado alrededor de nucleosomas pero no más compactado.

Notas al pie

Como Asociado de Amazon, ganamos con las compras que califican.

¿Quiere citar, compartir o modificar este libro? Este libro es Creative Commons Attribution License 4.0 y debe atribuir OpenStax.

    Si está redistribuyendo todo o parte de este libro en formato impreso, debe incluir en cada página física la siguiente atribución:

  • Utilice la siguiente información para generar una cita. Recomendamos utilizar una herramienta de citas como esta.
    • Autores: Mary Ann Clark, Matthew Douglas, Jung Choi
    • Editor / sitio web: OpenStax
    • Título del libro: Biología 2e
    • Fecha de publicación: 28 de marzo de 2018
    • Ubicación: Houston, Texas
    • URL del libro: https://openstax.org/books/biology-2e/pages/1-introduction
    • URL de la sección: https://openstax.org/books/biology-2e/pages/14-2-dna-structure-and-sequencing

    © 7 de enero de 2021 OpenStax. El contenido de los libros de texto producido por OpenStax tiene una licencia Creative Commons Attribution License 4.0. El nombre de OpenStax, el logotipo de OpenStax, las portadas de libros de OpenStax, el nombre de OpenStax CNX y el logotipo de OpenStax CNX no están sujetos a la licencia Creative Commons y no pueden reproducirse sin el consentimiento previo y expreso por escrito de Rice University.


    Cromosomas

    El ADN de una célula no es una sola molécula larga. Está dividido en varios segmentos de longitudes desiguales. En ciertos puntos del ciclo de vida de una célula, esos segmentos pueden ser paquetes muy compactos conocidos como cromosomas. Durante una etapa, los cromosomas parecen tener forma de X.

    Cada hongo, planta y animal tiene un número determinado de cromosomas. Por ejemplo, los humanos tienen 46 cromosomas (23 pares), las plantas de arroz tienen 24 cromosomas y los perros tienen 78 cromosomas.


    El mecanismo de síntesis de proteínas

    La traducción es similar en procariotas y eucariotas. Aquí exploraremos cómo se produce la traducción en E. coli, un procariota representativo, y especificar las diferencias entre la traducción bacteriana y eucariota.

    Iniciación

    los inicio de la síntesis de proteínas comienza con la formación de un complejo de iniciación. En E. coli, este complejo involucra el pequeño ribosoma 30S, la plantilla de ARNm, tres factores de iniciación that help the ribosome assemble correctly, guanosine triphosphate (GTP) that acts as an energy source, and a special initiator tRNA carrying norte-formyl-methionine (fMet-tRNA fMet ) (Figure 4). The initiator tRNA interacts with the start codon AUG of the mRNA and carries a formylated methionine (fMet). Because of its involvement in initiation, fMet is inserted at the beginning (N terminus) of every polypeptide chain synthesized by E. coli. En E. coli mRNA, a leader sequence upstream of the first AUG codon, called the Secuencia Shine-Dalgarno (also known as the ribosomal binding site AGGAGG), interacts through complementary base pairing with the rRNA molecules that compose the ribosome. This interaction anchors the 30S ribosomal subunit at the correct location on the mRNA template. At this point, the 50S ribosomal subunit then binds to the initiation complex, forming an intact ribosome.

    In eukaryotes, initiation complex formation is similar, with the following differences:

    • The initiator tRNA is a different specialized tRNA carrying methionine, called Met-tRNAi
    • Instead of binding to the mRNA at the Shine-Dalgarno sequence, the eukaryotic initiation complex recognizes the 5′ cap of the eukaryotic mRNA, then tracks along the mRNA in the 5′ to 3′ direction until the AUG start codon is recognized. At this point, the 60S subunit binds to the complex of Met-tRNAi, mRNA, and the 40S subunit.

    Figure 4. Translation in bacteria begins with the formation of the initiation complex, which includes the small ribosomal subunit, the mRNA, the initiator tRNA carrying N-formyl-methionine, and initiation factors. Then the 50S subunit binds, forming an intact ribosome.

    Alargamiento

    In prokaryotes and eukaryotes, the basics of elongation of translation son lo mismo. En E. coli, the binding of the 50S ribosomal subunit to produce the intact ribosome forms three functionally important ribosomal sites: The A (aminoacyl) site binds incoming charged aminoacyl tRNAs. los P (peptidyl) site binds charged tRNAs carrying amino acids that have formed peptide bonds with the growing polypeptide chain but have not yet dissociated from their corresponding tRNA. los E (exit) site releases dissociated tRNAs so that they can be recharged with free amino acids. There is one notable exception to this assembly line of tRNAs: During initiation complex formation, bacterial fMet−tRNA fMet or eukaryotic Met-tRNAi enters the P site directly without first entering the A site, providing a free A site ready to accept the tRNA corresponding to the first codon after the AUG.

    Elongation proceeds with single-codon movements of the ribosome each called a translocation event. During each translocation event, the charged tRNAs enter at the A site, then shift to the P site, and then finally to the E site for removal. Ribosomal movements, or steps, are induced by conformational changes that advance the ribosome by three bases in the 3′ direction. Los enlaces peptídicos se forman entre el grupo amino del aminoácido unido al ARNt del sitio A y el grupo carboxilo del aminoácido unido al ARNt del sitio P. La formación de cada enlace peptídico es catalizada por peptidil transferasa, an RNA-based ribozyme that is integrated into the 50S ribosomal subunit. The amino acid bound to the P-site tRNA is also linked to the growing polypeptide chain. As the ribosome steps across the mRNA, the former P-site tRNA enters the E site, detaches from the amino acid, and is expelled. Several of the steps during elongation, including binding of a charged aminoacyl tRNA to the A site and translocation, require energy derived from GTP hydrolysis, which is catalyzed by specific elongation factors. Sorprendentemente, el E. coli translation apparatus takes only 0.05 seconds to add each amino acid, meaning that a 200 amino-acid protein can be translated in just 10 seconds.

    Terminación

    los termination of translation occurs when a nonsense codon (UAA, UAG, or UGA) is encountered for which there is no complementary tRNA. On aligning with the A site, these nonsense codons are recognized by release factors in prokaryotes and eukaryotes that result in the P-site amino acid detaching from its tRNA, releasing the newly made polypeptide. The small and large ribosomal subunits dissociate from the mRNA and from each other they are recruited almost immediately into another translation init iation complex.

    In summary, there are several key features that distinguish prokaryotic gene expression from that seen in eukaryotes. These are illustrated in Figure 6 and listed in Table 1.

    Figure 6. (a) In prokaryotes, the processes of transcription and translation occur simultaneously in the cytoplasm, allowing for a rapid cellular response to an environmental cue. (b) In eukaryotes, transcription is localized to the nucleus and translation is localized to the cytoplasm, separating these processes and necessitating RNA processing for stability.

    30S (small subunit) with 16S rRNA subunit

    40S (small subunit) with 18S rRNA subunit


    Human Biology C11

    Utilice estas tarjetas didácticas para ayudar a memorizar información. Mire la tarjeta grande e intente recordar lo que está en el otro lado. Then tap the card to flip it. If you knew the answer, tap the green Know box. Otherwise, tap the red Don't know box.

    When you've placed seven or more cards in the Don't know box, tap "retry" to try those cards again.

    If you've accidentally put the card in the wrong box, just tap on the card to take it out of the box.

    También puede usar su teclado para mover las tarjetas de la siguiente manera:

    • BARRA ESPACIADORA - voltea la carta actual
    • FLECHA IZQUIERDA: mueve la carta a la pila de No sé
    • FLECHA DERECHA: mueve la carta a la pila de conocimientos
    • RETROCESO: deshace la acción anterior

    Si ha iniciado sesión en su cuenta, este sitio web recordará las tarjetas que conoce y las que no para que estén en la misma casilla la próxima vez que inicie sesión.

    Cuando necesite un descanso, pruebe una de las otras actividades enumeradas debajo de las flashcards como Matching, Snowman o Hungry Bug. Aunque puede parecer que estás jugando, tu cerebro aún está haciendo más conexiones con la información para ayudarte.


    Estructura proteica

    Each successive level of protein folding ultimately contributes to its shape and therefore its function.

    Objetivos de aprendizaje

    Summarize the four levels of protein structure

    Conclusiones clave

    Puntos clave

    • Protein structure depends on its amino acid sequence and local, low-energy chemical bonds between atoms in both the polypeptide backbone and in amino acid side chains.
    • Protein structure plays a key role in its function if a protein loses its shape at any structural level, it may no longer be functional.
    • Primary structure is the amino acid sequence.
    • Secondary structure is local interactions between stretches of a polypeptide chain and includes α-helix and β-pleated sheet structures.
    • Tertiary structure is the overall the three-dimension folding driven largely by interactions between R groups.
    • Quarternary structures is the orientation and arrangement of subunits in a multi-subunit protein.

    Términos clave

    • antiparallel: The nature of the opposite orientations of the two strands of DNA or two beta strands that comprise a protein’s secondary structure
    • disulfide bond: A bond, consisting of a covalent bond between two sulfur atoms, formed by the reaction of two thiol groups, especially between the thiol groups of two proteins
    • β-pleated sheet: secondary structure of proteins where N-H groups in the backbone of one fully-extended strand establish hydrogen bonds with C=O groups in the backbone of an adjacent fully-extended strand
    • α-helix: secondary structure of proteins where every backbone N-H creates a hydrogen bond with the C=O group of the amino acid four residues earlier in the same helix.

    The shape of a protein is critical to its function because it determines whether the protein can interact with other molecules. Protein structures are very complex, and researchers have only very recently been able to easily and quickly determine the structure of complete proteins down to the atomic level. (The techniques used date back to the 1950s, but until recently they were very slow and laborious to use, so complete protein structures were very slow to be solved.) Early structural biochemists conceptually divided protein structures into four “levels” to make it easier to get a handle on the complexity of the overall structures. To determine how the protein gets its final shape or conformation, we need to understand these four levels of protein structure: primary, secondary, tertiary, and quaternary.

    Primary Structure

    A protein’s primary structure is the unique sequence of amino acids in each polypeptide chain that makes up the protein. Really, this is just a list of which amino acids appear in which order in a polypeptide chain, not really a structure. But, because the final protein structure ultimately depends on this sequence, this was called the primary structure of the polypeptide chain. For example, the pancreatic hormone insulin has two polypeptide chains, A and B.

    Estructura primaria: The A chain of insulin is 21 amino acids long and the B chain is 30 amino acids long, and each sequence is unique to the insulin protein.

    The gene, or sequence of DNA, ultimately determines the unique sequence of amino acids in each peptide chain. A change in nucleotide sequence of the gene’s coding region may lead to a different amino acid being added to the growing polypeptide chain, causing a change in protein structure and therefore function.

    The oxygen-transport protein hemoglobin consists of four polypeptide chains, two identical α chains and two identical β chains. In sickle cell anemia, a single amino substitution in the hemoglobin β chain causes a change the structure of the entire protein. When the amino acid glutamic acid is replaced by valine in the β chain, the polypeptide folds into an slightly-different shape that creates a dysfunctional hemoglobin protein. So, just one amino acid substitution can cause dramatic changes. These dysfunctional hemoglobin proteins, under low-oxygen conditions, start associating with one another, forming long fibers made from millions of aggregated hemoglobins that distort the red blood cells into crescent or “sickle” shapes, which clog arteries. People affected by the disease often experience breathlessness, dizziness, headaches, and abdominal pain.

    Sickle cell disease: Sickle cells are crescent shaped, while normal cells are disc-shaped.

    Secondary Structure

    A protein’s secondary structure is whatever regular structures arise from interactions between neighboring or near-by amino acids as the polypeptide starts to fold into its functional three-dimensional form. Secondary structures arise as H bonds form between local groups of amino acids in a region of the polypeptide chain. Rarely does a single secondary structure extend throughout the polypeptide chain. It is usually just in a section of the chain. The most common forms of secondary structure are the α-helix and β-pleated sheet structures and they play an important structural role in most globular and fibrous proteins.

    Estructura secundaria: The α-helix and β-pleated sheet form because of hydrogen bonding between carbonyl and amino groups in the peptide backbone. Certain amino acids have a propensity to form an α-helix, while others have a propensity to form a β-pleated sheet.

    In the α-helix chain, the hydrogen bond forms between the oxygen atom in the polypeptide backbone carbonyl group in one amino acid and the hydrogen atom in the polypeptide backbone amino group of another amino acid that is four amino acids farther along the chain. This holds the stretch of amino acids in a right-handed coil. Every helical turn in an alpha helix has 3.6 amino acid residues. The R groups (the side chains) of the polypeptide protrude out from the α-helix chain and are not involved in the H bonds that maintain the α-helix structure.

    In β-pleated sheets, stretches of amino acids are held in an almost fully-extended conformation that “pleats” or zig-zags due to the non-linear nature of single C-C and C-N covalent bonds. β-pleated sheets never occur alone. They have to held in place by other β-pleated sheets. The stretches of amino acids in β-pleated sheets are held in their pleated sheet structure because hydrogen bonds form between the oxygen atom in a polypeptide backbone carbonyl group of one β-pleated sheet and the hydrogen atom in a polypeptide backbone amino group of another β-pleated sheet. The β-pleated sheets which hold each other together align parallel or antiparallel to each other. The R groups of the amino acids in a β-pleated sheet point out perpendicular to the hydrogen bonds holding the β-pleated sheets together, and are not involved in maintaining the β-pleated sheet structure.

    Tertiary Structure

    The tertiary structure of a polypeptide chain is its overall three-dimensional shape, once all the secondary structure elements have folded together among each other. Interactions between polar, nonpolar, acidic, and basic R group within the polypeptide chain create the complex three-dimensional tertiary structure of a protein. When protein folding takes place in the aqueous environment of the body, the hydrophobic R groups of nonpolar amino acids mostly lie in the interior of the protein, while the hydrophilic R groups lie mostly on the outside. Cysteine side chains form disulfide linkages in the presence of oxygen, the only covalent bond forming during protein folding. All of these interactions, weak and strong, determine the final three-dimensional shape of the protein. When a protein loses its three-dimensional shape, it will no longer be functional.

    Estructura terciaria: The tertiary structure of proteins is determined by hydrophobic interactions, ionic bonding, hydrogen bonding, and disulfide linkages.

    Estructura cuaternaria

    The quaternary structure of a protein is how its subunits are oriented and arranged with respect to one another. As a result, quaternary structure only applies to multi-subunit proteins that is, proteins made from more than one polypeptide chain. Proteins made from a single polypeptide will not have a quaternary structure.

    In proteins with more than one subunit, weak interactions between the subunits help to stabilize the overall structure. Enzymes often play key roles in bonding subunits to form the final, functioning protein.

    For example, insulin is a ball-shaped, globular protein that contains both hydrogen bonds and disulfide bonds that hold its two polypeptide chains together. Silk is a fibrous protein that results from hydrogen bonding between different β-pleated chains.

    Cuatro niveles de estructura proteica: The four levels of protein structure can be observed in these illustrations.


    Elongation and Termination in Prokaryotes

    Transcription elongation begins with the release of the polymerase σ subunit and terminates via the rho protein or via a stable hairpin.

    Objetivos de aprendizaje

    Explain the process of elongation and termination in prokaryotes

    Conclusiones clave

    Puntos clave

    • The transcription elongation phase begins with the dissociation of the σ subunit, which allows the core RNA polymerase enzyme to proceed along the DNA template.
    • Rho-dependent termination is caused by the rho protein colliding with the stalled polymerase at a stretch of G nucleotides on the DNA template near the end of the gene.
    • Rho-independent termination is caused the polymerase stalling at a stable hairpin formed by a region of complementary C–G nucleotides at the end of the mRNA.

    Términos clave

    • alargamiento: the addition of nucleotides to the 3′-end of a growing RNA chain during transcription

    Elongation in Prokaryotes

    The transcription elongation phase begins with the release of the σ subunit from the polymerase. The dissociation of σ allows the core RNA polymerase enzyme to proceed along the DNA template, synthesizing mRNA in the 5′ to 3′ direction at a rate of approximately 40 nucleotides per second. As elongation proceeds, the DNA is continuously unwound ahead of the core enzyme and rewound behind it. Since the base pairing between DNA and RNA is not stable enough to maintain the stability of the mRNA synthesis components, RNA polymerase acts as a stable linker between the DNA template and the nascent RNA strands to ensure that elongation is not interrupted prematurely.

    Elongation in prokaryotes: During elongation, the prokaryotic RNA polymerase tracks along the DNA template, synthesizes mRNA in the 5′ to 3′ direction, and unwinds and rewinds the DNA as it is read.

    Termination in Prokaryotes

    Once a gene is transcribed, the prokaryotic polymerase needs to be instructed to dissociate from the DNA template and liberate the newly-made mRNA. Depending on the gene being transcribed, there are two kinds of termination signals: one is protein-based and the other is RNA-based.

    Rho-dependent termination is controlled by the rho protein, which tracks along behind the polymerase on the growing mRNA chain. Near the end of the gene, the polymerase encounters a run of G nucleotides on the DNA template and it stalls. As a result, the rho protein collides with the polymerase. The interaction with rho releases the mRNA from the transcription bubble.

    Rho-independent termination is controlled by specific sequences in the DNA template strand. As the polymerase nears the end of the gene being transcribed, it encounters a region rich in C–G nucleotides. The mRNA folds back on itself, and the complementary C–G nucleotides bind together. The result is a stable hairpin that causes the polymerase to stall as soon as it begins to transcribe a region rich in A–T nucleotides. The complementary U–A region of the mRNA transcript forms only a weak interaction with the template DNA. This, coupled with the stalled polymerase, induces enough instability for the core enzyme to break away and liberate the new mRNA transcript.

    Upon termination, the process of transcription is complete. By the time termination occurs, the prokaryotic transcript would already have been used to begin synthesis of numerous copies of the encoded protein because these processes can occur concurrently in the cytoplasm. The unification of transcription, translation, and even mRNA degradation is possible because all of these processes occur in the same 5′ to 3′ direction and because there is no membranous compartmentalization in the prokaryotic cell. In contrast, the presence of a nucleus in eukaryotic cells prevents simultaneous transcription and translation.