BIOL 3010L

 Ejercicio #8

Construcción de un árbol evolucionario para amilasa

 

 

INTRODUCCION:

 

Toda la vida en el planeta tierra comparte la misma bioquímica. Todos tenemos DNA como nuestro material genético. Todos usamos las mismas polimerasas de DNA y RNA, los mismos ribosomas… Metabolizamos glucosa en formas bien similares…. Nuestros genes codifican para proteínas similares.

            La teoría evolutiva sostiene que las formas de vida actuales evolucionaron de otras más tempranas por medio de cambios genéticos y selección natural. Esos cambios genéticos afectan las proteínas en general y las enzimas en particular. Es por ello que debemos considerar las proteínas cuando hablamos de evolución. Cualquier cambio que altere una enzima y su capacidad para realizar su trabajo puede afectar el desempeño del organismo impidiéndole realizar alguna reacción o capacitándolo para hacer algo que antes no podía hacer. De acuerdo a las circunstancias, ese cambio será positivo y  la nueva característica se fijará en la población o será negativo y aquellos organismos que lo presenten serán eliminados de la población.

            Las versiones modernas de las proteínas surgieron de mutaciones de versiones ancestrales. Esas diferencias han sido las que han permitido la evolucion organismal: Proteínas que comparten un ancestro común seguramente vienen de orgasnismos que comparten un ancestro común.

            La evolución de las proteínas no es tan sencilla como acumular mutaciones en un gen. Como resultado podemos terminar con enzimas de una misma familia que tienen diferentes funciones (evolución divergente) o con proteínas que retienen la misma función aún cuando presenten diferencias en su secuencia (evolución convergente).

            Las enzimas presentan sitios directamente envueltos en la actividad de la proteína y otros que no están directamente envueltos. Es lógico pensar que los cambios que afectan ese sitio activo pueden alterar la actividad de la enzima. Al estudiar las secuencias de enzimas homólogas (que trabajan sobre un mismo sustrato) se ha observado que sus sitios activos tienden a ser similares. Estas zonas de la proteínas que no cambian mucho entre especies de organismos se llaman regiones conservadas. Se asume que las regiones conservadas son importantes para la función y/o estructura de la proteína. La mayoría de las diferencias en secuencia se observan entonces en regiones que no afectan el sitio activo de la enzima o la integridad estructural de la misma.

            Las amilasas están presentes en una gran variedad de organismos: procariotas y eucariotas, plantas y animales. Si esta se origina de una amilasa ancestral podemos esperar que haya similitud entre sus secuencias de aminoácidos. También esperamos que mientras más similares sean las secuencias más cercanos están, evolutivamente hablando, los organismos unos de otros. Como esta enzima está presente en muchísimos organismos distintos, procariotas, plantas y animales, la usaremos para realizar este ejercicio.

 

OBJETIVOS:

 

            Reconocer la base evolutiva de la vida.

            Analizar secuencias de aminoácidos de una enzima, amilasa, siguiendo el modelo evolutivo.

            Familiarizarnos con lugares de acceso en internet que contienen información valiosa para distintos tipos de estudios.

            Ilustrar la importancia de la colaboración internacional y la difusión de información por vías electrónicas que ha hecho posible el avance explosivo en la biotecnología que ha ocurrido en los últimos 10 años.

 

 

 

 

EJEMPLOS DE COMO PREPARAR UN ARBOL:

 

EJEMPLO 1: Tres individuos claramente diferentes

 

  1. Tenemos una secuencia de una proteína para tres organismos distintos: La secuencia en los organismos 1 y 2 difiere en 30 aminoácidos. Entre 2 y 3 difiere 29. Entre 1 y 3 difiere 13.

 

  1. Dibujamos una escala que represente la mayor diferencia:

 

 

                 

 

  1. Los organismos 1 y 2 difieren en 30 aa por lo que dibujamos su línea de divergencia en el punto 30. Los organismos 1 y 3 difieren en 13 aa.

                     

 

 Ejemplo 2: Siete individuos con distintos grados de divergencia

 

Comparación de

Secuencias de aa

Núnero de

diferencias

1 vs 1

0

1 vs 2

25

1 vs 3

17

1 vs 4

27

1 vs 5

8

1 vs 6

6

1 vs 7

26

 

 

  1. Los organismos 2,4 y 7 son los más divergentes. Comenzamos dibujando la escala de divergencia y acomodamos primero al más divergente: el 4.

 

                                                                                       1

                                                                                      

 

                                                                                      

            

 

                                                                                       4

              30                  20                    10                    0

 

 

  1. Ahora debemos determinar si los organismos 2 y 7 son más similares al 4 que al 1. Si son más similares al 4, divergieron del 1 a la misma vez que el 4, y su línea en la gráfica saldría de la del 4. Si se parecen más a 1 que a 4, divergieron de 1 después que 4 y su línea saldría de la del 1.

              

 

Comparación de

Secuencias de aa

Núnero de

diferencias

2 vs 4

26

2 vs 7

24

4 vs 7

10

 

Según la tabla de diferencias, las secuencias del organismo 4 y del 7 presentan mucha diferencia de la secuencia 2. Sin embargo, la secuencia  7 difiere de la 4 en sólo 10 aa, por lo que podemos inferir que 7 evolucionó de 4. Su línea la dibujamos desde la línea de 4, en el punto que ilustra 10 bases de diferencia.

 

Mientras, 2 difiere de 4 y 7 por casi los mismos aa que la diferencia entre 2 y 1 (25 aa).  Así que el linaje de 2 diverge de los linajes 1 y 4/7 casi al mismo tiempo. Podemos dibujar la divergencia desde la base de linaje 4/7 o del 1. En nuestro caso lo haremos desde el 1.

                                                                                       

                                                                                       

                     

 

3. El 3 difiere del 1 en 17 aa, por lo que se dibula la línea de divergencia desde le punto que ilustra 17 diferencias en la línea base del 1.

 

                                 

 

 

 

4. Los organismos 5 y 6 difieren del 1 en casi la misma cantidad de aa. Debemos compararlos para ver las diferencias entre ellos.

 

Comparación de secuencias de aa

Número de diferencias

5 vs 6

2

 

Organismos 5 y 6 difieren entre sí menos que entre ellos y 1, por lo que vienen del mismo linaje.

 

                                                                                       1

                                                                                       5

                                                                                       6

                                                                                       3                     

                                                                                       2

                                                                                       4

                                                                                       7

              30                  20                    10                    0

 

Internet y el Instituto Nacional de la Salud.

 

            Hoy en día, pueden prepararse árboles evolutivos bien complejos con ayuda de bancos de datos en las computadoras. Estos están disponibles en Internet y son el producto del trabajo de varios laboratorios a travéz de todo el mundo. Los científicos dedicados a la secuenciación de proteínas, una vez tienen seguridad de la estructura que están investigando, la añaden a la base de datos, que es luego compartida a través de todo el mundo.

Los análisis evolutivos pueden hacerse tanto por diferencias en aminoácidos como en DNA. Incluso se pueden ver analogías entre grupos de proteínas, medir sitios activos en la molécula, comparar estructuras tridimencionales, etc. El banco de datos está a la disposición del que desee accesarlo desde cualquier computadora con acceso a internet. Pero existen ciertas limitaciones es cuanto al uso. Aún cuando podemos hacer una búsqueda de la secuencia deseada y hacer comparaciones usando los bancos de datos, hay ciertas funciones que requieren de supercomputadores y el pago de unas licencias especiales. Estos nos permiten obtener un modelo tridimencional de la molécula de interés, moverlo en el espacio para verlo desde todos los ángulos, hacer mediciones de los sitios activos, medir distancia entre átomos dentro de las moléculas, e incluso hacer modelos que nos ilustren cómo se afecta la estructura y función de la molécula si ocurriera una mutación en algún lugar específico.

Nosotros contamos con el privilegio de tener acceso a facilidades con tales capacidades en el Departamento de Química, en el Laboratorio de Visualización (Q 044). El mismo ha sido posible gracias a la gestión de la Dra. Belinda Pastrana, quien administra las facilidades, y quien consiguió un Grant para financiar el proyecto. Hasta ahora es el único centro con dichas capacidades que le permite acceso a estudiantes subgraduados, a nivel de todo Estados Unidos. Otras Universidades tienen centros similares, pero permite acceso sólo a estudiantes graduados. En E.U., el trabajo que puede realizarse con estas computadoras complementa proyectos de cristalización de proteínas que realiza la NASA bajo microgravedad en la Estación Espacial Internacional. O sea, que podemos ser pioneros, si interesamos a más de nuestros estudiantes en proyectos de bioquímica de gran envergadura.

 

 

 

PRACTICA

 

            En el ejercicio de hoy compararemos las secuencias de aminoácidos para siete fragmentos de amilasas y dibujaremos el árbol evolutivo para estas. Lo haremos de forma manual, siguiendo el ejemplo de arriba, y por computadora, usando la base de datos de el Instituto Nacional de la Salud (NIH).

 

 

1. A MANO:

 

Preparar una tabla comparando las diferencias en aminoácidos, usando como base la secuencia que le sea asignada para el trabajo en computadora. (Por ej: si le tocó la secuencia C, comparar C vs C, C vs A, C vs B, C vs D, etc.)

 

De acuerdo al número de diferencias que encuentre, prepare el “árbol” evolutivo, comenzando con el par más divergente, hasta llegar al más cercano.

 

Ver el ejemplo de arriba.

 

 

2. COMO ACCESAR LA BASE DE DATOS:

 

Abrir Explorer o Netscape.

 

En la dirección, escribir http://www.nih.gov

 

Escoger Scientific Resources. Buscar en el menú la parte que dice In the Lab. Al final de esa sección dice Computing. Allí escoger Molecular Biology

 

En la página titulada Computational Molecular Biology buscar el renglón que Sequence Analysis. Donde dice Database Similarity/Homology Searches escoger el link llamado Basic Local Alignment Search Tool (BLAST)

 

En la página de BLAST buscar bajo Protein BLAST escoger el link hacia PSI- and PHI-BLAST

 

En el primer cuadro, junto a Search , escribir >, return, y la secuencia de aminoácidos en mayúsculas, desde después de los tres puntitos. Debajo dice Choose database. Dejar nr (non-redundant).

 

***Si tiene la secuencia en el clipboard se le hará más fácil porque así sólo le dará un Paste a la información, en vez de tener que entrar la secuencia completa cada vez que meta las patas. Y créame que lo hará más de una vez.***

 

Bajar en la página hasta encontrar la parte que dicec Format. Donde dice Alignment escoger query-anchored with identities.

 

Al final de la página aparece un espacio para enviar los resultados a un e-mail. Escribir la dirección electrónica de uno de los miembros del grupo. Esto le facilitará el imprimirlo después si así lo desea. Para imprimir luego en su casa, abrir su e-mail y solicitar imprimirlo. [El archivo es demasiado grande. En vez de imprimir todo, escojan la parte que más les interesa, cópienla a su procesador (al desktop,  a Word o a WordPerfect) y entonces impriman.]

 

Luego que tenga todo listo, oprima el botón que dice Blast!

 

Si incluyó una dirección de e-mail, automáticamente le enviará los resultados allá y lo sacará del programa. Si quiere ver los resultados en el momento, puede omitir el e-mail en las instrucciones anteriores o puede entrar de nuevo a la página de BLAST y entrar toda la información, asegurándose de que tenga el query-anchored with identities o el resultado no será lo mismo.

 

Si lo hizo bien, saldrá una página que dice NCBI  Results of BLAST, con una referencia, el número de identificación de su solicitud (RID), el query (número de letras en su secuencia), los bancos de datos analizados con el número de secuencias comparadas y el Taxonomy Reports.

 

Luego aparece el número de comparaciones que hizo la computadora y una gráfica con barras de colores. Cada barra representa una comparación. Si coloca rel ratón sobre una de ellas, en la barra informativa aparece información sobre la proteína.

 

Al final de esta gráfica aparece una tabla que compara las secuencias aa por aa. Esta tabla se llama Alignments.

 

En la primera línea está la secuencia que entramos al programa. Las líneas que siguen presentan comparaciones entre la secuencia y los bancos de datos. Estas se ilustran como puntos y letras. Los puntos indican que el aminoácido en esa posición es el mismo que el que está en la posición correspondiente en la secuencia estudiada. Las letras indican aquellos aminoácidos que han cambiado debido a mutaciones. Al principio y al final de la secuencia aparece un número. Este indica de dónde a dónde se extiende la secuencia (Ej: si el priner número dice 244 y el segundo es 275 quiere decir que la secuencia corresponde a los aa 244 a 275 de esa proteína.)

 

Al principio de cada secuencia hay un número subrayado. Este es un link a una página con información sobre esa proteína en particular. Esta incluye el número de pdb (protein databank, importante anotarlo para la parte de modelage de proteínas. Es una combinación de 4 letras y números.), el número de gi, cuántos aminoácidos tiene la proteína, qué proteína es, los números de identificación de todos los bancos de datos donde aparece, de qué organismo viene, referencias de investigación y la secuencia completa de aminoácidos.

 

 

¿Y ahora qué hago?

 

 

Parte I: Construcción de árbol evolutivo

 

Las secuencias aparecen en orden desde la que más se parece hasta la que menos se parece. Anote el pdb# de la primera secuencia que aparece debajo de la suya y coteje el organismo y el tipo de amilasa. La probabilidad de que sean la misma proteína es bien alta.

 

Escoger cualquiera de las otras secuencias que se presenten idénticas y verifique que son la misma proteína. Es casi seguro que será la misma proteína. La diferencia es el estudio que se le hizo.

 

Mirar el primer bloque de secuencias que presenten una mutación. Escojer una y ver si son la misma proteína o si vienen del mismo organismo. Por ej: amilasa pancreática y salivar humana. Anote el número de mutaciones y el organismo del que viene. Continúe mirando las secuencias por bloques. Si dentro de un bloque ve una mutación distinta verifíque su origen y el número de mutaciones que presenta. Por ej: puede ver dos secuencias que varíen digamos 12 aa de la original, pero que entre ellas sólo haya una o dos diferencias. Anote para todos los bloques su pdb si lo tiene, el tipo de amilasa, el organismo del que viene y la cantidad de mutaciones que presenta con respecto a la secuencia original. {{Esta parte se le facilita si imprime la tabla de comparación que le llegará a su e-mail.}}

 

Continúe con los bloques hasta que tenga por lo menos 7 organismos distintos.

 

Preparar un árbol a mano con los nombres de los organismos que encontró y el número de diferencias en aminoácidos entre ellos.

 

 

Ej:

                                                           

 

 

 

 

 

Comparar el arbol obtenido con la información que aparece en el “Taxonomy Report”

 

¿Coinciden?

 

 

Parte II:  Modelaje de proteínas

 

Para ver el dibujo del modelo molecular de su proteína, regrese a Computational Molecular Biology y escoger Databases

 

En Databases, bajar a Proteins  y escoger Protein Data Base.

 

En la página de PDB, en “Search the Archive” escribir el número de identificación de su proteína en el PDB, o una palabra clave. Oprimir Find

 

En el Query Result Browser aparece lo solicitado con un icon EXPLORE

 

Al oprimirlo aparece la página de Structure Explorer con la información de la proteína. En la parte superior derecha aparece un cuadrito con la figura de la proteína. Al oprimirlo aparecen cuadritos con las figuras. Escoger el cuadro a la resolución deseada. También aparecen otras opciones a las que se llega con las licencias de NIH.

 

En las computadoras del Laboratorio de Visualización las imágenes pueden ser rotadas para verlas desde distintos ángulos. Para esto se le darán instrucciones en el laboratorio.

 

Sorry!! Desde su computadora personal no se pueden rotar las proteínas

 

A la izquierda aparece Sequence Details. Este icon le la información general de su proteína.

 

 

 

ADVERTENCIA:

 

LA INFORMACIÓN QUE LLEGA DESDE LOS BANCOS DE DATOS ES TAN ABUNDANTE QUE LE PUEDE SATURAR EL ESPACIO DE SU DISCO DURO. NO LE DE DOWNLOAD A NADA DE LO QUE VEA. LIMÍTESE A IMPRIMIR DESDE SU E-MAIL LO QUE NECESITE Y LO DEMÁS LO DESCARTA PARA QUE NO SE LE SATURE SU BUZÓN.

 

 

 

 

 

CONTESTE:

 

¿Cuán grande es la base de datos al momento de usted accesarla?

 

¿Con cuántas secuencias comparó a su “query”?

 

¿Cuáles son los gi numbers de nuestras siete  secuencias? (Como cada grupo estará trabajando con una secuencia en particular, deben compartir estos datos.)

 

¿Hay diferencias en la estructura tridimensional de las secuencias accesadas?