Lenguaje máquina del ADN – Parte 1

Resumen

Este artículo trata sobre la forma en que se codifica la información genética en el ADN, y su similitud con la informática actual. El contenido es una recopilación de información en forma resumida para tener una visión global de este tema.

Todas las imágenes se han extraido de Wikipedia..

Las correcciones y observaciones, son bienvenidas

Soporte de almacenamiento

La información genética de cualquier animal o planta, de cualquier especie, se almacena dentro de cada una de las células de su organismo. Un sistema de redundancia, increible. Sería como un arreglo RAID1, distribuido en millones de unidades de información.

El soporte de información no son discos de aluminio, ni memorias electrónicas. La información se codifica a nivel molecular, dentro de una secuencia de moléculas (llamadas nucleótidos) dentro de otra molécula mayor que puede ser el ADN o el ARN.

20150104-disco_duro_y_adn.jpg

Las moléculas de ADN se encuentran, en cantidades fijas de acuerdo a la especie, en el nucleo celular. En el estado normal de la célula (interfase) se encuentran poco enrrollados, junto a algunas proteinas, en una sustancia llamada cromatina. En el periodo de división celular, las moléculas de ADN con algunas proteinas especiales, se enrrollan densamente formando estructuras llamadas cromosomas.

Se ha estimado que si se estirara totalmente, una molécula de ADN humano (un cromosoma) alzanzaría una longitud de algo menos de 5 cm. Considerando los 23 pares de cromosomas en una célula humana, tendríamos más de 2 metros de ADN en el núcleo de cada célula.

El ADN

El ADN es una molécula compleja. A pesar de haber sido bastante estudiada, hay muchos misterios no explicados aún. Esta macro molécula, tiene una estructura de doble hélice, que se compone de unidades llamadas nucleótidos. Básicamente, el ADN es una cadena de nucleótidos (polinucleótido) alineados en pares.

20150104-nucleotido.png

Un nucleótido se compone a su vez, de un grupo fosfato, una pentosa y una base nitrogenada. Cada par de nucleótidos, es como un eslabón de la cadena que es el ADN. Todos los nucléotidos son similares, excepto por la base nitrogenada, que puede ser de 4 tipos: Adenina (A), Timina (T), Citosina (C) y Guanina (G) en el ADN; y Adenina (A), Uracilo (U), Citosina (C) y Guanina (G) en el ARN.

Cada base nitrogenada, solo puede estar enlazada a su base complementaria. Así se tiene que en el ADN, la Adenina solo enlaza con la Timina (A-T) y la Citosina con la Guanina (C-G). Por lo tanto la información de una cadena de ADN, se puede considerar que existe en una sola hebra. La complementaridad de bases permite la creación de una copia exacta de la molécula de ADN.

Hasta el momento, nadie ha podido ver, con suficiente definición, una molécula de ADN.Las fotografías más recientes, solo muestran detalles toscos, lo cual es comprensible si se tiene en cuenta las dimensiones atómicas de las moléculas.

Existen medidas de longitud aplicadas al ADN. Estas son:

pb -> Par de bases nitrogenadas (equivalente a par de nucleótidos) = 340pm

kpb -> Mil pares de bases nitrogenadas

Mpb -> Un millón de pares de bases nitrogenadas

Se usan pares de bases, asumiendo que el ADN/ARN se compone de dos hebras. Cuando se tiene una sola hebra de ADN/ARN, se usa como base al nucleótido. Por lo tanto las unidades serían nt, knt y Mnt.

Desgraciadamente, se suele usar para las unidades: kpb y Mpb, la forma abreviada kb y Mb, que se puede confundir con las unidades de información kilobit y megabit. En general, en el mundo de la genética se debe entender kb y Mb, como medidas de longitud molecular.

La estabilidad de la molécula de ADN es sorprendéntemente alta. Tal es así que se ha podido recuperar información de células muertas,varios miles de años después.

Unidades de información.

Se supone que el ADN almacena toda la información genética de un individuo (la que pasará a sus descendientes). Esta información está contenida en los cromosomas de cada una de sus células. Los cromosomas son similares para todos los individuos de una misma especie. Así se puede identificar a una especie en particular por sus cromosomas.

A la información contenida en todos los cromosomas de una especie se le llama «Genoma». Esta sería la mayor unidad de información genética. El genoma vendría a ser como el archivo de datos para fabricar a un individuo de una especie en particular.

El genoma se encuentra distribuido en una cantidad fija de cromosomas. En cada cromosoma, la información genética se divide a su vez en «Genes». De la misma forma, cada especie tiene un número fijo de genes.

20150106-gen.png

El gen es considerado como la mínima unidad de información genética de una especie. Su tamaño es variable. En el ser humano un gen puede constar de unos pocos cientos hasta dos millones de nucleótidos. Se calcula que el hombre puede tener entre 20 a 25 mil genes en su genoma.

La definición de gen ha ido variando con el tiempo, conforme avanza la Genética. Actualmente se puede definir como la unidad de información que permite crear una proteína o alguna otra molécula con alguna función celular específica.

Por debajo del gen, la información genética se codifica a nivel de nucleótidos, aunque se pueden identificar unidades de información intermedia (Como los codones, cuando la información representa a las proteínas).

La jerarquía de unidades de información genética sería la siguiente:

Genoma -> Cromosoma-> Gen -> Nucleótido

Notar que el Genoma y el Gen son unidades de información, mientras que un Cromosoma y un Nucléotido son estructuras físicas.

Una tabla nos ayudará a diferenciar las estructuras físicas de las unidades de información:

 

UNIDAD DE INFORMACIÓN SOPORTE FÍSICO CAPACIDAD DE DATOS
<Sin nombre> Nucleótido / Par de bases 2 bits
Gen Cadena de nucleótidos Variable
<Sin nombre> Cromosoma Variable (Algunos Megabytes)
Genoma Todos los cromosomas de la célula Variable (Algunos Gigabytes)

La mínima unidad de información en el ADN/ARN se almacena en el nucleótido, y puede tomar hasta 4 valores, por lo que es discreta. Podemos deducir fácilmente que cada nucleótido, almacena dos bits de información. La información no se almacena de forma binaria, sino de forma cuaternaria (los 4 tipos de nucleótido encontrados).

Como ya se indicó, una molécula de ADN es básicamente una cadena doble de nucleótidos, donde la información se puede leer en la secuencia de nucleótidos de cualquiera de las hebras.

Considerando solo al ARN, los 4 valores que puede tomar un nucleótido son A,U,Cy G. Por lo tanto, encontraremos secuencias de nucleótidos que podrían tomar estos valores hipotéticos:

AAGUGAUUAGAC …

Si representamos cada nucleótidos con un par de bits, podríamos tener que la secuencia de nucleótidos, representada binariamente sería algo así:

000011011100010100 …


Sé el primero en comentar

Dejar una contestacion

Tu dirección de correo electrónico no será publicada.


*