O genoma humano —
o conjunto completo dos genes humanos — vem embalado em 23 pares de cromossomas
separados. Destes, 22 estão numerados de acordo com uma ordem aproximada de
tamanho, do maior (número 1) para o mais pequeno (número 22), enquanto o par de
cromossomas restante consiste nos cromossomas sexuais: dois cromossomas X
grandes nas mulheres, um X e um Y pequeno nos homens. De acordo com o tamanho,
o X está entre os cromossomas 7 e 8, enquanto o Y é o mais pequeno.
O número 23 não
tem significado. Muitas espécies, incluindo os nossos parentes mais próximos entre
os grandes primatas, têm mais cromossomas e muitas têm menos. Nem os genes com
um tipo e função semelhantes se agrupam necessariamente no mesmo cromossoma.
Deste modo, há alguns anos, estando debruçado sobre um computador portátil a
falar com David Haig, biólogo evolucionista, fiquei ligeiramente surpreendido
ao ouvi-lo dizer que o cromossoma 15 era o seu cromossoma favorito. Explicou-me
que este cromossoma tem todo o tipo de genes maliciosos. Nunca tinha pensado
nos cromossomas como tendo personalidades. Afinal de contas, são apenas colecções
arbitrárias de genes. Mas o comentário fortuito de Haig colocou uma ideia na
minha cabeça e não consegui livrar-me dela. Por que não tentar contar a
história da revelação do genoma humano, que estava agora a ser descoberto em
pormenor pela primeira vez, cromossoma a cromossoma, escolhendo um gene de cada
cromossoma para se ajustar à história à medida que esta estava a ser contada?
Primo Levi fez algo semelhante com a tabela periódica dos elementos nos seus contos
autobiográficos. Ele relacionou cada capítulo da sua vida com um elemento, com
o qual teve algum contacto durante o período que estava a descrever.
Comecei a pensar
no genoma humano como uma espécie de autobiografia de direito próprio — um
registo, em «genetiquês», de todas as vicissitudes e invenções que
caracterizaram a história da nossa espécie e dos seus ancestrais desde o início
da alvorada da vida. Existem genes que não se alteraram muito desde a altura em
que as primeiras criaturas unicelulares povoavam o caldo primordial; genes que
foram desenvolvidos quando os nossos ancestrais eram semelhantes a vermes;
genes que devem ter aparecido pela primeira vez quando os nossos ancestrais
eram peixes; genes que apenas existem na sua forma corrente por causa de
epidemias recentes de doenças; genes que podem ser utilizados para escrever a
história das migrações humanas nos últimos milhares de anos. De há 4 mil
milhões de anos até há apenas umas centenas de anos, o genoma tem sido uma
espécie de autobiografia para a nossa espécie, registando os acontecimentos
importantes à medida que ocorriam.
Escrevi uma lista
dos 23 cromossomas e ao lado de cada um comecei a listar temas de natureza
humana. Gradualmente e dolorosamente, comecei a encontrar genes que eram emblemáticos
da minha história. Tive frustrações frequentes quando não conseguia encontrar
um gene adequado ou quando encontrava o gene ideal e este estava no cromossoma
errado. Havia o problema de saber o que fazer com os cromossomas X e Y, que
coloquei a seguir ao cromossoma 7, devido ao tamanho do cromossoma X. O leitor
sabe agora por que é que o último capítulo de um livro que se gaba no seu
subtítulo de ter 23 capítulos se chama capítulo 22.
À primeira vista,
aquilo que fiz é muito enganador. Pode parecer que estou a inferir que o
cromossoma 1 apareceu primeiro, o que não é verdade, tal como pode parecer que
estou a deduzir que o cromossoma 11 está
exclusivamente relacionado com a personalidade humana, o que também não
é verdade. Provavelmente, existem 60 000-80 000 genes no genoma
humano*, e não poderia falar de todos, quer por o número estar a aumentar
várias centenas em cada mês, quer por, na grande maioria, serem entediantes
gerentes bioquímicos intermédios.
Mas posso oferecer
um olhar rápido e coerente do conjunto: uma visita guiada a alguns dos locais
mais interessantes do genoma e ao que nos dizem acerca de nós próprios. Porque
nós, esta geração sortuda, seremos os primeiros a ler o livro que é o genoma.
Sermos capazes de ler o genoma dir-nos-á mais acerca das nossas origens, da
nossa evolução, da nossa natureza e das nossas mentes do que todos os esforços
da ciência até hoje. Irá revolucionar a antropologia, a psicologia, a medicina,
a paleontologia e, virtualmente, todas as outras ciências. Isto não significa
que se encontre tudo nos genes ou que os genes tenham mais importância do que
os outros factores. Obviamente, não têm. Mas têm importância, com certeza.
Este não é um
livro sobre o Projecto do Genoma Humano — acerca de técnicas de mapeamento
e sequenciação —, mas sobre o que esse projecto descobriu. O autor
escreveu em 1999 o primeiro rascunho do genoma humano completo. Dentro de
poucos anos teremos passado de não sabermos praticamente nada acerca dos nossos
genes a sabermos tudo. Acredito verdadeiramente que estamos a atravessar o
maior momento intelectual da história. Sem nenhuma excepção. Alguns podem
protestar dizendo que o ser humano é mais do que os seus genes. Não o nego. Em
cada um de nós existe muito, muito mais do que um código genético. Mas até
agora os genes humanos eram quase um mistério completo. Seremos a primeira
geração a penetrar nesse mistério. Estamos à beira de grandes novas respostas,
mas, mais ainda, de grandes novas perguntas. Foi o que tentei transmitir neste
livro.
A segunda parte
deste prefácio pretende ser uma breve iniciação, uma espécie de glossário
narrativo, sobre o tema dos genes e o modo como funcionam. Espero que os
leitores olhem para ele no início e regressem a ele regularmente se encontrarem
termos técnicos que não são explicados. A genética moderna é um formidável
arbusto espinhoso de gíria. Neste livro esforcei-me por utilizar o mínimo dos
mínimos de termos técnicos, mas alguns são inevitáveis.
O corpo humano
contém, aproximadamente, 100 biliões (milhões de milhões) de células, a maioria das quais têm menos
de um décimo de um milímetro de diâmetro. Dentro de cada célula existe uma
massa negra chamada núcleo.
Dentro do núcleo estão dois conjuntos completos do genoma humano (com excepção dos óvulos e dos espermatozóides,
que têm uma cópia cada um, e dos glóbulos vermelhos, que não têm nenhuma). Um
conjunto do genoma vem da mãe e o outro do pai. Em princípio, cada conjunto
inclui os 60 000-80 000 genes
nos mesmos 23 cromossomas. Na
prática, existem diferenças pequenas e subtis entre as versões paterna e
materna de cada gene, diferenças que explicam, por exemplo, os olhos azuis ou
castanhos. Quando nos reproduzimos, transmitimos um conjunto completo, mas
apenas depois de termos trocado pedaços dos cromossomas paterno e materno num
processo conhecido como recombinação.
Imaginemos que o
genoma é um livro.
Tem 23 capítulos, chamados cromossomas.
Cada capítulo contém vários milhares de
histórias, chamadas genes.
Cada história é feita de parágrafos, chamados exões, que são interrompidos por
anúncios chamados intrões.
Cada parágrafo é feito de palavras, chamadas codões.
Cada palavra é escritas com letras, chamadas bases.
O livro tem mil
milhões de palavras, o que o torna maior do que 5000 volumes do tamanho deste,
ou tão grande como 800 Bíblias. Se lesse o genoma à taxa de uma palavra por
segundo durante oito horas por dia, demoraria um século. Se escrevesse o genoma
humano, uma letra por centímetro, o texto seria tão longo como o Danúbio. É um
documento gigantesco, um livro imenso, uma receita com um comprimento
extravagante, e tudo se encaixa dentro do núcleo microscópico de uma pequena
célula que cabe facilmente na cabeça de um alfinete.
A ideia do genoma
como um livro não é, estritamente falando, sequer uma metáfora. É literalmente
verdade. Um livro é um pedaço de informação digital, escrito numa forma linear,
unidimensional e unidireccional e definido por um código que transcreve um
pequeno alfabeto de símbolos num grande léxico de significados através da ordem
dos seus agrupamentos. Assim é o genoma. A única complicação é que todos os
livros ingleses se lêem da esquerda para a direita, enquanto algumas partes do genoma se lêem da esquerda para a direita e
outras da direita para a esquerda, mas nunca de ambas as maneiras ao mesmo
tempo.
(A propósito,
depois deste parágrafo, não voltará a ser encontrada a estafada palavra blueprint
neste livro, por três motivos. Em primeiro lugar, apenas os arquitectos e
os engenheiros utilizam blueprints, e mesmo eles estão a desistir deles
na época dos computadores, enquanto todos nós usamos livros. Em segundo lugar,
os blueprints são analogias muito más para os genes. Os blueprints são
mapas bidimensionais, e não códigos
digitais unidimensionais. Em terceiro lugar, os blueprints são demasiado
literais para a genética, porque cada parte de um blueprint equivale a
uma parte de uma máquina ou de um edifício; ora cada frase de um livro de
receitas não faz um pedaço diferente de bolo.)
Enquanto os livros
ingleses estão escritos em palavras de comprimento variável, utilizando vinte e
seis letras, os genomas estão inteiramente escritos com palavras de três
letras, utilizando apenas quatro letras: A, C, G e T (que significam adenina,
citosina, guanina e timina). E, em vez de estarem escritos em páginas planas,
estão escritos em longas cadeias de açúcar e fosfato, chamadas moléculas de
ADN, às quais as bases estão ligadas como escadas de mão laterais. Cada
cromossoma é um par de moléculas de ADN (muito) longas. Colocados de extremidade
a extremidade e estendidos a direito, todos os cromossomas de uma única célula
teriam um comprimento de cerca de 183 cm. Todos os cromossomas de todas as
células de um corpo cobririam 160 mil milhões de quilómetros, ou cerca de dois
dias-luz (a luz viaja 64 mil milhões de quilómetros num dia). Existem 965
milhões de milhões de quilómetros de ADN humano na Terra, o suficiente para ir
daqui até à próxima galáxia.
O genoma é um
livro muito inteligente, porque, nas condições ade-quadas, pode fotocopiar-se
e ler-se a si próprio. O processo de fotocópia é conhecido como replicação e o de leitura como tradução. A replicação funciona por causa de uma propriedade engenhosa
das quatro bases: A gosta de emparelhar com T e G com C. Assim, uma única
cadeia de ADN pode copiar-se a si própria ao montar uma cadeia complementar com
Ts em oposição a todos os As, As em oposição a todos os Ts, Cs em oposição a
todos os Gs e Gs em oposição a todos os Cs. De facto, o estado usual do ADN é a
famosa dupla hélice, o entrelaçamento
da cadeia original e do seu par complementar entrelaçados.
Deste modo, fazer
uma cópia da cadeia complementar dá o texto original. Assim, a sequência ACGT
tornou-se TGCA na cópia, o que é transcrito de volta a ACGT na cópia da cópia,
o que permite que o ADN se replique infinitamente e, mesmo assim, contenha a
mesma informação.
A tradução é um
pouco mais complicada. Em primeiro lugar, o texto de um gene é transcrito numa cópia pelo mesmo
processo de emparelhamento de bases, mas desta vez a cópia é feita, não de ADN,
mas de ARN, um produto químico ligeiramente diferente. O ARN também pode
transportar um código linear e utiliza as mesmas letras que o ADN, com a
excepção de que utiliza U, para uracilo, em vez de T. Esta cópia ARN, chamada
ARN mensageiro, é depois editada
com a excisão de todos os intrões e a união de todos os exões (v. atrás).
O mensageiro é
então ajudado por uma máquina microscópica chamada ribossoma, ela própria feita em parte de ARN. O ribossoma
move-se ao longo do mensageiro, traduzindo, por sua vez, cada codão de três
letras numa letra de um alfabeto diferente, um alfabeto de vinte e três aminoácidos, cada um transportado por
uma versão diferente de uma molécula chamada ARN de transferência. Cada aminoácido é ligado ao último para formar
uma cadeia na mesma ordem dos codões. Quando toda a mensagem é traduzida, a
cadeia de aminoácidos dobra--se numa forma característica que depende da sua
sequência. É agora conhecida como proteína.
Quase tudo no
corpo, do cabelo às hormonas, é feito de proteínas, ou feito por elas. Cada
proteína é um gene traduzido. Em particular, as reacções químicas do corpo são
catalisadas por proteínas conhecidas como enzimas.
Até mesmo o processamento, fotocópia, correcção de erros e montagem das
próprias moléculas de ADN e de ARN — a replicação e tradução — são
feitos com a ajuda de proteínas. As proteínas também são responsáveis por
activarem e desactivarem genes, por se ligarem fisicamente a sequências promotoras e elongadoras perto do início do texto de um gene. Genes
diferentes são activados em diferentes partes do corpo.
Por vezes são
cometidos erros quando os genes são replicados. Ocasionalmente falha uma letra
(base) ou é inserida a letra errada. Frases ou parágrafos inteiros são por
vezes duplicados, omitidos ou invertidos. Isto é conhecido como mutação. Muitas mutações não são nem
prejudiciais nem benéficas, por exemplo, quando alteram um codão para outro que
tem o mesmo «significado» em termos de aminoácidos: como existem sessenta e
quatro codões diferentes e apenas vinte aminoácidos, muitas «palavras» de ADN
partilham o mesmo significado. Os seres humanos acumulam cerca de uma centena
de mutações por geração, o que pode não parecer muito, dado que há mais de um
milhar de codões no genoma humano, mas no local errado um único pode ser fatal.
Todas as regras
têm excepções (incluindo esta). Nem todos os genes humanos se encontram nos 23
cromossomas principais; alguns vivem dentro de pequenas bolhas chamadas
mitocôndrias e, provavelmente, vivem lá desde que as mitocôndrias eram
bactérias de vida livre. Nem todos os genes são feitos de ADN: alguns vírus
utilizam ARN. Nem todos os genes são receitas para proteínas. Alguns genes são
transcritos para ARN, mas não são traduzidos para proteína; em vez disso, o ARN
vai trabalhar directamente quer como parte de um ribossoma, quer como um ARN de
transferência. Nem todas as reacções são catalisadas por proteínas; algumas
são catalisadas por ARN. Nem todas as proteínas vêm de um único gene; algumas
são montadas a partir de várias receitas. Nem todos os sessenta e quatro codões
especificam um aminoácido: três significam comandos stop. Finalmente, nem todo o ADN significa genes. A maioria é
uma mistura de sequências repetitivas ou aleatórias que raramente ou nunca são
transcritas: o chamado ADN lixo (junk DNA).
E é tudo o que
precisamos de saber. Podemos começar a excursão ao genoma humano.
CROMOSSOMA 1
Vida
Todas as formas que morrem abastecem outras
formas
(À vez apanhamos o sopro vital e morremos),
Como bolhas transportadas no mar de matéria,
Sobem, rebentam e voltam a esse mar.
Alexander
Pope, An Essay
on Man
No início existia
a palavra. A palavra converteu o mar com a sua mensagem, copiando-se a
si própria incessantemente e para sempre.
A palavra descobriu uma maneira de rearranjar substâncias químicas para
captar os pequenos remoinhos da corrente de entropia e fazê-los viver. A
palavra transformou a infernal superfície poeirenta terrestre do planeta num
paraíso verdejante. A palavra, por fim, desabrochou e tornou-se suficientemente
habilidosa para construir uma engenhoca com uma consistência de papa, designada
por cérebro humano, capaz de descobrir e tornar-se consciente da própria
palavra.
A minha engenhoca
com consistência de papa atrapalha-se cada vez que tenho este pensamento. Em 4
mil milhões de anos de história da Terra, tenho a sorte de estar vivo hoje. Em
5 milhões de espécies fui suficientemente afortunado para nascer como ser
humano consciente. De entre os 6 mil milhões de pessoas que existem no
planeta, fui suficientemente privilegiado para nascer no país onde a palavra
foi descoberta. Em toda a história, biologia e geografia da Terra, nasci apenas
cinco anos depois do momento em que, e a apenas 320 quilómetros do local onde,
dois membros da minha própria espécie descobriram a estrutura do ADN e, assim,
solucionaram o maior, mais simples e mais surpreendente segredo do universo. Se
o leitor quiser, pode zombar do meu entusiasmo, considerar-me um materialista
ridículo por investir tanto entusiasmo num acrónimo. Mas siga-me numa viagem
até ao início da vida, que tenho a esperança de o convencer da imensa
fascinação da palavra.
«Como,
provavelmente, a terra e o oceano foram povoados com produções vegetais muito
antes da existência de animais, e muitas famílias desses animais apareceram
muito antes de outras famílias, devemos
conjecturar que apenas um tipo de filamentos vivos foi e tem sido a
causa de toda a vida orgânica?», perguntou o polimático poeta e médico Erasmus
Darwin em 17941. Foi um palpite surpreendente para a época não só pela sua arrojada conjectura
de que toda a vida orgânica partilhava a mesma origem, sessenta e cinco anos
antes do livro do seu neto Charles sobre esse assunto, mas também pela estranha
utilização da palavra «filamentos». O segredo da vida é, de facto, um fio.
No entanto, como
pode um filamento fazer algo viver? A vida é uma coisa traiçoeira de definir,
mas consiste em duas capacidades bem distintas: a capacidade de se replicar e a
capacidade de criar ordem. As coisas vivas produzem cópias aproximadas de si
próprias: os coelhos produzem coelhos, os dentes-de-leão produzem
dentes-de-leão. Mas os coelhos fazem mais do que isso. Comem erva,
transformam-na em carne de coelho e de algum modo constroem corpos ordenados e
complexos a partir do caos aleatório do mundo. Não desafiam a segunda lei da
termodinâmica, que diz que num sistema fechado tudo tende da ordem para a
desordem, uma vez que os coelhos não são sistemas fechados. Os coelhos
constroem pacotes de ordem e complexidade, chamados corpos, mas à custa de
gastarem grandes quantidades de energia. Na frase de Erwin Schrödinger, as
criaturas vivas «bebem ordem» do ambiente.
A chave para estas
duas características da vida é a informação. A capacidade de replicar é possível pela existência de uma
receita, a informação que é necessária para criar um novo corpo. Um óvulo
fecundado de coelho transporta as instruções para a montagem de um novo coelho.
Mas a capacidade para criar ordem através do metabolismo também depende de
informação — as instruções para construir e manter o equipamento que cria a
ordem. Um coelho adulto, com a sua capacidade de se reproduzir e de
metabolizar, está prefigurado e pressuposto nos seus filamentos vivos, tal como
um bolo está prefigurado e pressuposto na receita. Esta é uma ideia que vem
desde Aristóteles, o qual disse que o «conceito» de uma galinha está implícito
num ovo ou que uma bolota está literalmente «informada» do plano de construção de
um carvalho. Quando a vaga percepção de Aristóteles sobre a teoria da
informação, enterrada sob gerações de química e física, reemergiu no meio das
descobertas da genética moderna, Max Delbruck gracejou dizendo que ao sábio
grego deveria ser entregue, postumamente, o prémio Nobel pela descoberta do ADN2.
O filamento de ADN é informação, uma mensagem escrita num código de
produtos químicos, um produto para cada letra. É quase demasiado bom para ser
verdade, mas o código revelou estar escrito de um modo que podemos entendê-lo.
Tal como a língua inglesa escrita, o código genético está numa linguagem
linear, escrito numa linha recta. Tal como o inglês escrito, é digital, uma vez
que cada letra tem a mesma importância. Além disso, a linguagem do ADN é consideravelmente
mais simples do que a língua inglesa, já que tem um alfabeto com apenas quatro
letras, convencionalmente conhecidas como A, C, G e T.
Agora, que sabemos
que os genes são receitas codificadas, é difícil relembrar que poucas pessoas
foram capazes de adivinhar tal possibilidade. Na primeira metade do século xx houve uma questão que ecoou sem
resposta através da biologia: o que é um gene? Parecia quase impossivelmente
misteriosa. Voltemos atrás, não a 1953, o ano da descoberta da estrutura
simétrica do ADN, mas dez anos antes, a 1943. As pessoas que, uma década
depois, mais fizeram para desvendar o mistério, estão, em 1943, a trabalhar
noutras coisas. Francis Crick está a trabalhar num projecto sobre minas
navais perto de Portsmouth. Na mesma altura, James Watson, com a idade precoce
de 15 anos, está a matricular-se na Universidade de Chicago; está determinado a
dedicar a sua vida à ornitologia. Maurice Wilkins está a ajudar a produzir a
bomba atómica nos Estados Unidos. Rosalind Franklin está a estudar a estrutura
do carvão para o governo britânico.
Em Auschwitz, em
1943, Josef Mengele está a torturar gémeos até à morte numa paródia grotesca da
pesquisa científica. Mengele está a tentar compreender a hereditariedade, mas a
sua eugenia demonstra não ser o caminho para o esclarecimento. Os resultados de
Mengele serão inúteis para os futuros cientistas.
Em Dublin, em
1943, um refugiado que escapou a Mengele e à sua laia, o grande físico Erwin
Schrödinger, está a iniciar uma série de palestras em Trinity College
intituladas «O que é a vida?». Está a ten-tar definir um problema. Sabe que os
cromossomas contêm o segredo da vida, mas não compreende como: «São estes
cromossomas [...] que contêm, numa espécie de escrita em código, todo o padrão
do desenvolvimento futuro do indivíduo e do seu funcionamento no estado
adulto.» O gene, diz ele, é demasiado pequeno para ser algo mais do que uma grande molécula, um
pensamento perspicaz que vai inspirar uma geração de cientistas, incluindo
Crick, Watson, Wilkins e Franklin, a abordar um problema que subitamente parece
manejável. Embora Schrödinger tenha chegado assim tantalizadoramente perto da
resposta, desvia-se do caminho certo. Pensa que o segredo da capacidade desta
molécula de ser o suporte da hereditariedade reside na sua amada teoria
quântica e persegue essa obsessão ao longo do que vai provar ser um beco sem
saída. O segredo da vida nada tem a ver com estados quânticos. A resposta não
virá da física3.
Em Nova Iorque, em
1943, Oswald Avery, cientista canadiano de 66 anos, está a colocar os toques
finais numa experiência que irá identificar decisivamente o ADN como a
manifestação química da hereditariedade. Ele provou numa série de experiências
engenhosas que uma bactéria causadora de pneumonia pertencente a uma estirpe
inofensiva pode ser transformada numa estirpe virulenta apenas pelo facto de
absorver uma simples solução química. Em 1943, Avery tinha concluído que a
substância transformadora, uma vez purificada, era ADN. Contudo, publicou as
conclusões numa linguagem tão cautelosa que poucos repararam nelas a não ser
muito mais tarde. Numa carta dirigida ao irmão Roy, escrita em Maio de 1943,
Avery é apenas um pouco menos cauteloso4:
Se temos razão,
e, é claro, isso ainda não está provado, então tal significa que os ácidos
nucleicos [ADN] não são apenas estruturalmente importantes, mas substâncias
funcionalmente activas na determinação das actividades bioquímicas e
características específicas das células — e que por meio de uma
substância química é possível induzir alterações previsíveis e hereditárias nas
células. Isto é um sonho de longa data dos geneticistas.
Avery está quase lá, mas ainda pensa em termos químicos. «Toda a vida é
química» conjecturou, Jan Baptist van Helmont em 1648. Pelo menos alguma vida é
química, disse Friedrich Wöhler em 1828, após ter sintetizado ureia a partir de
cloreto de amónio e de cianido de prata, quebrando assim a, até então, sacrossanta
divisão entre os mundos químico e biológico: a ureia era algo que até aí
somente tinha sido produzido por seres vivos. É verdade que a vida é química,
mas é entediante, é como dizer que o futebol é física. A vida, numa aproximação
grosseira, consiste na química de três átomos, hidrogénio, carbono e oxigénio,
que entre si correspondem a 98% de todos os átomos nos seres vivos. Mas são as
propriedades emergentes da vida — como a heritabilidade* — e não as
partes constituintes, que são interessantes. Avery não consegue conceber o que tem o ADN de especial que lhe
permite conter o segredo das propriedades herdáveis. A resposta não virá da
química.
Em Bletchley, na
Grã-Bretanha, em 1943, em absoluto segredo, Alan Turing, um brilhante
matemático, está a ver o seu pensamento mais perspicaz tornar-se uma realidade
física. Turing tem argumen-tado que os números podem computar números. Para
decifrar as máquinas de codificação Lorentz das forças alemãs foi
construído um computador, com o nome de Colosso, com base nos princípios
de Turing: é uma máquina universal com um programa armazenado modificável. Ninguém
se apercebe na altura, muito menos Turing,
mas, provavelmente, ele está mais próximo do mistério da vida do que qualquer outra pessoa. A
hereditariedade é um programa armazenado modificável; o metabolismo é uma
máquina universal. A receita que os une é um código, uma mensagem abstracta,
que pode ser incorporado numa forma
química, física ou mesmo imaterial.
O seu segredo consiste em poder causar a própria replicação. Qual-quer
coisa que pode utilizar os recursos do mundo para obter cópias de si própria
está viva; a forma mais provável que essa coisa pode tomar é a de uma mensagem
digital — um número, uma letra ou uma palavra5.
Em New Jersey, em 1943, um pacato académico solitário chamado Claude
Shannon está a ponderar uma ideia que tivera em Princeton uns anos antes. A
ideia de Shannon é a de que a informação e a entropia são faces opostas da
mesma moeda e que ambas estão intimamente ligadas à energia. Quanto menos
entropia tem um sistema, mais informação contém. Uma máquina a vapor distribui
a entropia em parcelas para gerar energia devido à informação injectada pelo
seu criador. O mesmo faz um corpo humano. No cérebro de Shannon, a teoria da
informação de Aristóteles encontra a física de Newton. Tal como Turing, Shannon
não pensa na biologia. Mas a sua perspicácia é mais relevante para a questão do
que é a vida do que uma montanha de química e física. Também a vida é
informação digital escrita em ADN6.
No início existia
a palavra. A palavra não era ADN. Isso veio depois, quando a vida já estava
estabelecida, quando já tinha dividido o trabalho entre duas actividades
separadas: o trabalho químico e o armazenamento de informação, o metabolismo e
a replicação. Mas o ADN contém um registo do mundo, fielmente transmitido
através dos tempos até à surpreendente actualidade.
Imaginemos o
núcleo do óvulo humano ao microscópio. Se o leitor puder, coloque os 23
cromossomas de acordo com o tamanho, o maior à esquerda e o mais pequeno à
direita. Agora amplie o cromossoma maior, designado, por razões puramente
arbitrárias, por cromossoma I. Todos os cromossomas têm um braço longo e um
braço curto, separados por uma constrição conhecida por centrómero. No braço
longo do cromossoma I, perto do centrómero, descobrirá, se ler com atenção, que
existe uma sequência de 120 letras — As, Cs, Gs e Ts — que se repete
inúmeras vezes. Entre cada repetição existe uma porção de texto mais aleatório,
mas o parágrafo de 120 letras volta a aparecer, qual melodia de uma canção familiar,
no total, mais de 100 vezes. Este pequeno parágrafo talvez seja o mais próximo
que podemos chegar do eco da palavra original.
Este «parágrafo» é
um pequeno gene, provavelmente o gene mais activo no corpo humano. As suas 120
letras estão constantemente a ser copiadas para um pequeno filamento de ARN. A
cópia é conhecida como 5S ARN.
Monta residência com um conjunto de proteínas e outros ARNs, cuidadosamente
entrelaçados, num ribossoma, uma máquina cujo trabalho é traduzir receitas de
ADN em proteínas. E são as proteínas que permitem ao ADN replicar-se.
Parafraseando Samuel Butler, uma proteína é apenas a maneira de um gene
produzir outro gene e um gene é apenas a maneira de uma proteína produzir outra
proteína. Os cozinheiros precisam de receitas, mas as receitas também
necessitam de cozinheiros. A vida consiste na interligação de dois tipos de
produtos químicos: as proteínas e o ADN.
A proteína
representa química, viver, respirar, metabolismo e
comportamento — aquilo que os biólogos designam por fenótipo.
O ADN representa informação, replicação, reprodução, sexo — aquilo a que os
biólogos chamam genótipo. Uma não pode existir sem o outro. É o caso clássico
do ovo e da galinha: qual surgiu primeiro, o ADN ou a proteína? Não pode ter
sido o ADN, pois este é um pedaço de matemática passivo e desamparado que não
catalisa reacções químicas. Não pode ter sido a proteína, pois esta é química
pura sem qualquer meio conhecido de se copiar a si própria com exactidão.
Parece impossível que o ADN tenha inventado a proteína, ou o inverso. Isto
poderia ter permanecido um enigma estranho e frustrante se a palavra não
tivesse deixado um vestígio de si própria debilmente desenhado no filamento da
vida. Tal como agora sabemos que os ovos surgiram muito antes das galinhas (os
ancestrais reptilianos de todas as aves punham ovos), existem cada vez mais
evidências de que o ARN surgiu antes das proteínas.
O ARN é a substância química que liga os dois mundos do ADN e da
proteína. É utilizado principalmente na tradução da mensagem a partir do
alfabeto do ADN para o alfabeto das proteínas. Mas, pelo modo como se comporta,
deixa poucas dúvidas de que é o ancestral de ambos. O ARN foi a Grécia para a Roma do ADN: o Homero para o
seu Virgílio.
O ARN foi a
palavra. O ARN deixou para trás cinco pequenas pistas da sua prioridade tanto
sobre o ADN como sobre as proteínas. Ainda hoje os ingredientes do ADN são
feitos modificando os ingredientes do ARN, e não por uma via mais directa.
Também as letras T do ADN são feitas a partir das letras U do ARN. Muitas
enzimas modernas, embora feitas de proteína, dependem de pequenas moléculas de
ARN que as façam funcionar. Além disso, o ARN, ao contrário do ADN e das
proteínas, pode copiar-se a si próprio sem ajuda: se lhe dermos os ingredientes
certos, juntá-los-á numa mensagem. Numa célula, seja onde for que procuremos,
as funções mais primitivas e básicas necessitam da presença de ARN. É uma
enzima dependente de ARN que
transporta a mensagem, feita de ARN, a partir do gene. É uma máquina que contém
ARN, o ribossoma, que traduz essa mensagem, e é uma pequena molécula de
ARN que vai buscar e transporta os aminoácidos para a tradução da mensagem do
gene. Mas, acima de tudo, o ARN — ao contrário do ADN — pode agir
como catalisador, separando e juntando outras moléculas, incluindo os próprios
ARN. Pode cortá-los, unir as pontas, produzir alguns dos próprios blocos de
construção e alongar uma cadeia de ARN. Pode ainda operar-se a si próprio,
cortando um pedaço de texto e voltando a unir as extremidades livres7.
A descoberta por
Thomas Cech e Sidney Altman, no início dos anos 80, destas propriedades
excepcionais do ARN transformou a nossa compreensão da origem da vida. Parece
agora provável que o primeiro gene, o ur-gene, era um replicador-catalisador
combinado, uma palavra que consumia os produtos químicos em seu redor para se
duplicar. Poderia muito bem ter sido feito de ARN. Seleccionando repetidamente
moléculas de ARN produzidas ao acaso num tubo de ensaio com base na sua
capacidade de catalisar reacções, é possível «fazer evoluir» ARNs catalíticos a
partir do zero — quase recriando a origem da vida. E um dos
resultados mais surpreendentes é que, fre-quentemente,
estes ARNs sintéticos acabam por ter um bocado de texto de ARN que é
consideravelmente parecido com uma parte do texto de um gene ARN ribossomal, tal como o gene 5S do cromossoma I.
Antes dos
primeiros dinossáurios, antes dos primeiros peixes, antes dos primeiros vermes,
antes das primeiras plantas, antes dos primeiros fungos, antes das primeiras
bactérias, existia um mundo de ARN — provavelmente, algures, há cerca
de 4 mil milhões de anos, pouco depois do início da existência do próprio
planeta Terra, quando o próprio universo tinha apenas 10 mil milhões de anos.
Não sabemos qual era a aparência desses «riboorganismos». Podemos apenas
especular o que faziam para viver, em termos químicos. Não sabemos o que
existiu antes deles. Podemos, porém, ter quase a certeza de que existiram por
causa das pistas sobre o papel do ARN que hoje em dia sobrevivem nos organismos
vivos8.
Esses
riboorganismos tinham um grande problema. O ARN é uma substância instável que
se desintegra ao fim de algumas horas. Se esses organismos se aventurassem
nalgum sítio quente, ou tentassem tornar-se demasiado grandes, enfrentariam
aquilo que os geneticistas designam por erro catastrófico — a rápida
desintegração da mensagem dos seus genes. Um deles inventou, por tentativa e
erro, uma nova e mais resistente versão do ARN, designada por ADN, e um sistema
para fazer cópias de ARN a partir dela, incluindo uma máquina que designaremos
por proto-ribossoma. Tinha de trabalhar depressa e de ser exacta. Assim,
juntava cópias genéticas, três letras de cada vez, a melhor maneira de ser
rápida e precisa. Cada trio vinha assinalado com uma etiqueta para permitir que
o proto-ribossoma o encontrasse mais facilmente, uma etiqueta que era feita de
aminoácidos. Muito mais tarde, as próprias etiquetas ficaram agrupadas para
fazerem proteínas e a palavra de três letras tornou-se uma espécie de código
para as proteínas — o próprio código genético. (Assim, até hoje o
código genético consiste em palavras de três letras, cada uma significando um
dos vinte aminoácidos como parte de uma receita para uma proteína.) E assim
nasceu uma criatura mais sofisticada que armazenava a sua receita genética em
ADN, fazia as suas máquinas de proteína e utilizava ARN para fazer a ponte
entre elas.
Chamava-se UAUC, a
última ancestral universal comum (LUCA, last universal common ancestor).
Como era e onde vivia? A resposta convencional é que era parecida com uma
bactéria e vivia num lago quente, possivelmente perto de uma fonte termal, ou
numa lagoa marinha. Nos últimos anos tem estado na moda dar-lhe uma morada mais
sinistra, desde que ficou claro que as rochas por baixo da terra e do mar estão
impregnadas de milhares de milhões de bactérias que utilizam produtos químicos
como combustível. Hoje em dia a UAUC é colocada debaixo do solo, a grande
profundidade, numa fissura em rochas ígneas quentes, onde se alimenta de
enxofre, ferro, hidrogénio e carbono. Até hoje a vida à superfície é apenas uma
camada de verniz. Talvez exista dez vezes mais carbono orgânico em bactérias
termofílicas muito abaixo da superfície, onde, provavelmente, são responsáveis
por gerarem aquilo que designamos por gás natural, do que em toda a biosfera9.
No entanto, existe
uma dificuldade conceptual na tentativa de identificar as formas de vida mais
antigas. Hoje em dia é impossível a maioria das criaturas adquirir genes a não
ser a partir dos pais, mas pode não ter sido sempre assim. Actualmente, as
bactérias também podem adquirir genes de outras bactérias apenas por as
ingerirem. No passado pode ter ocorrido uma troca alargada e mesmo roubo de
genes. No passado mais remoto, os cromossomas eram, provavelmente, numerosos e
curtos, cada um contendo apenas um gene, que poderia ser perdido ou ganho
facilmente. Carl Woese salienta que, se fosse este o caso, o organismo não
seria ainda uma entidade duradoura. Seria uma equipa temporária de genes. Os
genes que acabaram por permanecer em todos nós podem ter vindo de muitas
«espécies» diferentes de criaturas e é fútil tentar agrupá-las em linhagens
diferentes. Descendemos, não de uma UAUC ancestral, mas de uma comunidade
inteira de organismos genéticos. Segundo Woese, a vida tem uma história física,
mas não genealógica10.
O leitor pode pode
ver nesta conclusão um pedaço impreciso de uma filosofia comunitária,
holística, confortante — todos somos descendentes de uma sociedade, não de
uma espécie individual — ou pode vê-la como a derradeira prova da teoria
do gene egoísta: naquela altura, ainda mais do que hoje em dia, a guerra
travava-se entre genes, que utilizavam organismos como veículos temporários e
formavam apenas alianças transitórias; hoje é mais um jogo de equipa. Escolha
aquela de que mais gostar.
Mesmo que tivessem
existido várias UAUCs, podemos ainda especular acerca do local onde viviam e o
que faziam para viver. É aqui que surge o segundo problema com as bactérias
termofílicas. Graças ao brilhante trabalho de três neo-zelandeses publicado em
1998, de repente podemos vislumbrar a possibilidade de a árvore da vida, tal
como aparece em todos os livros de texto, poder estar de cabeça para baixo.
Esses livros asseguram que as primeiras criaturas eram semelhantes a bactérias,
células simples com cópias únicas de cromossomas circulares, e que todos os
outros seres vivos surgiram quando conjuntos de bactérias se agruparam para
formarem células complexas. O inverso poderá ser muito mais plausível. Os
primeiros organismos modernos não eram parecidos com bactérias, não viviam em
fontes termais ou em aberturas vulcânicas no fundo do mar. Eram muito mais
parecidos com protozoários: com genomas fragmentados em vários cromossomas
lineares, em vez de um circular, e «poliplóides», isto é, com várias cópias
extra de cada gene para ajudar na correcção de erros de ortografia. Além disso,
teriam gostado de climas frios. Como Patrick Forterre tem argumentado desde há
muito, agora parece que as bactérias apareceram mais tarde, sendo descendentes
altamente especializadas e simplificadas das UAUCs, muito depois da invenção do
mundo ADN-proteína. O seu truque foi terem abandonado muito do equipamento do
mundo ARN especificamente para poderem viver em lugares quentes. Fomos nós que
retivemos as características moleculares primitivas das UAUCs nas nossas
células; as bactérias são muito «mais evoluídas» do que nós.
Esta história
estranha é apoiada pela existência de «fósseis» moleculares — pequenos
bocados de ARN que permaneceram no núcleo das nossas células, fazendo coisas
desnecessárias, como excisarem os genes das suas sequências: ARN-guia (guide
RNA), ARN caixa forte (vault RNA), ARN nuclear pequeno, ARN
nucleolar mais pequeno, intrões auto-excisores (self-splicing). Como as
bactérias não têm nada disto, é mais parcimonioso acreditar que os perderam do
que nós os inventámos. (Talvez surpreendentemente, é suposto que a ciência
trate as explicações simples como mais prováveis do que as complexas a não ser
que haja motivos para pensar o contrário; o princípio é conhecido em lógica
como a navalha de Occam.) As bactérias largaram os velhos ARNs quando invadiram
lugares quentes, como fontes termais ou rochas subterrâneas, onde as
temperaturas podem atingir os 170°C — para minimizar os erros
causados pelo calor compensava simplificar a maquinaria. Tendo largado os ARNs,
as bactérias descobriram que a nova maquinaria celular eficientemente
simplificada as tornava boas competidoras em nichos onde a velocidade de
reprodução era uma vantagem — como nichos parasíticos ou necrófagos.
Nós retivemos esses ARNs velhos, relíquias de máquinas há muito superadas, mas
nunca verdadeiramente deitadas fora. Ao contrário do mundo altamente
competitivo das bactérias, nós, isto é, todos os animais, plantas e fungos,
nunca estivemos sob competição tão feroz para sermos rápidos e simples. Em vez
disso, premiámos o facto de sermos complicados, de termos o maior número de
genes possível, em vez de termos uma máquina eficientemente simplificada para
os utilizar11.
As palavras de
três letras do código genético são as mesmas em todas as criaturas. CGA
significa arginina e GCG significa alanina — em bisontes, em borboletas, em
bétulas, em bactérias. Até significam o mesmo nas enganadoramente chamadas
arqueobactérias que vivem em temperaturas de ebulição em fontes sulfurosas
milhares de metros abaixo da superfície do oceano Atlântico ou naquelas
cápsulas microscópicas de desonestidade chamadas vírus. Seja qual for o local
aonde nos desloquemos, qualquer animal, planta, insecto ou borrão para onde
olhemos, se estiver vivo, utilizará o mesmo dicionário e conhecerá o mesmo
código. A vida é única. O código genético, com excepção de algumas aberrações
locais, maioritariamente, por razões desconhecidas, nos protozoários ciliados,
é o mesmo em todas as criaturas. Todos nós usamos exactamente a mesma
linguagem.
Isto significa
— e as pessoas religiosas podem achar isto um argumento útil — que
houve apenas uma criação, um único evento, quando a vida nasceu. É claro que a
vida pode ter nascido num planeta diferente e ter sido semeada cá por uma nave
espacial, ou no início até poderão ter existido vários tipos de vida, mas
apenas a UAUC sobreviveu na sopa primordial implacável e competitiva. Mas até o
código genético ter sido descodificado nos anos 60 não sabíamos que toda a vida
é una, que as algas são primas distantes e que o antraz é um dos nossos
parentes avançados. A unidade da vida é um facto empírico. Erasmus Darwin
estava escandalosamente perto do alvo: «Um único tipo de filamentos vivos foi a
causa de toda a vida orgânica.»
Deste modo,
verdades simples podem ser lidas a partir do livro que é o genoma: a unidade de
toda a vida, a primazia do ARN, a química da vida mais antiga no planeta, o
facto de, provavelmente, criaturas unicelulares grandes terem sido os
ancestrais das bactérias, e não vice-versa. Não temos nenhum registo fóssil do
que era a vida há 4 mil milhões de anos. Temos apenas este grande livro da
vida: o genoma. Os genes das células do nosso dedo mindinho são os descendentes
directos das primeiras moléculas replicadoras; através de uma cadeia inquebrada
de dezenas de milhares de milhões de cópias, chegaram até nós transportando
ainda uma mensagem digital que tem traços dessas primeiras lutas da vida. Se o
genoma humano pode dizer-nos coisas acerca do que aconteceu na sopa primordial,
quanto mais poderá dizer-nos acerca do resto que aconteceu durante os 4 milhões
de milénios subsequentes. É um registo da nossa história escrito no código para
uma máquina trabalhadora.