Prefácio
Jorge Buescu não precisa
de apresentações. O grande público conhece-o como um professor de Matemática do
Instituto Superior Técnico e um dos divulgadores de ciência mais interessantes
e bem sucedidos do nosso país: o anúncio de uma conferência sua é garantia de
casa cheia e a sua opinião é procurada pelos meios de comunicação. Os seus
textos necessitam ainda de menos apresentação do que a sua pessoa. São lidos
avidamente, primeiro pelos leitores da revista Ingenium e, depois,
quando coligidos em livro, são sucessos editoriais. O seu primeiro livro, O
Mistério do Bilhete de Identidade e outras histórias (Gradiva, 2001) é uma
das mais conhecidas obras de divulgação científica por um autor português. No
momento em que escrevo estas linhas vai já na sétima edição e a sua notícia
passou para fora do nosso país. Prevejo que o livro que agora se publica terá
um trajecto semelhante.
Este prefácio seria por
isso completamente inútil e uma perda de tempo, não fosse o caso de o próprio
sucesso dos textos de Jorge Buescu ser um fenómeno que causa alguma
perplexidade e exige um pouco de reflexão.
Como se explica que num
país como o nosso, em que os índices de cultura científica, e sobretudo
matemática, revelam uma situação próxima do colapso — em que, mesmo depois de
doze anos de escolaridade, uma fracção apreciável de alunos não conseguiu
aprender a somar fracções, e até em cursos científicos e de engenharia é
possível encontrar estudantes incapazes de enunciar correctamente o Teorema de
Pitágoras — como se explica que textos que falam de algoritmos
complexos, do teorema de Fermat, da conjectura de Catalan, sejam lidos com
evidente prazer por tanta gente?
É verdade que a divulgação
científica e o ensino da ciência são tarefas diferentes e que a segunda é muito
mais difícil do que a primeira. Tentar ensinar os rudimentos da geometria ou da
aritmética a turmas de alunos entorpecidos por doses diárias de reality
shows, obcecados com sexo, anestesiados por uma cultura que promove a
boçalidade e o facilitismo é um desafio gigantesco. Os professores que
corajosamente continuam a tentar merecem estátuas e o respeito de todos nós. É
também verdade que a inexistência de «especialistas» em divulgação científica
— que trariam com eles a prática deprimente de uma pseudo-intelectualidade
oca e o uso de uma linguagem iniciática, que seria o divulguês —
tem também efeitos muito benéficos.
Mas mesmo levando em conta
estas razões, a entusiasmada recepção que têm tido os textos de Jorge Buescu
parece exigir alguma explicação.
Embora a divulgação
científica não sirva para ensinar, tem o mérito de identificar os interesses e
a curiosidade de uma população. Aliás, a esperança dos que se dedicam à
divulgação científica — e de todos nós — é que ela sirva para
potenciar e aumentar esse interesse por assuntos de ciência. Por isso, a
primeira coisa que o sucesso destes textos mostra é que parece não haver na
sociedade portuguesa nenhum problema com a matemática ou a ciência em si,
mas sim que há problemas graves com o ensino desses assuntos.
Sobre o diagnóstico desses
problemas e a terapia para os ultrapassar, este não é o lugar e eu não sou
certamente a pessoa para o fazer. Mas há algo a aprender olhando para o estilo
e as características mais salientes dos textos de Jorge Buescu, pois o
interesse geral não reagiria de maneira tão positiva se não fosse servido por
materiais da melhor qualidade.
Em
primeiro lugar está o domínio dos assuntos tratados. O lei-tor não se deve enganar pela aparente ligeireza destas
crónicas. Estes textos não se escrevem recolhendo e misturando à pressa
informação dispersa de proveniências diversas. Para escrevê-los foram precisas
horas de trabalho, por um matemático profissional. De resto, a competência do
autor adivinha-se na sensação que sempre fica de ele saber muito mais para além
daquilo que nos está a contar.
Todos os textos tratam
concretamente de assuntos concretos. Não se encontra aqui nem uma afirmação
vaga nem uma linha de prosa vaporosa. Os poetas do universo e outros lânguidos
contemplativos da harmonia cósmica não têm aqui matéria para os seus suspiros,
pela razão simples de que a ciência a sério não é assim. Além disso, Jorge
Buescu não subestima os seus leitores. Estas crónicas supõem um leitor
inteligente e disposto a pensar. Aliás, muitas crónicas implicitamente convidam
o leitor a trabalhar, de modo que ter por perto papel e lápis pode ser
recomendável.
Depois, há algumas outras
características que tornam a leitura destes textos num prazer. O leitor
encontrará aqui, com graça e em doses criteriosamente administradas, exemplos
daquela estranha combinação de excentricidade e monotonia que caracteriza as
vidas de muitos cientistas criativos. E encontrará sobretudo muito bom senso e
uma saudável desconfiança de preconceitos e da «sabedoria convencional». Alguns
desses preconceitos, típicos do nosso tempo, como o catastrofismo ambientalista
ou a sobranceria saloia com que tantos dos nossos contemporâneos olham para os
homens de ciência de épocas passadas, são aqui zurzidos com doses industriais
de humor e informação factual.
Finalmente, aquilo que me
parece o mais importante. Os textos visam, tanto quanto é possível, a compreensão,
isto é, o próprio núcleo do que é a ciência, que não é uma actividade
descritiva ou taxonómica, nem muito menos um exercício em nomenclatura, mas sim
um esforço árduo, constante e muitas vezes obsessivo para compreender.
Jorge Buescu desfruta de
uma posição especial entre os que fazem divulgação científica no nosso país,
mas não é o único. A divulgação
científica é feita entre nós, e muito bem, por uma meia dúzia de pessoas, cientistas,
que antes de qualquer outra característica têm a seguinte: sabem do que estão a
falar e é disso que falam. O facto de se dedicarem à divulgação não lhes trouxe
benefícios para as suas carreiras científicas — possivelmente até as
prejudicou — e à parte a sempre dúbia vantagem de algum reconhecimento
público, não se adivinha outro motivo para além do puro gozo de comunicar a
outros aquilo de que se gosta. Talvez estas coisas simples sejam, afinal, a
explicação mais profunda para o sucesso destas crónicas.
Henrique Leitão
Universidade de Lisboa
Agradecimentos
É espantoso verificar como
a publicação até de um pequeno livro como este pode ser tão melhorada com o
contributo de tantas pessoas que tenho a honra de contar como amigos.
Em primeiro lugar, é com o
maior prazer que agradeço a Henrique Leitão, meu amigo de há um quarto de
século (!). Ele acedeu a roubar tempo ao seu trabalho científico, único em
Portugal, bem como à sua família, aceitando enriquecer este livro com um
prefácio, pelo que lhe estou muito reconhecido.
Em relação ao meu anterior
livro O Mistério do BI e Outras Histórias, Eduardo Marques de Sá foi o
primeiro a apontar-me a necessidade de uma bibliografia e João Palhoto de Matos
a grande vantagem de dispor de imagens. Ambos tinham toda a razão; essas
insuficiências foram colmatadas no presente livro.
Carlos Fiolhais, Henrique
Leitão, João Filipe Queiró, Jorge Nuno Silva, Nuno Crato, Paulo Gil
disponibilizaram-se amavelmente para a espinhosa tarefa de ler e criticar versões
preliminares deste livro, enriquecendo-o com inúmeras correcções, sugestões e
comentários sempre pertinentes. A todos eles estou muito reconhecido. É claro
que quaisquer incorrecções que subsistam na versão final, em certas partes
reescrita, são da minha exclusiva responsabilidade.
Tal como aconteceu com O
Mistério do BI e Outras Histórias, a maioria dos textos agora nas mãos do
leitor viu a luz do dia pela primeira vez, embora sob forma por vezes bastante
diferente, na Ingenium, Boletim da Ordem dos Engenheiros, com a qual
tenho a honra de colaborar há anos assinando uma coluna sobre Matemática. Ao
Bastonário da Ordem, Eng.o Francisco Sousa Soares, e ao coordenador editorial,
Fernando Melo, agradeço a autorização para basear este livro nesses textos.
Como não há regra sem
excepção, o capítulo 10 foi escrito em colaboração com João Paulo Teixeira e
publicado na Gazeta de Física. Agradeço tanto ao meu co-autor como ao
director da Gazeta de Física, Carlos Fiolhais, a autorização para o
incluir neste livro.
Muitas outras pessoas
ajudaram de várias formas a que este livro assumisse a forma final. Estão
nestas circunstâncias Maria Adelaide Brandão e António Pádua Loureiro, bem como
a sua singular Universitas Gratiae, Teresa Carvalho e Paulo Ivo
Teixeira. Também largas dezenas de leitores da Ingenium, que seria impossível
nomear, responderam ao desafio que lhes propus, enviando--me muitas centenas de
números de série de notas de euro (mas, infelizmente, não as notas em si). Este
facto foi fundamental para os resultados apresentados no capítulo 1, que dá
parte do nome ao livro. A conjectura sobre os mini-códigos aí apresentada é
devida a Paulo Rogério Pereira, o recordista absoluto no envio de números de
série (cerca de duas centenas).
A John M. Sullivan, da
Universidade do Illinois, agradeço a sua gentil autorização em reproduzir as
imagens das bolhas duplas reproduzidas no capítulo 8. A Preda Mihailescu, da
Universidade de Paderborn, agradeço o amável envio de uma foto com autorização
para reprodução no capítulo 4. Ao meu amigo Luís Simas, que já está a tornar-se
no fotógrafo oficial destes livros, devo
o inestimável apoio nas fotos do capítulo 7 e no tratamento de outras
imagens.
A toda a equipa da
Gradiva, e muito em particular ao meu amigo Guilherme Valente, agradeço o
permanente apoio, encorajamento e disponibilidade para que este livro visse a
luz do dia.
Numa tarefa destas, o
apoio da família foi essencial de muitas maneiras. Ao Henrique agradeço os
berlindes e ao Guilherme a plasticina que me emprestaram para uma das fotos do
capítulo 7. À Catarina, para agradecer devidamente, teria de escrever outro
livro; ela sabe porquê.
Jorge Buescu
Lisboa, 23 de Fevereiro de 2003
parte i
Matemática
1
Como falsificar euros
Com a festa da entrada em
circulação da moeda única a 1 de Janeiro de 2002, o Banco Central Europeu (BCE)
herdou um ver-dadeiro pesadelo: o que
fazer para evitar, com a introdução de notas desconhecidas num mercado
com mais de 300 milhões de utilizadores, a inevitável tentação criminosa da
falsificação de notas?
Parte da resposta é
conhecida: as notas emitidas pelo BCE possuem vários sistemas tecnológicos de
segurança, concebidos para dificultar a reprodução: a banda holográfica; a
marca de água; a banda identificadora... aparentemente, serão 11 os mecanismos
de segurança, dos quais o BCE só terá divulgado sete.
Um dos mecanismos de
segurança, obviamente não divulgado, é o da formação do número de série das
notas. Trata-se de um mecanismo estritamente matemático, que não envolve
qualquer tipo de alta tecnologia gráfica,
mas que pode ser uma defesa pode-rosíssima contra a fraude. A ideia é
óbvia, e utilizada em todo o mundo: implementar nos números de série das notas
emitidas um algoritmo de validação dos números, por forma a que um eventual
falsário, que se limite a inventar um número de série arbitrário e o imprima na
nota, corra o sério risco de imprimir um número de série inválido — e
a falsificação seja detectada.
Por exemplo, eu tenho
neste momento à minha frente a nota de 20 euros com o número de série
M30521117947. Veremos a seguir que, se tivesse a má ideia de produzir uma nota
falsa com o número M30521117948, esse número seria ilegal e a falsificação
imediatamente detectada.
Como é evidente, embora o
combate à falsificação seja uma motivação poderosa, está longe de ser a única
para introduzir algoritmos deste género — chamados sistemas de
identificação. Outro objectivo essencial é o de evitar erros de comunicação e
transmissão de dados. Imaginemos, por exemplo, que uma agência bancária envia a
outra um grande volume de notas. Provavelmente enviará também um documento
escrito, talvez por fax, comunicando os números de série das notas a
transportar. Se por acaso houver um erro de escrita desses números de série
(causado por erro humano como carregar na tecla errada, por um fax de baixa
resolução, etc.) a agência receptora pode detectá-lo ainda antes do transporte
físico, simplificando bastante a vida aos bancários e evitando situações
potencialmente desagradáveis.
É para evitar situações
deste género que, desde os anos 50, se criaram sistemas de detecção de erros
sempre que se lida com números com muitos algarismos. A ideia é sempre a mesma:
a de incorporar no próprio número um ou mais algarismos suplementares
— ditos algarismos de verificação, ou por vezes dígitos de
controlo — que permitam detectar se o número em questão é válido ou
se, pelo contrário, foi algures cometido pelo menos um erro de escrita, leitura
ou transmissão.
Hoje
em dia a utilização destes sistemas está perfeitamente generalizada. Por exemplo, os números de bilhete de avião
consistem num número de 15 algarismos dos quais o último é um algarismo de verificação. Os números de cheque (em
Portugal) têm dois alga-rismos de verificação. Os códigos de barras
possuem um algarismo de verificação. O ISBN (International Standard Book
Number, que aparece na contracapa de cada livro e o identifica) é um número de
10 algarismos, dos quais o último é de verificação.
Todos estes sistemas de
identificação têm o mesmo objectivo: detectar o maior número possível de erros
na transmissão de um com muitos algarismos. Para isso é conveniente saber quais
são os erros típicos que ocorrem, bem como quais as frequências relativas.
Quando um caixa de supermercado, ou um agente de viagens, ou uma livraria, se
enganam num destes números, quais são tipicamente os erros cometidos?
A
resposta está na tabela 1. Cerca de 80% dos erros são os cha-mados erros singulares: um erro isolado num
único algarismo. Mais de 10% são os chamados erros de transposição, em
que se troca a ordem de um par de algarismos. Todos os outros tipos de erros em
conjunto somam pouco mais de 10% do total, não havendo nenhum tipo de erro com
frequência superior a 0,8%.
Assim, o objectivo mínimo
de um sistema de detecção de erros deve ser o de detectar com eficiência 100%
todos os erros singulares e de transposição. Se o conseguir, detectará (no
mínimo) cerca de 90% dos erros efectivamente cometidos.
Todos
os sistemas de detecção de erros acima descritos (bilhetes de avião, códigos de barras, ISBN, cheques, cartões de
crédito, etc.) são pequenas variações sobre um único tema: o algarismo de
verificação é calculado através de aritmética modular. A forma mais fácil de
compreender este facto é através de um exemplo.
Tomemos, por exemplo, o
caso do ISBN. O ISBN é um número de 10 algarismos em que, como foi acima referido,
os nove primeiros identificam o país, a editora e o livro, sendo o último o de
verificação, calculado da seguinte forma: para que o número
x1 x2 x3 x4 x5 x6 x7 x8 x9 - x10
seja
um número ISBN válido, x10 deve ser tal que a soma («de controlo»)1
S = 10x1 + 9x2 + 8x3 + 7x4 + 6x5 + 5x6 + 4x7 + 3x8 + 2x9 + x10
seja
múltipla de 11 (seja congruente com 0 módulo 11, isto é, dê resto 0 quando
dividida por 11). Por exemplo, o livro O Mistério do Bilhete de Identidade e
outras histórias, do autor destas linhas, tem o ISBN 972662792-3; o
algarismo de verificação é 3, e é de facto o único inteiro (entre 0 e 10) que
faz com que a soma de controlo seja congruente com 0 módulo 11.
Por outro lado, o leitor
pode convencer-se facilmente de que se cometer um erro singular ou de
transposição na escrita deste número, ele será fatalmente detectado — porque os
pesos atribuídos a algarismos diferentes são diferentes (e todos eles são primos
relativamente a 11). Assim, estes erros são detectados com eficiência 100% pelo
algoritmo ISBN. A razão de se utilizar 11 como módulo vem da Teoria de Números:
11 é o menor primo maior ou igual a 10, assegurando sem grande esforço que
qualquer dos pesos é primo com o módulo utilizado.
Todos os outros algoritmos
descritos são pequenas variações sobre este tema: pode variar o módulo (que
para os bilhetes de avião é 7) ou os pesos atribuídos a cada algarismo, mas a
determinação do algarismo de controlo é sempre a aritmética modular. No
entanto, nem todos os algoritmos são «perfeitos»: o dos bilhetes de avião não
detecta todos os erros singulares ou transposições.
Mas
mesmo o algoritmo ISBN tem desvantagens: o comprimento do número não pode ser
superior a 10 algarismos. Por exemplo, se um dia o número de livros que dispõem
de ISBN ultrapassar o número total disponível, mesmo com as astúcias
actualmente em vigor, o sistema ISBN terá de ser substituído por um outro
completamente novo, de raiz (não é caso único: prevê-se que o código de barras
americano, que usa 12 algarismos, esgote a sua capacidade em 2005, passando os
EUA a adoptar o código de barras europeu, que tem mais um algarismo). Por outro
lado, o algarismo de controlo está, em geral, entre 0 e 10 inclusive (no caso
de a soma de controlo, excluindo o algarismo de identificação, ser 1, este terá
de ser 10). Para obviar este problema introduz-se no ISBN um carácter extra, no
caso X (que em numeração romana é 10), a ser usado quando o algarismo de
controlo é 10. Como já explicado no livro citado, a tentativa desastrada de
evitar o símbolo X como algarismo de controlo no BI português conduziu ao
célebre bug do BI (que também está presente no número de contribuinte).
Mas não estamos orgulhosamente sós: aparentemente, o documento de identificação
em certos estados brasileiros sofre de um
problema semelhante.
Em 1969 o matemático
holandês J. Verhoeff criou um sistema de identificação perfeito do ponto de
vista descrito. Detecta todos os erros singulares e de transposição com
eficiência 100%, admite números com uma quantidade arbitrária de algarismos
— 10, 20, 100 — e necessita apenas de um único algarismo de
identificação, que toma apenas os valores 0, 1, ... 9.
O preço a pagar é que o
sistema de Verhoeff é matematicamente bem mais sofisticado do que a simples
aritmética modular: baseia-se em permutações com uma característica algébrica
particular (ditas permutações assimétricas) de 10 elementos (os
inteiros) sobre o grupo diedral D5 (grupo
das simetrias do pentágono regular). O grupo D5
não é comutativo, ao contrário da arit-mética modular. Implementar o sistema
de Verhoeff exige conhecimentos não-triviais de Matemática; reconstruí-lo por
observação dos números admissíveis é extremamente difícil.
Do ponto de vista de um
banco que deseja evitar falsificações de notas, o sistema de Verhoeff
(generalizado por H. Gumm em 1985) é perfeito. Há mais de dois milhões de
permutações assimétricas de D5. Um
falsificador consciencioso teria de recolher milhares de números de notas,
construir todas estas permutações e testá-las uma a uma (admitindo que
compreendesse a Matemática do sistema de Verhoeff) para conseguir reconstruir o
sistema usado e produzir notas «genuinamente falsas» — ou seja, cuja
falsidade não fosse detectável a partir dos números de série.
Foi exactamente isto que o
Bundesbank alemão pensou — e, se bem o pensou, melhor o fez. O
Bundesbank utilizou o sistema de Verhoeff na verificação de números de série de
notas de marcos entre 1990, após a reunificação da Alemanha, e 2001, até à entrada
em vigor do euro. São essenciais conhecimentos sofisticados de Matemática para
quebrar este algoritmo; torna-se necessário calcular todas as permutações
anti-simétricas do grupo S10; para cada
uma, compor todas as combinações das suas potências com o produto do grupo diedral não-comutativo D5; e testar todos os resultados
obtidos contra os dados experimentais. Asseguro que é uma tarefa
matematicamente não-trivial, acima das capacidades de um qualquer candidato a falsário, e computacionalmente
gigantesca. O código utilizado foi revelado
em 1991 por um matemático alemão, R.-H. Schulz, da Universidade de
Berlim, especialista em Teoria de Códigos e Criptografia. Obviamente, o facto
de o algoritmo se tornar público não afectou a sua utilização para efeitos de
controlo de erros de transmissão; em todo o caso, não deve ter deixado muito
satisfeitos os responsáveis do Bundesbank.
E regressamos finalmente
ao euro. Com a entrada em circulação de um dia para o outro de uma moeda nova
em folha; com a necessidade maior do que nunca — até por razões políticas —
de proteger o euro de falsificações; com a muito positiva experiência do
Bundesbank, e com a locomotiva de Berlim a puxar o comboio da moeda única, não
podia esperar-se outra coisa senão que o esquema de segurança implementado nos
números de série das notas de euro fosse o sistema de Verhoeff.
Foi assim com a
expectativa de ver a Matemática consagrada como
base da segurança do novo sistema financeiro europeu que o autor destas
linhas começou a coleccionar números de série de notas de euro, e a escrever programas de computador que permitissem
testar permutações assimétricas de D5. Havia contudo bastantes surpresas à espera, e os programas não foram sequer
necessários.
Os números de série das
notas de euro são formados por uma letra seguida de 11 algarismos. O primeiro
carácter do número de série, a letra,
identifica o país em que a nota foi emitida. A correspondência entre
letras e países é dada na tabela 2. Aí se pode ver, por exemplo, que as notas emitidas em Portugal são as identificadas pela
letra M. Estes dados, como me foi comunicado pelo Prof. Eduardo Morgado,
do IST, são públicos: veja-se http://www.lbmrc.co.uk/19_news_bulletin.htm. Em
particular, o leitor poderá a partir de hoje saber de onde são originárias as
notas que lhe passam pelas mãos!
É
simples, apenas a partir da colecção de números de notas, compreender que
existe um único algarismo de controlo — o último, que toma apenas
valores entre 1 e 9. Os 10 algarismos intermédios são o número da nota
propriamente dito. O mecanismo de controlo funciona da seguinte forma: a cada
letra é associado um valor numérico (por exemplo, Z = 9 e M = 5).
Apresentam-se na tabela 2 todas estas correspondências. Substituindo a letra
pelo seu valor numérico, obtemos, pois, um número de 12 algarismos. E eis o
fantástico algoritmo de controlo concebido pelo Banco Central Europeu: para ser
válido, esse número tem de ser congruente com 0 (mod 9). Dito de outra forma:
tem de verificar noves fora nada.
E é tudo. Se o leitor não
acredita, sugiro que faça o teste com notas que tenha na carteira. Pegue numa
delas, substitua a letra pelo seu valor numérico2,
e some todos os 12 algarismos do número obtido. O resultado tem de ser um
múltiplo de 93. Ou seja, o número resultante verifica noves fora
nada.
Há algumas curiosidades
relacionadas com a tabela 2. Em primeiro lugar, é interessante notar que o
padrão seguido pelo BCE para a atribuição de valores numéricos a letras é claro
e matematicamente trivial: começando com J = 2, o valor numérico
de uma letra é sempre o sucessor do da letra anterior módulo 9. As letras O = 7
e Q = 9 não são atribuídas, provavelmente por se poderem
confundir com o número 0. Assim, não existem notas começadas por estas letras.
Este padrão corresponde simplesmente a começar por atribuir o valor numérico
máximo (9) à última letra do alfabeto (Z) e diminuir o valor por 1
quando se passa à letra anterior (tendo em atenção que, em aritmética módulo 9,
9 = 0). Prosseguindo a tabela para trás, constata-se, por exemplo,
que A = 2 — o que sugere fortemente que a atribuição de
valores a letras tenha de facto começado «de trás para a frente».
Em segundo lugar, existe
uma particularidade muito curiosa. Embora a União Europeia integre 15 países,
só 12 deles aderiram ao euro; o Reino Unido, a Suécia e a Dinamarca decidiram
voluntariamente excluir-se, por enquanto. No entanto, o BCE decidiu desde já
reservar letras para estes países (respectivamente J, K e W),
provavelmente na esperança de que invertam a sua decisão a curto prazo. Assim,
o leitor também não encontrará notas de euro em circulação cuja letra seja uma
destas — pelo menos até à adesão destes países.
Observe-se uma terceira
curiosidade: o sistema de atribuição de letras a países emissores de notas
permitirá incorporar no máximo 23 países. Há 26 letras no alfabeto escolhido,
das quais se excluem O e Q (por se poderem confundir com o número
0) e provavelmente, se e quando chegar a altura, se excluirá também a letra I
(por se poder confundir com o número 1). Assim, se e quando a Zona Euro tiver
mais de 23 membros, o sistema entrará em rotura, sendo necessário reformulá-lo.
Existe
ainda um curioso fenómeno especificamente português, já não relacionado com a
tabela 2. As notas emitidas em Portugal começam pela letra M; o primeiro
algarismo a seguir à letra identifica a designação da nota: na de 5 euros
(primeira designação) é 1, na de 10
(segunda designação) é 2, na de 20 é 3, na de 50 é 4, etc. Este fenómeno, contudo, não ocorre aparentemente em qualquer
outro país; e como veremos abaixo há quatro países — Alemanha,
França, Itália e Espanha — em que garantidamente não pode ocorrer.
Trata-se, pois, de mais uma originalidade portuguesa.
Estas quatro curiosidades
são, no entanto, epifenómenos irrelevantes para a questão essencial: a
discussão matemática do sistema de verificação utilizado, o milenar e
literalmente infantil noves fora nada.
Do ponto de vista
matemático, dificilmente o sistema podia ser mais primitivo. Em primeiro lugar,
é completamente transparente; uma criança pode compreendê-lo — ou,
pior, qualquer candidato a falsificador pode detectá-lo sem esforço. Em segundo
lugar, e mais importante: é extremamente ineficiente enquanto algoritmo de
controlo de erros de transmissão. Todos nos lembramos da escola primária que a
prova dos nove não assegura que um cálculo está correcto: é uma condição
necessária mas não suficiente. Analogamente, o facto de um número de série
verificar noves fora nada não é garantia de que tenha sido correctamente
transcrito. O sistema adoptado pelo BCE detecta 0% dos erros de transposição
(trocar dois números consecutivos deixa tudo na mesma) e apenas 97% dos erros
singulares (não são detectadas as trocas de 0 por 9 ou vice-versa, que na
escrita por computador até são plausíveis — as teclas 0 e 9 estão
lado a lado)4. Em suma: é um péssimo sistema de detecção de erros,
com uma eficiência global da ordem de 78%.
Este número é altamente
preocupante. Significa essencialmente o seguinte: em 100 números de série
errados, apenas 78 serão detectados como tal; 22 serão considerados (erradamente)
números de série válidos. A preocupação aqui nem é tanto a falsificação de
notas: qualquer falsificador que se preze sabe fazer a prova dos nove, e
produzirá certamente notas falsas com números de série válidos. O verdadeiro
problema está na enorme ineficiência de verificação de erros de comunicação
entre bancos. De facto, é quase assustador pensar que quase um quarto dos erros
cometidos na comunicação dos números de série entre bancos, num mercado de 300
milhões de habitantes, não é detectado!
Como é possível que a
primeira moeda genuinamente do século xxi,
que utiliza tecnologia física de ponta, lasers e hologramas, na sua
impressão, utilize um sistema de detecção de erros que representa uma regressão
ao primeiro milénio? E que a decisão do BCE tenha sido a de rejeitar um
sistema de controlo como o de Verhoeff, com eficiência global de cerca de 95% a
favor de outro de igual custo e eficiência 78%? Como é possível que tenhamos um
bug nas notas de euro?
Uma possibilidade algo
deprimente é a de terem existido longas reuniões de eurocratas durante as
quais os representantes de alguns países, porventura ignorantes das subtilezas
matemáticas, acharam desnecessária toda a «complicação» do sistema de Verhoeff,
em vigor na Alemanha, e se lembraram da prova dos nove da sua infância, que
todos conheciam... alguns votos a favor e umas quantas abstenções poderão ter
feito o resto. A vítima foi o euro. Será razoável ter esperança que um pequeno
país à beira-mar plantado, que não conseguiu copiar o algoritmo ISBN
para o seu BI, tenha votado do lado certo?
Sejamos optimistas: há
outras explicações possíveis para o bug do euro. A mais plausível, que
infelizmente nada tem que ver com ciência, será dada no final.
Mas será possível que seja
mesmo este o fim da história? Uma observação bastante pertinente que se pode
fazer é a seguinte: será possível que exista um metacódigo mais elaborado,
oculto no interior do código evidente dos nove fora nada?
A resposta é NÃO! Trata-se
de uma razão estritamente aritmética. Cada país tem à sua disposição 1010 números de série, correspondentes aos 10 algarismos «livres».
Suponhamos que estes 10 algarismos incorporam um subcódigo com (pelo menos) um
dígito de controlo oculto. Passa apenas a haver 109
números de série possíveis (pelo menos um dos 10 algarismos é utilizado para
controlo).
A quantidade de notas
colocadas em circulação a 1 de Janeiro de 2002 foi divulgada publicamente pelo
BCE e está na Internet; veja-se http://www.euro.ecb.int. Alemanha,
França, Itália e Espanha colocaram nesta data mais do que 109
notas cada um. Portanto, nestes países é matematicamente impossível haver
subcódigos ocultos: não há algarismos suficientes — todos os 10 algarismos
disponíveis são utilizados no número de série!
Restam os outros países,
onde foram emitidas menos de 109 notas. Esses
são os que «poderiam» ter mecanismos de validação internos. Portugal é um
deles. Mas em Portugal o primeiro dígito é, como se disse na quarta
curiosidade, utilizado para identificar a designação da nota (notas de 5€
têm como primeiro dígito 1, de 10€ como primeiro dígito
2, etc). pelo que só «sobram» 9 algarismos. Em particular, não existe espaço
matemático para um algarismo de subcontrolo de um eventual metacódigo.
Quanto aos outros sete
países não é possível fazer uma afirmação conclusiva. Mas a hipótese de um
subcontrolo «local» é muito improvável não só em função dos comentários
anteriores como por originar um pesadelo logístico (cada banco nacional teria
de comunicar aos 11 parceiros o seu subcontrolo parti-cular...).
Contudo, há outra surpresa
à nossa espera nas notas de euro, como fez notar Paulo Rogério Pereira, do IST.
As notas de euro, na face oposta à que contém o número de série, possuem um segundo
código, a que chamarei mini-código. É minúsculo, está localizado
sobre o lado esquerdo (nas notas de 20€, por exemplo,
situa-se no interior de uma das estrelas) e é composto por seis caracteres: uma
letra, 3 algarismos, uma letra entre A e J e um último algarismo
entre 1 e 6. Veja-se a figura 2.
O leitor mais optimista
pode neste momento estar a sorrir de satisfação: afinal, o sistema pode não ser
tão patético quanto parecia! O verdadeiro controlo matematicamente sofisticado
pode estar escondido no mini-código.
No entanto, alguma
experiência leva a duvidar fortemente desta conjectura. Por exemplo, nas notas
portuguesas o mini-código começa apenas por duas letras: U (5€,
10€ e 20€) e H (20€,
50€, 100€). Por outro lado, o
mini-código não parece ter qualquer restrição — em particular dígitos
de controlo; e é muito frequente aparecerem notas diferentes com o mesmo
mini-código. Só se o mini-código dependesse do número de série poderia
controlar algo; mas isso não parece acontecer. Os caracteres 2 a 4 correspondem
a um número baixo, tipicamente 00n. Finalmente, o facto de o algarismo
final estar entre 1 e 6 torna-o completamente inútil para algoritmos modulares.
A ilusão de quem esperava
um algoritmo sofisticado no mini--código do euro é destruída com a consulta na
Web a http://www.myeuro.info/. Aí ficamos a saber que os bancos
nacionais são livres de dar ordem de impressão das suas notas a qualquer das
tipografias autorizadas pelo BCE. A letra inicial do mini- -código identifica simplesmente a tipografia
autorizada pelo BCE onde foi fisicamente produzida a nota (ver tabela 3).
Por exemplo, as notas portuguesas com mini-código começado por U foram
impressas no Carregado e as começadas por H em Gateshead, no Reino Unido (que,
curiosamente, ainda não está na Zona Euro). As notas portuguesas mais valiosas
foram, assim, produzidas em Inglaterra. Embora o Reino Unido ainda não esteja
na Zona Euro, já está a imprimir notas para outros países, como Portugal.
Quanto ao resto do
mini-código, aquilo que posso afirmar não são factos confirmados mas
conjecturas fortemente apoiadas nas muitas
centenas de dados recolhidos. Os 3 algarismos seguintes do mini-código são um
número de ordem de impressão (001,002, etc.).
O quinto carácter (letra
entre A e J) e o sexto carácter (número entre 1 e 6) podem tomar
em conjunto 60 valores diferentes. Ora, de acordo com o press release de
12 de Novembro de 2001, dis-ponível em http://www.euro.ecb.int/pt/news/presskit.html,
o papel das notas é cortado em folhas, onde serão impressas 24 a 60 notas,
dependendo do tamanho da nota. E, de facto, nas notas de 5€
(as mais pequenas) todas as 60 combinações estão presentes; mas isso já não
acontece em notas de designações (e dimensões) maiores. Por exemplo, não há
nota de 10€ nem 20€ com letra J,
nem nota de 20€ terminada em «6». Assim, estes dois caracteres com
grande probabilidade identificam a posição dentro da folha de impressão onde as
notas foram impressas.
O mini-código constitui um
novo anticlímax: não só não salva a face matemática do euro como é uma
desilusão. O mini-código não é um elemento matemático que permita validar
números de série; nem sequer incorpora ele mesmo um algoritmo de controlo.
Contém apenas informação técnica sobre a impressão das notas. É claro que esta
informação técnica pode ser cruzada «manualmente» com o número de série para
fornecer uma validação deste; mas se isso acontece é através de um
surpreendente processo de «força bruta». Em particular exige a manutenção de
uma base de dados gigantesca. O mínimo que se pode dizer é que não parece um
processo muito inteligente de o fazer.
O site http://www.myeuro.info/,
que tem versões em várias línguas, entre as quais o português, permite aos
utilizadores registarem códigos e mini-códigos de notas de euro, verificar
estatísticas e mesmo seguir o percurso de uma nota pela Europa. Em Fevereiro de
2003 tinham sido registadas cerca de 150 000 notas, das quais 1697 eram
portuguesas. Uma visita que se recomenda aos mais curiosos. A versão em alemão
(mas não as versões noutras línguas) possui explicações descritivas sobre o código
e o mini-código das notas.
Finalmente, ofereço uma
hipótese especulativa para a bizarra decisão do BCE em introduzir um bug
nas notas de euro. Ao que tudo indica no momento da escrita, a União Europeia
será alargada em 2004 a mais dez países: Polónia, Hungria, Eslovénia, Eslováquia,
República Checa, Estónia, Letónia, Lituânia, Chipre e Malta (além destes, a
Turquia já solicitou a adesão à UE). A União Europeia passará assim a ser
formada por 25 países, em lugar dos actuais 15. Ora, como se explicou a
propósito da tabela 2, o sistema actualmente utilizado nas notas de euro admite
apenas 23 letras utilizáveis. Mesmo os países hoje membros da UE que não estão
na Zona Euro têm uma letra já atribuída, casos do Reino Unido, Suécia e Dinamarca.
É de crer que o mesmo suceda quando estes dez países aderirem. Nessa altura
haverá pois 25 países para 23 letras, e o actual sistema «um país-uma letra»
ficará obsoleto; terá forçosamente de ser substituído por outro. Se esta
conjectura estiver correcta, o sistema de numeração de notas de euro mudará em
2004, aquando da adesão dos novos países. Provavelmente, nessa ocasião será
adoptado um sistema de controlo matematicamente eficiente e sofisticado, como o
de Verhoeff e Gumm, para substituir a infantil (e perigosa) prova dos nove
actual. Ou seja: será corrigido o bug. O actual euro 1.0 passará a um
(espera-se) melhorado euro 2.0.
No entanto, é mesmo
possível que o sistema actual tenha sido deliberadamente concebido de forma a
ficar obsoleto com a adesão dos novos países à UE (que estava a ser negociada
há anos, antes mesmo da introdução do euro). Na verdade, que melhor sinal de
boa-vontade política a UE poderia dar aos novos países do que dizer,
«Bem-vindos! Convosco aqui, temos agora de alterar a forma como numeramos as
nossas notas. Mas não se preocupem; será um prazer!».
Prazer ou não, note-se
que, mesmo tratando-se de uma estratégia deliberada e de uma decisão política,
o facto que vai tornar o sistema actual obsoleto é a atribuição de uma letra a
cada país, e não o sistema de verificação utilizado. Mesmo que tudo se tenha
passado assim, não era necessário termos hoje o bug da prova dos nove
nas notas. Como dizia um conhecido humorista, «não havia necessidade».
2
O mundo é pequeno
A cena é familiar. Suponha
o leitor que está numa festa com dezenas de pessoas. Naturalmente, conhece
algumas delas e não conhece outras. De repente, dá-se conta de que dois seus
conhecidos que julgava nada terem que ver um com o outro — digamos, um
dos administradores da sua instituição e um antigo colega de liceu que já não
via há 15 anos — se conhecem mutuamente. Ou que, ao conversar com alguém
que acabou de lhe ser apresentado, descobre que esse alguém afinal é cunhado
de um dos melhores amigos daquele seu colega que vive numa cidade distante.
Dificilmente conseguirá escapar ao lugar-comum que todos repetimos em
circunstâncias semelhantes: «O mundo é pequeno!»
Curiosamente, resultados
recentes de investigação matemática vieram mostrar que este lugar-comum é muito
mais profundo do que parece. Num certo sentido muito preciso, as teias de
relações humanas estão quase fatalmente — e surpreendentemente —
condenadas a evidenciar um fenómeno deste tipo, conhecido na literatura
científica precisamente como fenómeno dos «pequenos mundos» e no imaginário
popular como os «seis graus de separação». Esta ideia consiste no «facto» de
qualquer ser humano — o leitor,
por exemplo — estar apenas a seis pessoas de distância de qualquer outra
— o Papa ou Nelson Mandela ou um anónimo cidadão japonês — no
sentido em que o leitor conhece alguém que conhece alguém que... até chegar ao
Papa (ou Mandela ou ao dito cidadão japonês) no máximo em seis passos.
A história começa no final
dos anos 60, com uma famosa experiência do psicólogo norte-americano Stanley
Milgram (célebre pelas suas experiências muito polémicas sobre os efeitos da
autoridade no comportamento humano). Milgram enviou um conjunto de pacotes a
cidadãos do Nebraska e Kansas, com instruções para os destinatários os
reenviarem a conhecidos seus com o objectivo final de os fazer chegar a uma
dada pessoa no Massachusetts, com a qual não tinham qualquer relação. Os seus
resultados foram surpreendentes: os pacotes atravessaram os Estados Unidos e
chegaram ao destino através destas cadeias, em média, ao fim de cinco passos!
Realizando correcções estatísticas (houve pacotes que nunca chegaram ao
destino), a conclusão de Milgram foi que o comprimento médio de uma cadeia de
conhecimentos que leva de uma pessoa a qualquer outra é seis. Ou seja, qualquer
pessoa está separada de outra qualquer por seis apertos de mão — «seis
graus de separação».
É claro que este estudo
empírico em si não prova grande coisa. No entanto, esta ideia perturbadora
enraizou-se na cultura popular. É esta a origem da expressão «seis graus de
separação» que dá nome à peça de teatro de 1990 do dramaturgo americano John
Guare e ao filme de 1993 de Fred Schepisi: uma das personagens; Ouisa, afirma a
certa altura que
«[...] todas as pessoas neste planeta estão separadas entre
si por apenas seis outras pessoas. Seis graus de separação. Entre nós e
qualquer outra pessoa do planeta. O Presidente dos Estados Unidos. Um
gondoleiro de Veneza. Um esquimó [...] estou ligado a qualquer pessoa do
planeta por uma cadeia de apenas seis pessoas. É uma ideia profunda... cada
pessoa é uma porta que se abre para novos mundos.»
Por outro lado, a ideia
deu origem a variantes curiosas como, por exemplo, o jogo Six Degrees of Kevin
Bacon, implementado na Internet pelo Departamento de Ciência de Computação da
Universidade da Virgínia através de um programa chamado O Orá-culo de
Bacon. Dê-se a cada actor que contracenou com Bacon nalgum filme o «número
de Bacon» 1, a um actor que nunca con-tracenou com Bacon mas que contracenou
com alguém que contracenou com Bacon o número 2, etc. O número de Bacon mede
assim a «distância cinematográfica» de um qualquer actor a Bacon. Existem
actores completamente separados de Bacon?
A resposta é não: o número de Bacon máximo é 6. Mais: o número de Bacon
«médio», num universo de quase 300 000 actores, é surpreendentemente
baixo: cerca de 2,9. Por exemplo, Maria de Medeiros tem número de Bacon 2:
entrou em Pulp Fiction contracenando com Amanda Plummer, que por sua
vez contracenou com Bacon em Elizabeth Jane. Joaquim de Almeida tem
número de Bacon 3, ligando-se a ele através de Aurore Clement e Vittorio
Gassman. O Mundo de Hollywood é muito, muito pequeno. Se o leitor tiver
curiosidade em calcular o número de Bacon do seu actor preferido (bem como a
lista de ligações cinematográficas que a ele conduzem) é convidado a visitar O
Oráculo de Bacon em http://www.cs.virginia.edu/oracle/).
Um exemplo particularmente
caro aos matemáticos é o do «número de Erdös». Paul Erdös, matemático húngaro
falecido em 1996, foi a par com Euler o matemático mais produtivo de todos os
tempos. Publicou mais de 1500 artigos, muitos deles em colaboração. Os matemáticos tiveram então
a ideia de calcular o «número de Erdös»: se um matemático publicou um artigo em colaboração com Erdös, o seu
número é 1; se não publicou mas publicou um artigo conjunto com alguém que o
fez, o seu número é 2, etc. Há 507 matemáticos com número de Erdös 1 e mais de
seis mil com número de Erdös 2. O autor destas linhas, por exemplo, tem número
de Erdös 4. Também a matemática é um pequeno mundo. Curiosamente, o
próprio Erdös tem o número de Bacon
4: ele entrou em filmes sobre Matemática!
Tudo isto parecem ideias
mais ou menos vagas e folclóricas. Curiosidades engraçadas para referir num
animado jantar com amigos, mas com pouca ou nenhuma substância científica. E assim permaneceram as coisas até
1998 e à publicação na Nature de um artigo dos matemáticos Duncan Watts
e Steven Strogatz, da Universidade de Cornell, intitulado «Dinâmica colectiva
de reticulados de ‘pequenos mundos’». Duncan Watts forneceu entretanto uma
versão mais profunda e pormenorizada do seu trabalho numa sucessão de artigos,
culminando no seu livro Small Worlds, publicado pela Princeton
University Press em 2000.
O trabalho de Watts e
Strogatz é curioso, porque não se pode catalogar em nenhum ramo fixo da
Matemática. Pelo contrário, ele vai buscar ideias e métodos a ramos diferentes;
alguns resultados são teoremas formais, outros são obtidos através de simulação
por computador. O conjunto, no entanto, é extremamente interessante e abre as
portas a um novo campo de investigação de enorme importância científica e
tecnológica.
Como é possível abordar matematicamente
o fenómeno dos pequenos mundos, em que dada uma teia de relações (seja de
conhecimento social, de contracenar em filmes ou de escrever em conjunto) se
pretende descobrir o caminho com menos ligações que vai de um ponto para outro?
A resposta está no conceito de grafo, introduzido pelo matemático suíço
Leonhard Euler no século xviii.
Suponhamos que temos um
conjunto finito — por exemplo, um conjunto de pessoas — em que cada
elemento pode ou não estar relacionado com os outros através de uma relação — por
exemplo, o conhecimento pessoal. Uma forma muito útil de representar
simultaneamente o conjunto de todos os elementos e de todas as
relações é representando os elementos do conjunto através de pontos
— chamados de vértices do grafo —, unindo dois vértices
distintos por meio de uma linha — chamada aresta do grafo — no
caso de eles estarem relacionados. Por exemplo, podemos ver na figura 1 o
grafo da relação de conhecimento mútuo correspondente a um conjunto de quatro
pessoas que se conhecem todas entre si.
A ordem de um
vértice é o número de arestas que emanam desse vértice. Por exemplo, no grafo
acima todos os vértices têm ordem 3: de todos os vértices emanam exactamente
três arestas. Isto é apenas uma forma diferente de dizer que cada pessoa conhece
outras três.
A teoria de grafos é o
estudo sistemático das propriedades de grafos; permite retirar conclusões por
vezes surpreendentes. Suponhamos, por exemplo, que a este grupo (chamado clique,
porque todos se conhecem entre si) se junta uma quinta pessoa, que apenas
conhece duas delas. O grafo correspondente será o da figura 2.
Um problema que certamente
todos ouvimos na infância é o de tentar desenhar estes grafos com um só traço,
sem levantar a caneta do papel, e percorrendo uma só vez cada aresta. No segundo
caso isso é possível, no primeiro impossível. A razão entende-se facilmente.
Para percorrer uma só vez cada aresta só há duas hipóteses: ou todos os
vértices têm ordem par (tem de ser possível chegar e voltar a partir do mesmo
vértice), ou todos os vértices menos dois (o ponto de partida e de chagada, se
forem diferentes) têm ordem par. Ora no segundo caso há dois vértices com ordem
3, dois com ordem 4 e um com ordem 2. O percurso é possível, desde que comece e
termine nos vértices de ordem ímpar. Já no primeiro caso todos os quatro
vértices têm ordem 3 e, portanto, o problema é impossível. Este é um problema
que, embora de solução elementar, mostra qual o tipo de questões que se podem
colocar em teoria de grafos.
De forma análoga, podemos
construir o grafo da «colaboração matemática», em que a relação entre vértices
(os matemáticos) é ter publicado um artigo em co-autoria, ou o grafo «de
Bacon», em que a relação entre vértices (os actores) é terem contracenado num
filme, etc. A análise de grafos é precisamente o elemento matemático de base
considerado por Watts e Strogatz.
Por aqui começa logo a
ver-se que o problema dos «seis graus de separação» não é trivial. Pensemos no
grafo das relações de conhecimento entre pessoas. Uma abordagem ingénua poderia
colocar a questão da seguinte forma: cada pessoa no mundo conhece, digamos, cem
outras. Assim, ao fim de seis iterações, o número de conhecimentos cresceu
exponencialmente para 1012, o que é mais de cem vezes superior à população
mundial. Não é, pois, de espantar que existam apenas seis graus de separação!
A falácia, evidentemente,
está em que as relações de amizade não são independentes. É impossível que
todos os amigos de um amigo meu me sejam desconhecidos! Matematicamente, o
«grafo das relações sociais» não tem uma estrutura em árvore: pelo contrário,
as arestas entrecruzam-se e sobrepõem-se. É um grafo extremamente complicado,
cuja estrutura exacta é impossível de determinar (e, além disso, varia com o
tempo). Assim, quaisquer resultados matemáticos sobre este problema têm de ser
resultados sobre classes de grafos.
A abordagem de Watts e
Strogatz foi a seguinte. Consideremos um conjunto com n elementos em que
cada elemento se relaciona com k outros elementos. Que tipos de grafos
podem surgir? Num extremo estão os grafos regulares, de tipo cristalino: cada
elemento relaciona-se apenas com os k vizinhos mais próximos. Do ponto
de vista social isto representa um extremo absolutamente paroquiano: cada
pessoa conhece apenas as que vivem nas casas mais próximas — e mais ninguém.
Chamemos a este o mundo paroquiano. No outro extremo, surge um grafo
totalmente aleatório: as k ligações de cada vértice distribuem-se de
forma totalmente aleatória por entre os outros n - 1 vértices possíveis. Do ponto de vista
social, corresponde a dois amigos de uma mesma pessoa terem uma probabilidade
mínima de se conhecerem — nomeadamente, essa probabilidade é
independente de terem um amigo comum. Se n for suficientemente grande,
numa festa nenhum convidado conhece mais ninguém para lá do anfitrião. Chamemos
a este o mundo estilhaçado.
Watts e Strogatz definem
duas grandezas básicas com as quais vão caracterizar o fenómeno dos pequenos
mundos. A primeira é o comprimento característico, que corresponde à média,
tomada sobre todos os pares de vértices, do comprimento do percurso de um
vértice a outro. O comprimento característico é, portanto, uma medida
estatística do «grau de separação» entre vértices. A segunda grandeza é o «coeficiente de
agregação»: a média sobre todos os vértices da fracção de vértices que, estando
relacionados com um vértice comum, estão relacionados entre si. Este
coeficiente mede a probabilidade de amigos de uma mesma pessoa serem amigos
entre si — ou, mais geralmente, a tendência para a formação de
«cliques» ou subsociedades.
Neste sentido, o mundo
paroquiano e o mundo estilhaçado são extremos. Para o mundo paroquiano, o
coeficiente de agregação é muito grande mas o comprimento característico
também: para se chegar ao extremo oposto da cidade é preciso bater de porta em
porta. Para o mundo estilhaçado, o comprimento característico é pequeno mas o
coeficiente de agregação é mínimo, ao nível do acaso. Podemos chegar a qualquer
pessoa rapidamente mas seremos provavelmente forçados a percorrer a cidade
várias vezes no processo.
Um modelo realista de
sociedade é evidentemente intermédio entre o paroquiano e o estilhaçado. A
estratégia de Watts e Strogatz foi a seguinte. Partindo de um grafo paroquiano,
permitem que, com probabilidade p, cada aresta de cada vértice se
desfaça e reconstitua ligando o vértice original a outro escolhido ao acaso. Ou
seja, cada ligação é refeita ao acaso com probabilidade p. Para p = 0,
obtém-se o mundo paroquiano; para p = 1 o mundo
estilhaçado. Para p entre 0 e 1 obtêm-se modelos que se esperam
realistas para o nosso mundo.
As conclusões são
absolutamente surpreendentes — quase chocantes. O comprimento
característico e o coeficiente de agregação dependem de p de formas
radicalmente opostas. Enquanto o comprimento característico sofre uma
queda quase na vertical em função de p, o coeficiente de agregação
mantém-se praticamente constante e igual a 1 até se atingirem valores relativamente
elevados de p. Ou seja: basta um pequeníssimo elemento aleatório
(exemplo, p = 10-5)
nas relações para que o grafo correspondente represente um mundo em que
simultaneamente haja um grande grau de coesão social (amigos dos nossos amigos
conhecem-se entre si) mas em que simultaneamente «o mundo seja pequeno». Mais
ainda: esta situação é robusta, persistindo por mais de quatro ordens de
grandeza em p, e englobando todo o intervalo de valores «realista» para p.
Watts e Strogatz chamam a
este fenómeno o estabelecimento de um «pequeno mundo». Veja-se a figura 3.
Este tipo de resultados
tem implicações extraordinárias.
O facto de um mundo ser pequeno não é determinável a partir de
características locais (coeficiente de agregação). Isto é, uma pessoa não pode
saber se vive ou não num mundo pequeno analisando apenas o que se passa à sua volta.
Um mundo pode ser pequeno mesmo quando existem cliques indistinguíveis
localmente das de um mundo «grande»!
Por outro lado, o facto de
bastar em média apenas uma ligação aleatória em, digamos, 104
para transformar um mundo paroquiano em pequeno significa que é necessário um
número muito pequeno de «atalhos» para realizar esta transição. Basta um pequeno
conjunto de viajantes regulares para transformar um conjunto de paróquias num
mundo pequeno. Por exemplo, Watts e Strogatz constroem um modelo simples de
propagação de doenças contagiosas que dá origem a um pequeno mundo: basta um
número pequeno de atalhos para a propagação ser epidémica.
Um fenómeno semelhante a
este pode ter ocorrido em 1347--1348, aquando da propagação pandémica da peste
negra à escala global — da Ásia à Europa Ocidental em dois anos, num
mundo em que a comunicação física era muito difícil. De facto, a introdu-ção da peste na Europa foi feita por uma única
pequena frota geno-vesa proveniente do porto asiático de Kaffa em 1348.
À medida que ia sendo expulsa dos vários portos a que aportava, espalhava a
peste. Bastou um pequeno número de viajantes para transformar um mundo de
comunidades medievais isoladas num pequeno mundo, com consequências
devastadoras: desapareceu entre um terço e metade da população europeia em dois
anos. Este facto não pode deixar de nos preocupar, numa altura em que o mundo é
mais pequeno do que nunca e o risco de terrorismo por meio de armas biológicas
não é uma hipótese académica.
Outro exemplo interessante
é o da conectividade da World Wide Web. Estudos recentes de L. Barabasi, em que
são aplicados métodos da Física Estatística, mostram que o mundo virtual de
centenas de milhão de páginas Web com links de umas para as outras é um
pequeno mundo. O grau de separação entre quaisquer duas páginas Web é apenas de
19. Isto é, partindo de uma qualquer página Web podemos, em média, atingir
qualquer outra no máximo com 19 clicks. Este é um bom exemplo de uma
rede em evolução: estão permanentemente a ser adicionadas à Web novas páginas
(vértices do grafo correspondente) e links (arestas do grafo). É
interessante ainda notar que a popularidade do motor de busca Google é devida a
tirar partido de a Web ser um pequeno mundo, visto que ele classifica os
documentos de acordo com a posição topológica que ocupam no grafo de ligações
da Web.
Outro exemplo ainda é o da
evolução da linguagem. A rede das palavras utilizadas na linguagem comum pode
ser pensada como um gigantesco grafo (que evolui com o tempo, visto que a linguagem é dinâmica) em que palavras
relacionadas estão ligadas por vértices. O físico José Fernando Mendes, da
Universidade de Aveiro,
provavelmente o grande especialista português em pequenos mundos e
investigador activo nesta área, mostrou recentemente num artigo nos Proceedings
of the Royal Society que a rede de palavras na linguagem é
quantitativamente um dos melhores exemplos de pequenos mundos. José Fernando
Mendes publicou em 2003, em co-autoria, o livro Evolution of
networks — from biological nets to the Internet and WWW na Oxford
University Press. O leitor mais interessado é convidado a consultar a página
Web de José Fernando Mendes em http://sweet.ua.pt/~f2064/.
Todos estes exemplos
revelam que as consequências científicas e tecnológicas do trabalho iniciado
por Watts e Strogatz são difíceis de imaginar, embora haja ainda muita
matemática por fazer. Mas, como se vê, o espectro de potenciais aplicações é
quase infindável. Essencialmente, todas as aplicações que dependem de redes
interligadas podem beneficiar destes resultados. Alguns dos exemplos possíveis
são redes de transmissão eléctrica, telecomunicações, a Internet, modelos de
propagação de doenças infecciosas ou de vírus de computador, o processamento
de informação pelo cérebro humano, ou mesmo os fenómenos cooperativos da Física
da Matéria Condensada.
Retrospectivamente, é
espantosa a quantidade de problemas científicos sérios que podem beneficiar da
investigação sobre o fenómeno dos «pequenos mundos». Ainda na sua infância,
talvez ele se venha metaforicamente a revelar um «atalho» no grafo dos
problemas científicos e contribua para transformar o mundo da ciência num...
pequeno mundo, com poucos graus de separação.