Pesquisar neste blogue

terça-feira, 4 de junho de 2024

Cartilha de Filogenética

Introdução à filogenia

  • Figura 1: Uma filogenia universal de consenso
  • Árvores filogenéticas
  • Cladística e reconstrução filogenética
    • Parcimónia máxima
    • Probabilidade máxima
    • Métodos de matriz de distância
  • Suporte estatístico para filogenias
  • A inferência filogenética encontra árvores corretas?
  • Advertências com a determinação de árvores filogenéticas

Introdução à Filogenética

A descendência de um ancestral comum acarreta um processo de ramificação e divergência, comum a qualquer processo genealógico. As genealogias podem ser ilustradas graficamente por diagramas em forma de árvore, e é por isso que os biólogos frequentemente se referem à genealogia das espécies como a “árvore da vida”. Na teoria evolutiva, diagramas como esses são conhecidos como árvores filogenéticas ou filogenias. Uma das previsões mais importantes, poderosas e básicas da hipótese de descendência comum universal é a existência de uma árvore filogenética única, histórica e universal para espécies que se reproduzem principalmente através de mecanismos genéticos verticais (outro tipo de herança, transferência horizontal de genes, pode complicar as filogenias e até mesmo o conceito de espécie, veja Advertências abaixo). Uma compreensão completa da filogenética é necessária para compreender as deduções macroevolutivas. Chamarei o modelo de consenso que os biólogos evolucionistas usam para representar os ramos bem sustentados da árvore da vida universal como a “árvore filogenética padrão”. A Figura 1 mostra um exemplo simplificado de alguns dos ramos mais familiares da árvore filogenética universal.

Na seção seguinte há uma breve visão geral das árvores filogenéticas e de como os biólogos as determinam. Esta visão geral torna-se cada vez mais técnica à medida que avança. O material até o título de máxima parcimónia é essencial para a compreensão do restante deste FAQ. A discussão filogenética restante é apresentada para ser completa e para permitir ao leitor interessado a oportunidade de se aprofundar tanto quanto desejar.

Árvore filogenética

Figura 1. A árvore filogenética de consenso de toda a vida.

Árvores filogenéticas representam relações evolutivas

Árvore filogenética, pormenor

Figura 2: As partes de uma árvore filogenética. Os táxons nesta árvore são "humanos", "ratos" e "moscas" (todos com seus genomas completos sequenciados). Vários nós são indicados, como o nó do táxon "mosca" e um nó interno que representa o ancestral comum de ratos e humanos. A raiz é indicada à esquerda, representando o ancestral comum de todos os três táxons listados. [Árvores para fins ilustrativo

Filogenética é a disciplina científica preocupada em descrever e reconstruir os padrões de relações genéticas entre espécies e entre táxons mais elevados. As árvores filogenéticas são uma forma conveniente de representar visualmente a história evolutiva da vida. Esses diagramas ilustram as relações inferidas entre os organismos e a ordem dos eventos de especiação que levaram dos ancestrais comuns anteriores aos seus descendentes diversificados.

Uma árvore filogenética possui várias partes, mostradas na Figura 2. Os nós representam unidades taxonômicas, como um organismo, uma espécie, uma população, um ancestral comum ou mesmo um gênero inteiro ou outro grupo taxonômico superior. Os ramos conectam os nós de maneira única e representam relações genéticas. O padrão específico de ramificação determina a topologia da árvore. As árvores escalonadas têm comprimentos de galhos que são proporcionais a algumas propriedades biológicas importantes, como o número de alterações de aminoácidos entre nós em uma filogenia de proteínas (ver Figura 3). As árvores também podem estar enraizadas ou não. As árvores enraizadas possuem um nó especial, conhecido como raiz, que representa um ancestral comum de todos os táxons mostrados na árvore. As árvores enraizadas são, portanto, direcionais, uma vez que todos os táxons evoluíram a partir da raiz. As árvores não enraizadas ilustram apenas relacionamentos, sem referência a ancestrais comuns.

Árvore filogenética, pormenor

Figura 3: Várias representações de uma árvore filogenética de 5 táxons. Cada uma dessas árvores representa os mesmos cinco táxons modernos: A, B, C, D e E. A árvore no canto superior esquerdo tem raízes e escala de acordo com a distância evolutiva. A raiz está à esquerda. Os táxons C e E sofreram mudanças relativamente grandes desde a divergência da raiz, em contraste com os táxons B e D. A árvore no canto inferior esquerdo está enraizada e sem escala. Aqui, os comprimentos dos ramos são indicadores relativos do tempo desde a divergência. A árvore à direita tem escalas, mas não tem raízes. Nesta árvore, embora a raiz seja desconhecida, as relações entre os táxons são idênticas às mostradas nas outras duas árvores. [Árvores para fins ilustrativos]

Um equívoco comum é que algumas espécies modernas são ancestrais de outras espécies modernas. No entanto, todas as espécies modernas são encontradas nas pontas dos galhos das árvores, e uma espécie moderna é tão “evoluída” quanto qualquer outra. Isto é, embora se pense que os mamíferos evoluíram de algo que se assemelha aos répteis modernos, os répteis modernos são evolutivamente tão "velhos" quanto os mamíferos modernos (Brooks 1991, p.68; Futuyma 1998, p.113).

Métodos para determinação de árvores filogenéticas: Cladística e filogenética numérica

"Podereis comer qualquer ave pura.

Mas estas não podereis comer: a águia, o urubu, a águia-marinha, o milhafre, qualquer espécie de falcão, qualquer espécie de corvo, a coruja-de-chifre, a coruja-de-orelha-pequena, a coruja-orelhuda, qualquer espécie de gavião, o mocho, o corujão, a coruja-branca, a coruja-do-deserto, o abutre, a coruja-pescadora, a cegonha, qualquer tipo de garça, a poupa e o morcego

.

Deuteronómio 14:11-18

Se as espécies modernas descendem das espécies ancestrais desta forma semelhante a uma árvore e ramificada, deveria ser possível inferir a verdadeira árvore histórica que traça os seus caminhos de descendência. As filogenias têm sido inferidas por biólogos desde que Darwin propôs pela primeira vez que a vida estava unida por uma descendência comum, há mais de 140 anos. Metodologias algorítmicas rigorosas para inferir árvores filogenéticas têm sido usadas nos últimos 50 anos.

Em 1950, o taxonomista Willi Hennig propôs um método para determinar árvores filogenéticas com base na morfologia, classificando os organismos de acordo com seus caracteres derivados compartilhados, que são chamados de sinapomorfias (Hennig 1966). Este método, agora chamado cladística, não assume parentesco genealógico a priori, uma vez que pode ser usado para classificar qualquer coisa em princípio, até mesmo coisas como livros, carros ou cadeiras que obviamente não estão genealogicamente relacionadas num sentido biológico (Kitching et al. 1998, cap. 1, pág. Usando argumentos evolutivos firmes, no entanto, Hennig justificou este método como a técnica de classificação mais apropriada para estimar as relações evolutivas geradas pela descendência linear. Na verdade, o método cladístico de Hennig nada mais é do que uma formalização dos métodos que os biólogos sistemáticos vinham usando intuitivamente desde que Linnaeus escreveu o Systema Naturae. Os biólogos hoje constroem suas árvores filogenéticas com base no método de Hennig e, por causa da cladística, essas árvores filogenéticas são reproduzíveis e testáveis ​​de forma independente (Brooks 1991, cap. 2; Kitching et al. 1998).

Jargão Filogenético

apomorfia: Um caráter derivado de um grupo de organismos, não compartilhado com os ancestrais de um grupo de organismos. As apomorfias são exclusivas do grupo e, portanto, definem o grupo.

bootstrap: Um procedimento técnico estatístico para estimar a variabilidade de uma medição. Na filogenética, o bootstrapping (atar com os cordões dos sapatos) envolve a produção de um novo pseudoconjunto de dados, extraindo aleatoriamente pontos de dados do conjunto de dados original. Para cada pseudoconjunto de dados, uma nova filogenia é inferida. Rodadas disso fornecem uma estimativa das regiões bem e mal suportadas da filogenia original.

caráter: Uma característica observável de um organismo útil para distingui-lo de outro. Por exemplo, um nucleotídeo em uma sequência de DNA, um aminoácido em uma sequência de proteína ou caracteres morfológicos como cabelos, penas ou a presença ou ausência de certos ossos.

cladística: Uma classe de técnicas filogenéticas que constroem árvores (cladogramas) agrupando táxons em hierarquias aninhadas de acordo com caracteres derivados compartilhados (sinapomorfias). A cladística está intimamente associada ao critério de parcimónia.

cladograma: Uma classificação hierárquica de táxons representados como uma árvore. Os cladogramas são formalmente independentes da teoria evolutiva, embora na prática sejam geralmente interpretados como filogenias.

caracter derivado: Veja apomorfia.

mínimos quadrados: um critério de matriz de distância filogenética. A melhor árvore é aquela com a menor diferença quadrada entre as distâncias observadas aos pares e as distâncias calculadas a partir da árvore inferida. Tem uma forte justificação estatística, uma vez que se baseia na técnica estatística comum de mínimos quadrados lineares. O teorema de Gauss-Markov garante que os mínimos quadrados converjam para a resposta correta à medida que mais dados são incluídos na análise se uma métrica de distância adequada for usada, ou seja, mínimos quadrados é estatisticamente consistente. As versões ponderadas corrigem a variabilidade aleatória e o viés devido a comprimentos de ramificação mais longos.

máxima verossimilhança: Um critério cladístico para inferir árvores com conflito de caráter. A melhor árvore e modelo evolutivo maximizam a probabilidade dos dados observados. A máxima verossimilhança tem uma base estatística sólida. Dado um modelo correto de mudança evolutiva, é garantido que ele seja estatisticamente consistente, ou seja, ele convergirá para a árvore correta à medida que mais dados forem adicionados. A máxima verossimilhança geralmente apresenta o melhor desempenho de todos os métodos em simulações, mas é muito cara do ponto de vista computacional. Ao contrário da parcimónia, depende explicitamente de um modelo evolutivo específico.

evolução mínima: um critério de matriz de distância filogenética. A melhor árvore é aquela em que a soma dos comprimentos dos galhos é menor.

junção de vizinhos: Um algoritmo de matriz de distância para inferir árvores. É uma aproximação aos métodos dos mínimos quadrados e da evolução mínima.

nó: Um ponto em uma filogenia onde os ramos se encontram ou terminam. Os nós na ponta ou no final de um ramo representam táxons. Nas árvores enraizadas, os nós internos representam ancestrais comuns.

parcimónia: Um critério filogenético para inferir árvores com conflito de caráter. A parcimónia exige que a melhor árvore seja aquela com menos conflito de caracteres. Sabe-se que produz filogenia incorreta em certos casos, como quando as taxas evolutivas são altas ou certos ramos são longos.

fenética: Às vezes conhecida como taxonomia numérica, os métodos fenéticos classificam e agrupam organismos com base na semelhança geral, geralmente sem referência explícita às suas relações filogenéticas.

filogenia: Um diagrama ramificado em forma de árvore que representa as relações genealógicas entre os táxons. Filogenias enraizadas especificam ancestrais comuns e têm um eixo temporal.

plesiomorfia: Caráter primitivo, compartilhado com os ancestrais de um grupo de organismos. Uma vez que é comum a mais do que apenas o grupo que está sendo considerado, uma plesiomorfia não define o grupo.

caráter primitivo: Veja plesiomorfia.

raiz: Um ancestral comum de todos os táxons em uma filogenia. Cronologicamente, a raiz é o nó mais antigo.

sinapomorfia: Um caráter derivado que é compartilhado entre dois grupos de organismos.

UPGMA: Um método de agrupamento baseado em matriz de distância para construção de árvores. Raramente utilizado, é muito rápido, mas assume taxas evolutivas constantes em toda a árvore (uma propriedade chamada ultrametricidade).

Os métodos cladísticos são frequentemente contrastados com os métodos "fenéticos". Os métodos fenéticos agrupam e classificam as espécies com base no número de caracteres idênticos que compartilham, ou seja, com base na semelhança geral. Esses métodos podem causar problemas com organismos como golfinhos e atuns, que têm muitas semelhanças superficiais. Estes organismos, no entanto, não estão intimamente relacionados e não devem ser classificados em conjunto se se espera que a classificação reflita a filogenia.

Em contraste, as filogenias baseadas em cladísticas agrupam táxons em hierarquias aninhadas e são determinadas usando apenas caracteres derivados compartilhados de organismos, e não caracteres primitivos compartilhados (Brooks 1991, pp. 35-36; Kitching et al. 1998, cap. 1; Maddison e Maddison 1992, p. No jargão técnico filogenético, os caracteres primitivos são chamados de plesiomorfias e os caracteres derivados são chamados de apomorfias. Na cladística, as espécies relacionadas são agrupadas porque compartilham caracteres derivados (ou seja, apomorfias) que se originaram em um ancestral comum do grupo, mas não estavam presentes em outros ancestrais anteriores do grupo. Esses recursos derivados e compartilhados são chamados de sinapomorfias. Primitivo e derivado são, portanto, termos relativos, dependendo do grupo específico que está sendo considerado. Por exemplo, a espinha dorsal é um caráter primitivo dos vertebrados, enquanto o cabelo é um caráter derivado específico dos vertebrados mamíferos. No entanto, quando se considera apenas os mamíferos, o cabelo é primitivo, enquanto um polegar opositor é derivado.

Em análises filogenéticas da vida real, caracteres derivados compartilhados podem estar em conflito com outros caracteres derivados. Métodos objetivos são necessários para resolver esse conflito de caráter (Kitching et al. 1998, cap. 1; Maddison e Maddison 1992, p. 49). Por exemplo, as asas são um caráter derivado de pássaros e morcegos. Com base apenas neste personagem, o método cladístico agruparia morcegos e pássaros, que é como o autor do Deuteronômio os agrupou na citação bíblica acima. No entanto, outros caracteres derivados compartilhados indicam que os morcegos deveriam ser agrupados com mamíferos sem asas, e que as aves deveriam ser agrupadas com dinossauros sem asas.

Nos últimos 40 anos, vários métodos algorítmicos foram concebidos para resolver tais casos de conflito de caracteres e para inferir árvores filogenéticas corretas (Felsenstein 2004, cap. 10). As seções a seguir descrevem alguns dos métodos mais bem-sucedidos. Cada método tenta inferir uma filogenia a partir de dados existentes e cada um tem seus respectivos pontos fortes e fracos. Anos de testes empíricos e simulação mostraram que, em geral, esses diferentes algoritmos, cada um com suposições subjacentes muito diferentes, convergem em árvores que são altamente semelhantes quando julgadas estatisticamente (Li 1997, Capítulos 5 e 6; Nei e Kumar 2000, Capítulo 6 , 7 e 8).

Parcimónia máxima

Um dos métodos mais antigos, básicos e usados ​​com mais frequência para resolução de caracteres é o critério de máxima parcimónia (MP) (Edwards e Cavalli-Sforza 1963; Kitching et al. 1998). O critério de parcimónia determina que a melhor árvore que descreve os dados seja aquela que minimiza a quantidade de conflito de caracteres. Por exemplo, considere um conjunto de dados contendo 10 caracteres derivados compartilhados que agrupam morcegos com macacos (em vez de pássaros) e com um caractere que agrupa morcegos com pássaros (em vez de macacos). De acordo com o critério de parcimónia, a árvore que dá o primeiro agrupamento deve ser preferida.

Atualmente, a parcimónia é o método preferido para reconstruir árvores morfológicas (Kitching et al. 1998). É muito rápido computacionalmente e pode ser robusto às diferenças na taxa evolutiva entre os personagens. No entanto, a parcimónia máxima consistentemente encontra a filogenia correta apenas quando esperamos que o conflito de caráter seja baixo ou que a evolução prossiga parcimoniosamente (Felsenstein 2004, cap. 9; Kitching et al. 1998, p. 17). Se as taxas de evolução forem lentas e os ramos curtos, o conflito de carácter será baixo e a parcimónia funcionará bem (Felsenstein 2004, cap. 9; Felsenstein 1981a; Li 1997, p. 128). Se o conflito de caráter for moderado ou alto na realidade, então é muito improvável que a árvore verdadeira tenha a menor quantidade de conflito de caráter. Quando as taxas de evolução são altas, ou quando alguns ramos são muito longos, ou quando o número de possíveis estados de caráter é limitado, o conflito de caráter pode ser comum. Isso geralmente é verdade para sequências de nucleotídeos, que possuem apenas quatro estados de caracteres possíveis (A, C, T ou G). Em casos como estes, outros métodos filogenéticos podem ser mais precisos do que a parcimónia.

Probabilidade máxima

Outro critério filogenético comumente usado é a máxima verossimilhança (MV), uma técnica estatística eficaz e robusta agora usada em todos os campos científicos (Edwards e Cavalli-Sforza 1964; Felsenstein 1981b; Fisher 1912). Muitos estimadores estatísticos bem conhecidos são, na verdade, estimadores de máxima verossimilhança. Por exemplo, a média da amostra comum como uma estimativa da média de uma distribuição gaussiana e o ajuste de mínimos quadrados de uma linha a um conjunto de pontos são ambos estimadores de máxima verossimilhança. Usando MV, pode-se inferir taxas de evolução diretamente dos dados e determinar a árvore que melhor descreve esses dados, dadas essas taxas inferidas. Em outras palavras, o MV encontra a árvore e os parâmetros evolutivos que produzem os dados observados com maior probabilidade. Ao contrário da parcimónia, o MV encontra árvores com a quantidade esperada de conflito de caracteres, dadas as taxas evolutivas inferidas dos dados, mesmo que essas taxas sejam altas. MV é um método computacionalmente intensivo que pode consumir muito tempo.

Métodos de distância

Devido à sua velocidade computacional, os métodos de matriz de distância são alguns dos mais populares para inferir filogenias (Nei e Kumar 2000, cap. 6). Todos os métodos de distância transformam os dados dos caracteres em uma matriz de distâncias aos pares, uma distância para cada emparelhamento possível dos táxons em estudo. Os métodos de matriz de distância não são cladísticos, pois as informações sobre caracteres derivados e primitivos foram perdidas durante esta transformação. Os métodos de distância abordam a inferência filogenética estritamente como um problema estatístico e são usados ​​quase exclusivamente com dados moleculares. Embora não sejam cladísticos, os métodos de distância podem ser considerados aproximações aos métodos cladísticos, e vários dos métodos têm garantia matematicamente de convergir para a árvore correta à medida que mais dados são incluídos.

A métrica de distância mais simples é simplesmente o número de diferenças de caracteres entre dois táxons, como o número de diferenças de nucleotídeos entre duas sequências de DNA. Existem muitas outras maneiras de calcular distâncias de sequências moleculares, e a maioria tenta corrigir a possibilidade de múltiplas alterações em um único local durante a evolução. Os métodos para calcular distâncias entre sequências são geralmente nomeados de acordo com seus criadores, como dois parâmetros de Kimura (K2P), Jukes-Cantor (JC), Tamura-Nei (TN), Hasegawa, Kishino e Yano (HKY) e Felsenstein 1984 (F84). Outras métricas de distância importantes são General Time Reversible (GTR) e LogDet (Felsenstein 2004, pp. Capítulos 11 e 13; Nei e Kumar 2000, Capítulos 2 e 3; Li 1997, Capítulos 3 e 4).

Uma vez em mãos uma matriz de distância para os táxons considerados, existem vários critérios e algoritmos baseados em distância que podem ser usados ​​para estimar a árvore filogenética a partir dos dados (Felsenstein 2004, cap. 11; Li 1997, cap. 5). O critério de evolução mínima (ME) encontra a árvore em que a soma de todos os comprimentos dos ramos é menor. Os critérios de mínimos quadrados ponderados e não ponderados calculam a discrepância entre as distâncias aos pares observadas e as distâncias aos pares calculadas a partir dos comprimentos dos ramos da árvore inferida. Os mínimos quadrados encontram então a árvore que minimiza o quadrado dessa discrepância. Os métodos dos mínimos quadrados são alguns dos mais justificados estatisticamente e convergirão para a árvore correta à medida que mais dados forem incluídos na análise (dada uma métrica de distância matematicamente adequada). O algoritmo de junção de vizinhos (NJ) é extremamente rápido e é uma aproximação dos métodos de mínimos quadrados e evolução mínima. Se a matriz de distância for uma descrição exata da árvore verdadeira, então a junção de vizinhos garante a reconstrução da árvore correta. O algoritmo de agrupamento UPGMA (um acrônimo confuso) também é extremamente rápido, mas baseia-se na improvável suposição de que as taxas evolutivas são iguais em todas as linhagens. UPGMA raramente é usado hoje, exceto como ferramenta instrucional.

Suporte Estatístico para Filogenias

Uma filogenia é a melhor aproximação da árvore histórica correta usando um determinado método filogenético. Algumas análises filogenéticas são fortemente apoiadas pelos dados, algumas são fracamente apoiadas e diferentes partes de uma árvore podem ter mais apoio do que outras. Ao comparar duas filogenias determinadas independentemente, deve-se levar em conta o suporte estatístico atribuído a cada ramo das filogenias. Tal como acontece com todas as análises científicas, os detalhes de uma árvore filogenética podem mudar à medida que novas informações e dados são incorporados (Maddison e Maddison 1992, pp. 112-123; Li 1997, pp. 36-146; Felsenstein 1985; Futuyma 1998, p. 99; Hillis e Bull 1993; Huelsenbeck et al. 2001; Swofford et al. 1996, pp. 504-509).

Bootstrapping é o método estatístico mais popular para avaliar a confiabilidade dos ramos em uma árvore filogenética (Felsenstein 1985). Bootstrapping é uma técnica estatística para estimar empiricamente a variabilidade de um parâmetro (Efron 1979; Efron e Gong 1983). Em uma análise de bootstrap, um conjunto de dados fictício é criado por meio de amostragem aleatória de dados do conjunto de dados real até que um novo conjunto de dados do mesmo tamanho seja criado. Este processo é feito repetidamente (centenas ou milhares de vezes), e o parâmetro de interesse é estimado a partir de cada conjunto de dados fictício. A variabilidade destas estimativas bootstrap é em si uma estimativa da variabilidade do parâmetro de interesse.

Na filogenética, uma nova filogenia é inferida a partir de cada conjunto de dados inicializado (Felsenstein 1985). Essas filogenias inicializadas provavelmente terão topologias diferentes. A partir dessas diferentes árvores bootstrap, a variabilidade na árvore inferida pode ser estimada. As partes das árvores bootstrap que são comuns recebem uma confiança alta, enquanto as partes que variam extensivamente recebem uma confiança baixa. Árvores construídas a partir de dados aleatórios não resultam em árvores ou galhos de alta confiança quando inicializadas. Assim, o bootstrapping fornece uma maneira de testar se uma árvore filogenética é genuína.

A inferência filogenética encontra árvores corretas?

A fim de estabelecer sua validade na determinação confiável de filogenias, os métodos filogenéticos foram testados empiricamente nos casos em que a verdadeira filogenia é conhecida com certeza, uma vez que a verdadeira filogenia foi observada diretamente.

  • O bacteriófago T7 foi propagado e dividido sequencialmente na presença de um mutagênico, onde cada linhagem foi rastreada. Das 135.135 árvores filogenéticas possíveis, a árvore verdadeira foi determinada corretamente por métodos filogenéticos em uma análise cega. Cinco métodos filogenéticos diferentes foram utilizados de forma independente, e cada um escolheu a árvore correta (Hillis et al.1992).
  • Em outro estudo, foram utilizadas 24 linhagens de ratos nas quais as relações genealógicas eram conhecidas. A análise cladística reproduziu quase perfeitamente a filogenia conhecida das 24 cepas (Atchely e Fitch 1991).
  • Bush e outros. usaram a análise filogenética para prever retrospectivamente a árvore evolutiva correta do vírus Influenza A humano 83% das vezes para as temporadas de gripe que vão de 1983 a 1994.
  • Em 1998, os investigadores utilizaram 111 sequências modernas do VIH-1 (vírus da SIDA) numa análise filogenética para prever a sequência de nucleótidos do antepassado viral do qual todos eram descendentes. A sequência ancestral prevista correspondia estreitamente, com elevada probabilidade estatística, a uma sequência ancestral real do VIH encontrada numa amostra de plasma africano seropositivo para o VIH-1 recolhida e arquivada no Congo Belga em 1959 (Zhu et al.1998).
  • Na última década, as análises filogenéticas desempenharam um papel significativo nas condenações bem-sucedidas em vários processos judiciais criminais (Albert et al. 1994; Arnold et al. 1995; Birch et al. 2000; Blanchard et al. 1998; Goujon et al. 2000; Holmes et al. 1993; Ou et al. 1995; Veenstra et al. 1995; Vogel 1997; Yirrell et al. 1997) e as reconstruções filogenéticas foram agora admitidas como testemunho legal de peritos nos Estados Unidos (97-KK- 2220 State of Louisiana v. Richard J. Schmidt [PDF]). O teste legal nos EUA para a admissibilidade de testemunhos de peritos são as directrizes Daubert (Caso Daubert v. Merrell Dow Pharmaceuticals, Inc., 509 U.S. 579, 587-89, 113 S. Ct. 2786, 2794, 125 L. Ed. 2d 469, 1993). As directrizes Daubert estipulam que um tribunal deve considerar cinco factores para determinar “se o raciocínio ou a metodologia subjacentes ao testemunho são cientificamente válidos”: (1) se a teoria ou técnica em questão pode ser e foi testada; (2) se foi sujeita a revisão e publicação por pares; (3) a sua taxa de erro conhecida ou potencial; (4) a existência e manutenção de normas que controlam o seu funcionamento; e (5) se atraiu aceitação generalizada na comunidade científica relevante (citado quase literalmente). A análise filogenética cumpriu oficialmente estes requisitos legais.

Advertências com inferência filogenética

Tal como acontece com qualquer método científico de investigação, certas condições devem ser mantidas para que os resultados sejam confiáveis. Uma premissa comum de muitos métodos filogenéticos moleculares é que os genes são transmitidos por herança linear vertical, ou seja, de pai para filho. Se esta premissa for violada, as árvores genéticas não recapitularão uma filogenia organísmica ou de espécie. Esta suposição é violada em casos de transferência horizontal, por ex. na transformação de uma bactéria por um plasmídeo de DNA ou na inserção retroviral no genoma de um hospedeiro. Durante a evolução inicial da vida, antes do advento dos multiorganismos celulares, a transferência horizontal era provavelmente muito frequente (como é hoje na evolução observada de bactérias e outros organismos unicelulares). Assim, é questionável se os métodos filogenéticos moleculares são aplicáveis, mesmo em princípio, para resolver os padrões evolutivos de muitos micróbios, incluindo a evolução inicial perto do ancestral comum mais recente de todos os organismos vivos (Doolittle 1999; Doolittle 2000; Woese 1998).

A lista abaixo apresenta algumas das advertências mais importantes que os cientistas devem ter em mente ao interpretar os resultados de uma análise filogenética (Swofford 1996, pp. 493-509). Em geral, a contribuição de cada uma dessas preocupações será “calculada” pela inclusão de caracteres mais independentes na análise filogenética, como mais genes e sequências mais longas.

  • Caracteres correlacionados: cada caractere usado na análise deve ser geneticamente independente. Personagens que são fortemente correlacionados funcionalmente são melhor considerados como um único personagem. Existem testes estatísticos que podem ajudar a controlar a correlação de caracteres não reconhecidos, como o bloco bootstrap e o jackknife.
  • Verdadeira convergência estrutural: estruturas que passaram por evolução convergente podem resultar artificialmente em topologias de árvore incorretas. Incluir mais caracteres na análise também auxilia na superação dos efeitos convergentes.
  • Reversões de personagens: personagens que revertem para um estado ancestral representam um desafio semelhante à convergência. Como o DNA e o RNA possuem apenas quatro estados de caráter diferentes, eles são especialmente propensos a reversões durante a evolução.
  • Personagens perdidos: linhagens que perderam caracteres (como baleias e seus membros posteriores) também podem representar problemas cladísticos. Muitas vezes, se uma análise cladística indica fortemente que um determinado carácter foi perdido durante a evolução, é melhor omitir este carácter em análises de maior resolução dessa linhagem.
  • Caracteres ausentes: fósseis incompletos são problemáticos, pois podem carecer de caracteres importantes. Fósseis melhores são a resposta.
  • Número intratável de árvores filogenéticas possíveis: por razões computacionais, este é um dos desafios filogenéticos mais importantes a superar. O objetivo de uma reconstrução filogenética é determinar a melhor árvore que os dados suportam. Para uma análise de apenas cinco espécies, existem 15 árvores possíveis. Para uma análise de 50 espécies, existem mais de 1.074 árvores possíveis que devem ser pesquisadas – o que é computacionalmente impossível. Este problema não é tão ruim quanto parece à primeira vista, uma vez que reduzir o número de árvores razoáveis ​​pode ser trivial em muitos casos (por exemplo, usando o algoritmo branch andbound). Vários métodos foram desenvolvidos para solucionar esse problema com êxito e, em última análise, computadores mais potentes são melhores.
  • Suposições de máxima verossimilhança: o método de máxima verossimilhança faz suposições explícitas sobre o padrão de substituições de nucleotídeos com base em um determinado modelo de evolução de nucleotídeos. Estas suposições baseiam-se numa base estatística sólida; entretanto, a validade dos modelos deve ser considerada na avaliação dos resultados.
  • Atração de ramos longos: linhagens que divergiram há relativamente muito tempo tenderão a "agrupar-se" em uma reconstrução filogenética sob condições apropriadas. As razões matemáticas são um tanto complicadas, mas o uso de genes (ou regiões de genes) de evolução mais lenta ajuda a superar o problema.
  • Variação da taxa entre linhagens: as taxas de substituição de nucleotídeos podem diferir entre linhagens; isso pode contribuir para a atração de ramos longos e resultar em topologias de árvore incorretas. No entanto, os métodos de máxima verossimilhança e mínimos quadrados são particularmente úteis aqui.
  • Variação da taxa dentro de um único gene: as taxas de substituição de nucleotídeos podem variar ao longo do comprimento de um único gene – isso também exacerba a atração de ramos longos.
  • As árvores genéticas não são equivalentes às árvores de espécies: a partir da genética mendeliana simples, sabemos que os genes se segregam individualmente e que, ao longo do tempo, os genes individuais não seguem necessariamente a genealogia organísmica (Avise e Wollenberg 1997; Fitch 1970; Hudson 1992; Nichols 2001; Wu 1991) . Um exemplo óbvio é o fato de que, embora você possa ter olhos castanhos, seu filho pode ter os genes para olhos azuis – mas isso não significa que seu filho não seja seu descendente, ou que seus filhos de olhos castanhos sejam mais próximos de você do que seus filhos de olhos azuis. Incluir vários genes na análise é uma solução para esse enigma. Com base em cálculos genéticos simples, geralmente é necessária uma análise de mais de cinco genes para reconstruir com precisão a filogenia de uma espécie (Wu 1991).

Para obter mais informações sobre cladística, você pode consultar um dos vários excelentes recursos cladísticos on-line, como o SASB Introcuction to Philogetecs [Introdução à Filogenética], o Integrative Biology Phylogenetics Lab da UC Berkeley ou o estelar Basics of Cladistic Analysis de Diana Lipscomb, que pode ser baixado em formato Adobe Acrobat PDF. Uma descrição boa e concisa para o leigo pode ser encontrada no Journal of Avocational Paleontology. Finalmente, você pode ler a explicação de Charles Darwin em A Origem das Espécies da "Árvore da Vida", onde o conceito de árvore filogenética foi introduzido pela primeira vez.

Referências

Albert, J., Wahlberg, J., Leitner, T., Escanilla, D. e Uhlen, M. (1994) "Análise de um caso de estupro por sequenciamento direto dos genes pol e gag do vírus da imunodeficiência humana tipo 1." J Virol 68:5918–24. [Pub Med]

Arnold, C., Balfe, P. e Clewley, J. P. (1995) "Sequenciar distâncias entre genes env do HIV-1 de indivíduos infectados da mesma fonte: implicações para a investigação de possíveis eventos de transmissão." Virologia 211: 198-203. [Pub Med]

Atchely, WR e Fitch, W. M. (1991) "Árvores genéticas e as origens de linhagens consanguíneas de ratos." Ciência 254: 554-558. [Pub Med]

Avise, J. C. e Wollenberg, K. (1997) "Filogenética e a origem das espécies." PNAS 94: 7748–7755. http://www.pnas.org/cgi/content/full/94/15/7748

Birch, CJ, McCaw, RF, Bulach, DM, Revill, PA, Carter, JT, Tomnay, J., Hatch, B., Middleton, TV, Chibo, D., Catton, MG, Pankhurst, JL, Breschkin, AM. , Locarnini, SA e Bowden, DS (2000) "Análise molecular de cepas do vírus da imunodeficiência humana associadas a um caso de transmissão criminosa do vírus." J Infect Dis 182:941–4. http://jid.oxfordjournals.org/content/182/3/941.long

Blanchard, A., Ferris, S., Chamaret, S., Guetard, D. e Montagnier, L. (1998) "Evidência molecular para transmissão nosocomial do vírus da imunodeficiência humana de um cirurgião para um de seus pacientes." J Virol 72:4537–40. http://jvi.asm.org/cgi/content/full/72/5/4537?view=full&pmid=9557756

Brooks, DR e McLennan, DA (1991) Phylogeny, ecology, and behavior [Filogenia, ecologia e comportamento]. Chicago: Universidade de Chicago Press.

Bush, RM, CA Bender, et al. (1999) "Prevendo a evolução da gripe humana A." Ciência 286: 1921-1925. [Pub Med]

Doolittle, WF (1999) "Classificação Filogenética e a Árvore Universal." Ciência 284: 2124. [PubMed]

Doolittle, WF (2000) "A natureza do ancestral universal e a evolução do proteoma." Opinião Atual em Biologia Estrutural 10: 355-358. [Pub Med]

Edwards, AWF e Cavalli-Sforza, LL (1963) "A reconstrução da evolução." Anais de Genética Humana 27: 105-106.

Efron, B. (1979) "Métodos Bootstrap: Outra olhada no canivete." Anais de Estatística 7: 1-26.

Efron, B. e Gong, G. (1983) "Uma visão vagarosa do bootstrap, do canivete e da validação cruzada." Estatístico Americano 37: 36-48.

Edwards, AWF e Cavalli-Sforza, LL (1964) "Reconstrução de árvores filogenéticas." em Classificação Fenética e Filogenética. Ed. Heywood, VH e McNeill. Londres: Systematics Assoc. Pub não. 6.

Felsenstein, J. (1981) "Uma abordagem de probabilidade para ponderação de caracteres e o que ela nos diz sobre parcimónia e compatibilidade." Biol J Linn Soc Londres 16:183–196.

Felsenstein, J. (1981) "Árvores evolutivas de sequências de DNA: Uma abordagem de máxima verossimilhança." J Mol Evol 17:368–376. [Pub Med]

Felsenstein, J. (1985) "Limites de confiança nas filogenias: uma abordagem usando o bootstrap." Evolução 39: 783–791.

Felsenstein, J. (2004) Inferindo Filogenias. Sunderland, MA: Sinauer Associates.

Fisher, RA (1912) "Em um critério absoluto para ajustar curvas de frequência." Mensageiro da Matemática 41: 155-160.

Fitch, WM (1970) "Distinguir proteínas homólogas de análogas." Sist. Zoológico. 28: 132-163.

Futuyma, D. (1998) Biologia Evolutiva. Terceira edição. Sunderland, MA: Sinauer Associates.

Goujon, CP, Schneider, VM, Grofti, J., Montigny, J., Jeantils, V., Astagneau, P., Rozenbaum, W., Lot, F., Frocrain-Herchkovitch, C., Delphin, N., Le Gal, F., Nicolas, J. C., Milinkovitch, M. C. e Deny, P. (2000) "Análises filogenéticas indicam uma transmissão atípica de enfermeira para paciente do vírus da imunodeficiência humana tipo 1." J Virol 74:2525–32. http://jvi.asm.org/cgi/content/full/74/6/2525?view=full&pmid=10684266

Hennig, W. (1966) Sistemática Filogenética. (Tradução do inglês). Urbana: Imprensa da Universidade de Illinios.

Hillis, DM e Bull, JJ (1993) "Um teste empírico de bootstrapping como método para avaliar a confiança na análise filogenética." Sist. Biol. 42: 182-192.

Hillis, DM, JJ Bull, et al. (1992) "Filogenética experimental: Geração de uma filogenia conhecida." Ciência 255: 589-592. [Pub Med]

Holmes, EC, Zhang, LQ, Simmonds, P., Rogers, AS e Brown, AJ (1993) "Investigação molecular da infecção pelo vírus da imunodeficiência humana (HIV) em um paciente de um cirurgião infectado pelo HIV." J Infect Dis 167:1411–4. [Pub Med]

Hudson, RR (1992) "Árvores genéticas, árvores de espécies e a segregação de alelos ancestrais." Genética 131:509–513. [Pub Med]

Huelsenbeck, J. P., Ronquist, F., Nielsen, R., e Bollback, J. P. (2001) "Inferência Bayesiana da filogenia e seu impacto na biologia evolutiva." Ciência 294: 2310–2314. [Pub Med]

Kitching, IJ, Forey, PL, Humphries, CJ e Williams, DM (1998) Cladística: A Teoria e Prática da Análise de Parcimónia. Segunda edição. A Publicação da Associação de Sistemática No. 11. Oxford: Imprensa da Universidade de Oxford.

Li, W.-H. (1997) Evolução Molecular. Sunderland, MA: Sinauer Associates.

Machuca, R., Jorgensen, L. B., Theilade, P. e Nielsen, C. (2001) "Investigação molecular da transmissão do vírus da imunodeficiência humana tipo 1 em um caso criminal." Clin Diagn Lab Immunol 8:884–90. [Pub Med]

Maddison, WP e Maddison, DR (1992) MacClade. Sunderland, MA: Sinauer Associates.

Nei, M. e Kumar, S. (2000) Evolução Molecular e Filogenética. Nova York, NY: Oxford University Press.

Nichols, R. (2001) "Árvores genéticas e árvores de espécies não são iguais." Tendências Ecol Evol. 16: 358-364. [Pub Med]

Ou, CY, Ciesielski, CA, Myers, G., Bandea, CI, Luo, CC, Korber, BT, Mullins, JI, Schochetman, G., Berkelman, RL, Economou, AN e et al. (1992) "Epidemiologia molecular da transmissão do HIV em uma prática odontológica." Ciência 256: 1165-71. [Pub Med]

Swofford, DL, Olsen, GJ, Waddell, PJ e Hillis, DM (1996) "Inferência filogenética." Em Sistemática Molecular, pp 407-514. Hillis, DM, Moritiz, C. e Mable, BK eds., Sunderland, Massachusetts: Sinauer.

Veenstra, J., Schuurman, R., Cornelissen, M., van't Wout, AB, Boucher, CA, Schuitemaker, H., Goudsmit, J. e Coutinho, RA (1995) "Transmissão de imunodeficiência humana resistente à zidovudina variantes do vírus tipo 1 após injeção deliberada de sangue de um paciente com AIDS: características e história natural do vírus." Clin Infect Dis 21:556–60. [Pub Med]

Vogel, G. (1997) "Análise filogenética: chegando ao tribunal." Ciência 275: 1559-60. [Pub Med]

Woese, C. (1998) "O ancestral universal." PNAS 95:6854–6859. http://www.pnas.org/cgi/content/full/95/12/6854

Wu, CI (1991) "Inferências da filogenia das espécies em relação à segregação de polimorfismos antigos." Genética 127: 429–435. [Pub Med]

Yirrell, D. L., Robertson, P., Goldberg, D. J., McMenamin, J., Cameron, S. e Leigh Brown, A. J. (1997) "Investigação molecular sobre o surto de HIV em uma prisão escocesa." Bmj 314:1446–50. http://bmj.com/cgi/content/full/314/7092/1446?view=full&pmid=9167560

Zhu, T., B. Korber, et al. (1998) "Uma sequência africana do HIV-1 de 1959 e implicações para a origem da epidemia." Natureza 391:594-597. [Pub Med]

 

Sem comentários:

Enviar um comentário

Cartilha de Filogenética

Introdução à filogenia Figura 1: Uma filogenia universal de consenso Árvores filogenéticas Cladística e reconstrução filogenética Par...