O PhyML é um software utilizado para se fazer estimativa e probabilidade filogênica em alinhamento de sequências nucleotídicas ou sequências de anino ácido. Atualmente está na versão 3.0, seu desenvolvimento teve participação de diversos cientistas de algumas universidades no mundo.
[ Hits: 30.534 ]
Por: José Cleydson Ferreira da Silva em 27/07/2010
Pode-se usar as os parâmetros em linha de comando para iniciar o PhyML, os mesmos conceitos de usabilidade podem ser aplicado em comandos, bastando colocar os parâmetros que caracterizem a necessidade de sua análise. O software pode ser iniciado da seguinte forma:
# ./phyml -i arquivo.phy
O manual pode ser encontrado com o comando ./phyml -h, uma série de parâmetros serão descritos abaixo.
-i ( --input) arquivo de sequência
sequência de nucleotídio ou aminoácido em formato PHYLIP (arquivo.phy)
-d (--datatype) nt
O tipo de dado pode ser nt para nucleotídio e aa para aminoácido
-q (--sequential)
Formato alteração intercalada para sequencial
-n (--multiple) 4
É o número inteiro indicando o numero de conjunto de dados para análise
-b (--bootstrap)
int > 0 : Numero de replicações bootstrap
int = 0 : Aproximação Verosimilhança sem computar valores de bootstrap
int = -1 : Taxa de aproximação de Verosimilhança retornando aLTR
int = -2 - Taxa de aproximação de Verosimilhança retornando métrica Chi2-based, suporte a brunch
int = -3 - Mínimo de métrica Chi2-based e suporte SH-like
int = -4 - Suporte Chi2-based sozinho
-m (--model) HKY85 (default)
Nome do modelo de substituição
-f e, d, ou "fA fC fG Ft"
Nucleotídio de sequência de aminoácido
-e
Sequências Nucleotídicas:
Sequências de Aminoácidos: São estimadas usando Máxima Verosimilhança
Sequência de Aminoácidos:
Aproximação por contagem de diferentes aminoácidos nos dados
-d
Sequências Nucleotídicas:
Aproximação por contagem de diferentes aminoácidos nos alinhamento
Sequência de Aminoácidos:
Aproximação usando frequências definidas por modelo de substituição
- "fA fC fG fT"
Válido apenas para modelos de nucleotídios. fA, fC, fG e fT corresponde a A, C, G e T
-t (--ts/tv)
Taxa de transição e transversão. Apenas para sequências de DNA, pode-se fixar um valor positivo (4.0) ou o tipo e obter estimativa de Máxima Verosimilhança.
-v (--pinv)
Proporção de inviabilidade, pode ser definido o valor [0,1]
-c (--nclasses) nb subst cat =1
nb subst cat:
Valor inteiro positivo. Numero de substituição às Categorias.
-a (--alpha) gamma
gamma
Pode ser um valor positivo para o parâmetro gamma. Ou o valor de Máxima Verossimilhança
-s (--search) move
Opção de pesquisa na topologia da árvore. Podem ser:
NNI - Padrão
SPR - mais lento que NNI
BEST - A melhor opção de pesquisa que NNI e SPR
-u (--inputtree) nome da arquivo
O Arquivo precisa ser em formato newick
-o params
params: Parâmetro de otimização
params=tlr
t - Topologia da árvore
l - Comprimento Brunch
r - Parâmetros de substituição de taxas
n - Parâmetro não é otimizado
--rand start
Define o início da árvore aleatória, porém é valido apenas se a pesquisa SPR for realizada.
--n rand starts num
num é o número aleatórios de arvores que serão utilizados, validos para pesquisa SPR
--r seed num
Número de semente usada pelo gerador de números aleatórios
--print site lnl
Imprime em arquivos * phyml lk.txt o valores de Verosimilhança
--print trace
Imprime no arquivo * phyml trace.txt cada exploração filogênica durante o processamento de pesquisa em árvores.
[1] Comentário enviado por dailson em 28/07/2010 - 10:54h
Grande Kuruma!!
Parabéns pelo artigo. Apesar de eu não estar familiarizado com coisas como:
probabilidade filogênica
alinhamento de sequências nucleotídicas
sequências de anino ácido
Eu acho que isso irá e muito ajudar a comunidade do software livre.
E mais do que nunca
[2] Comentário enviado por cleysinhonv em 28/07/2010 - 16:01h
Olá Dailson,
Grande Guerreiro, obrigado pelo incentivo meu camarada. Vou começar uma serie longa desses artigos, estou pensando em enviar um trabalho para o VOL DAY, em Bebedouro-SP, mas estou pensando se poderá ser aceito ou não. Esses artigos com certeza deram muito trabalho para validar a prática. Mas com certeza resolverá a vida dos Biologos e dos Bioinformatas.