Detecção de marcadores moleculares plastidiais para estudos filogenéticos e cpssrs específicos para orquídeas sapatinhos-de-vênus (Cypripedioideae, Orchidaceae)

Marcadores Moleculares em Orquídeas

Informações do documento

Autor

Julia Faillace Thiesen

instructor/editor Professora Doutora Marisa Santos
school/university Universidade Federal de Santa Catarina
subject/major Ciências Biológicas
Tipo de documento Trabalho de Conclusão de Curso
city_where_the_document_was_published Florianópolis
Idioma Portuguese
Formato | PDF
Tamanho 3.39 MB

Resumo

I.Objetivo e Abordagem da Pesquisa

Este estudo visa identificar novos marcadores moleculares para a subfamília de orquídeas Cypripedioideae (orquídeas sapatinhos-de-vênus), utilizando dados de sequenciamento genômico de Cypripedium calceolus, Phragmipedium longifolium, e Paphiopedilum barbatum. A pesquisa utiliza diferentes técnicas de sequenciamento, incluindo NGS (Illumina HiSeq 2000 e Roche 454) e sequenciamento Sanger, analisando amostras de material vegetal fresco e de herbário. O foco está na montagem do genoma do cloroplasto (cpDNA) e na detecção de regiões com alta variabilidade genética (hotspots) para estudos de filogenética e genética de populações.

1. Necessidade de Novos Marcadores Moleculares em Cypripedioideae

A pesquisa parte da constatação de que, apesar dos avanços recentes em genética de populações e filogenética de orquídeas, a demanda por novos marcadores moleculares permanece alta. As orquídeas sapatinhos-de-vênus (Cypripedioideae) são um exemplo crucial, pois os marcadores existentes são insuficientes para diferenciar espécies com divergência recente e determinar a identidade taxonômica e origem de material comercializado ilegalmente. Essa dificuldade na identificação precisa impacta diretamente a conservação dessas espécies ameaçadas. A necessidade de marcadores mais eficazes e a problemática do comércio ilegal de orquídeas são os principais motivadores do estudo, justificando a busca por novas ferramentas moleculares para a análise filogenética e populacional destas plantas. O estudo destaca a importância prática da pesquisa, indo além de aspectos puramente acadêmicos, para contribuir com a proteção de espécies valiosas.

2. Objetivo Principal e Espécies Estudadas

O objetivo central é obter o máximo de sequências do genoma do cloroplasto (cpDNA) de espécimes de orquídeas sapatinhos-de-vênus para detectar novos marcadores moleculares para a subfamília Cypripedioideae. O estudo se concentra em três espécies representativas deste grupo: Cypripedium calceolus, Phragmipedium longifolium, e Paphiopedilum barbatum. A escolha dessas espécies reflete a diversidade dentro da subfamília e sua importância em estudos filogenéticos e de conservação. A utilização de dados de sequenciamento genômico pré-existentes de diferentes autores, utilizando diferentes tecnologias de sequenciamento, demonstra uma abordagem pragmática e eficiente para obter um conjunto de dados amplo e diversificado. O uso de material vegetal fresco e de herbário demonstra também a ambição de ampliar a base de amostras disponíveis para estudos, incluindo amostras que de outra forma estariam indisponíveis.

3. Metodologia de Sequenciamento e Análise Bioinformática

Dados de sequenciamento genômico de três espécies de orquídeas sapatinhos-de-vênus foram processados, utilizando-se dados previamente sequenciados por diferentes autores e três técnicas distintas: Illumina HiSeq 2000, Roche 454 Next Generation Sequencing (NGS), e Sanger First Generation Sequencing (FGS). A utilização de múltiplas tecnologias de sequenciamento contribui para a robustez do estudo e a validação dos resultados. A montagem do genoma do cloroplasto (cpDNA) foi realizada com diferentes pipelines de bioinformática, com destaque para o software Iterative Organelle Genome Assembly (IOGA). A abordagem bioinformática foi crucial para o sucesso da análise, tratando desafios intrínsecos à montagem de genomas, e a escolha do software IOGA destaca a necessidade de ferramentas específicas para a montagem de genomas de cloroplastos. Finalmente, a análise comparativa das sequências obtidas permitiu a identificação de novos marcadores.

4. Resultados Esperados e Implicações

O estudo espera obter um número significativo de novos marcadores moleculares, tanto filogenéticos quanto para genética de populações. A expectativa é que os métodos empregados forneçam um novo escopo para a rápida detecção de novos marcadores a baixos custos, a partir de material fresco e de herbário. Este último ponto é especialmente relevante para a conservação, pois amplia as possibilidades de estudo para amostras que de outra forma seriam inacessíveis. A descoberta de novos marcadores contribuirá para uma resolução mais precisa das relações filogenéticas dentro de Cypripedioideae, auxiliando na identificação taxonômica de espécies e no combate ao tráfico ilegal. A combinação de técnicas de sequenciamento de última geração e análises bioinformáticas avançadas promete revolucionar o estudo de orquídeas.

II.Metodologia de Sequenciamento e Montagem

O estudo utilizou dados de sequenciamento genômico previamente obtidos por diferentes autores, empregando três técnicas: Illumina HiSeq 2000, Roche 454 NGS, e Sanger. A montagem do genoma do cloroplasto foi realizada com pipelines de bioinformática, com destaque para o software IOGA. A pesquisa comparou a montagem de novo e reference assembly, explorando diferentes estratégias para lidar com a complexidade da montagem de genomas, incluindo o tratamento de regiões repetitivas e lacunas na sequência. A qualidade da montagem foi avaliada utilizando métricas como a cobertura (read depth) e o uso de softwares como SAMTOOLS e IGVTOOLS.

1. Fontes de Dados e Técnicas de Sequenciamento

A metodologia se baseou em dados de sequenciamento genômico previamente obtidos por diferentes autores, abrangendo um total de cinco indivíduos de orquídeas Cypripedioideae: Cypripedium calceolus, Phragmipedium longifolium, e três Paphiopedilum barbatum. A diversidade de origens dos dados demonstra a busca por um conjunto de dados amplo e robusto. É importante destacar que as amostras foram sequenciadas empregando três diferentes tecnologias: Illumina HiSeq 2000, Roche 454 Next Generation Sequencing (NGS), e Sanger First Generation Sequencing (FGS). Essa variedade de plataformas de sequenciamento aumenta a confiabilidade da análise, pois diferentes tecnologias apresentam diferentes vieses e potenciais erros. A inclusão de material vegetal fresco e de herbário demonstra a intenção de maximizar o uso dos recursos e expandir a gama de amostras disponíveis para análise.

2. Montagem do Genoma do Cloroplasto cpDNA

A montagem do genoma do cloroplasto (cpDNA) foi um processo central na metodologia. O texto destaca o uso de diferentes pipelines de bioinformática, com o software Iterative Organelle Genome Assembly (IOGA) sendo mencionado como um destaque. A escolha de diferentes pipelines e ferramentas de bioinformática sugere uma abordagem multifacetada para lidar com os desafios inerentes à montagem de genomas, particularmente em relação a possíveis gaps (lacunas na sequência) e a complexidade de sequências repetitivas no genoma. A utilização do IOGA ressalta a importância de softwares específicos e eficientes para a montagem de genomas de organelas, como o cloroplasto, garantindo a qualidade e precisão da sequência final obtida. As estratégias de montagem de novo e reference assembly foram empregadas, demonstrando uma abordagem completa e abrangente para garantir os melhores resultados.

3. Análise Comparativa e Controle de Qualidade

Após a montagem do genoma do cloroplasto, uma análise comparativa das sequências recuperadas foi realizada, visando identificar novos marcadores. A análise comparativa permitiu identificar regiões de alta variabilidade genética, importantes para estudos filogenéticos e de genética de populações. O controle da qualidade das montagens foi abordado, reconhecendo que a comparação ideal seria com sequenciamentos Sanger, mas considerando os custos e tempo envolvidos. Em vez disso, utilizaram-se outros parâmetros, como o mapeamento das reads para a montagem gerada, permitindo a verificação dos valores de cobertura (read depth) usando softwares como SAMTOOLS e IGVTOOLS. A avaliação da cobertura permite identificar regiões com boa qualidade de sequenciamento, regiões com excesso de cobertura (indicando possível contaminação ou erros), e regiões com baixa cobertura ou ausência de cobertura (indicando problemas na montagem ou na qualidade do DNA). A análise da qualidade incluiu também a busca por gaps (lacunas na sequência) e a consideração da porcentagem de bases ambíguas na montagem final.

III.Resultados Novos Marcadores Moleculares

A análise comparativa das sequências de cpDNA resultou na identificação de 29 potenciais novos marcadores filogenéticos e 54 marcadores de genética de populações. Regiões gênicas e intergênicas, incluindo genes como matK, accD, e pseudogenes da família ndh (como ndhJ), mostraram alta variabilidade. Os resultados sugerem que a combinação de diferentes técnicas de sequenciamento genômico e abordagens de bioinformática proporciona uma metodologia eficiente e de baixo custo para a rápida detecção de novos marcadores moleculares, tanto para material fresco como de herbário.

1. Quantidade de Novos Marcadores Identificados

A análise comparativa das sequências do genoma do cloroplasto (cpDNA) resultou na identificação de um total de 29 marcadores filogenéticos putativos e 54 marcadores potenciais para genética de populações. Essa quantidade significativa de novos marcadores sugere um sucesso considerável na busca por regiões altamente variáveis no genoma de Cypripedioideae. A descoberta de um número tão expressivo de marcadores potenciais reforça a eficácia da metodologia empregada, baseada em sequenciamento genômico de alta-performance e análises bioinformáticas. A distinção entre marcadores filogenéticos e marcadores populacionais indica a versatilidade dos marcadores encontrados, apropriados para estudos em diferentes escalas e com diferentes objetivos.

2. Localização e Tipo de Marcadores

A análise detalhou a localização dos marcadores identificados nas diferentes regiões do genoma do cloroplasto: 19 genes codificantes de proteínas (10 no LSC, 5 nos IRS, e 3 no SSC) e nove sequências intergênicas (7 no LSC e 2 nos IRS) com alto nível de variação. A identificação de um pseudogene (ndhJ) no LSC também é destacada como uma região promissora para estudos filogenéticos. A análise revelou que a variabilidade não se concentrou exclusivamente em regiões não-codificantes, contrariando a suposição comum de que regiões codificantes evoluem mais lentamente. Essa observação sugere a complexidade da evolução molecular em Cypripedioideae e a importância de se considerar marcadores em regiões diversas do genoma para obter uma visão completa das relações filogenéticas. A identificação de marcadores em diferentes tipos de regiões genômicas reforça a riqueza e potencial informativo do conjunto de dados gerado.

3. Comparação com Marcadores Clássicos e Discussão de Genes ndh

O estudo compara os novos marcadores com marcadores clássicos, mostrando que estes últimos, como matK e accD, também apresentaram alta variabilidade, mas sua utilização prévia em estudos filogenéticos de Cypripedioideae foi insuficiente para gerar boa resolução abaixo do nível de gênero. Isso reforça a necessidade dos novos marcadores encontrados. A análise discute a família gênica ndh, envolvida na resposta da fotossíntese a estresses ambientais, observando alta variação na sequência ndhJ, presente em todos os espécimes analisados. Embora estudos anteriores não tenham encontrado correlação entre a variação em ndh e a filogenia da família Orchidaceae, a alta variabilidade em ndhJ sugere seu potencial como marcador. A comparação com estudos prévios sobre a variação em genes ndh e a discussão de sua possível relação com a adaptação ambiental contribui para uma melhor compreensão do contexto evolutivo dos marcadores identificados.

4. Marcadores Putativos e Limitações do Estudo

O estudo propõe diversos marcadores filogenéticos putativos para Cypripedioideae, como trnL-trnF, atpB-rbcL, matK, accD, ycf1, entre outros, ressaltando a necessidade de análises adicionais para confirmar sua eficácia (calcular a porcentagem de caracteres informativos, índice de consistência e índice de retenção). A limitação do número de espécimes analisados (apenas três representantes de Cypripedioideae para a análise filogenética) é reconhecida como um fator que impediu a realização de uma análise filogenética completa neste momento. Apesar dessa limitação, os resultados oferecem uma base sólida para o desenvolvimento de estudos filogenéticos futuros, fornecendo um conjunto promissor de novos marcadores e direcionando futuras pesquisas para confirmar o valor taxonômico e filogenético dos marcadores putativos.

IV.Importância e Aplicações

A descoberta de novos marcadores moleculares para Cypripedioideae é crucial para resolver questões taxonômicas complexas, especialmente em espécies recentemente divergidas e no combate ao comércio ilegal dessas orquídeas. A utilização de amostras de herbário amplia significativamente o potencial de estudos filogenéticos e populacionais. Os marcadores identificados podem contribuir para estudos futuros de filogenética e genética de populações em orquídeas deste grupo, melhorando a compreensão da sua evolução e conservação.

1. Resolução de Problemas Taxonômicos e Conservação

A principal importância da descoberta desses novos marcadores reside na sua capacidade de auxiliar na resolução de problemas taxonômicos complexos em Cypripedioideae. A identificação precisa de espécies, especialmente aquelas com divergência recente, é fundamental para estudos filogenéticos e de conservação. Os marcadores atuais se mostram insuficientes para essa tarefa, levando a dificuldades na classificação e no monitoramento de populações. Os novos marcadores desenvolvidos neste estudo oferecem uma ferramenta crucial para superar essas limitações, permitindo uma distinção mais precisa entre espécies e contribuindo significativamente para os esforços de conservação. O foco na identificação precisa se conecta diretamente com o combate ao comércio ilegal, pois a identificação inequívoca da origem do material comercializado é essencial para a aplicação de medidas de controle e prevenção.

2. Aplicações em Filogenia e Genética de Populações

Os 29 marcadores filogenéticos putativos e 54 marcadores potenciais para genética de populações, identificados neste estudo, oferecem uma base sólida para estudos futuros em ambos os campos. Na filogenia, os novos marcadores permitem refinar as relações evolutivas dentro da subfamília Cypripedioideae, testando hipóteses e elucidando relações ainda incertas entre os gêneros e espécies. Em genética de populações, esses marcadores possibilitam a análise da estrutura genética de populações naturais, a detecção de fluxo gênico, e a avaliação da diversidade genética dentro e entre populações. A combinação de ambos tipos de marcadores torna a abordagem mais robusta e completa, fornecendo informações valiosas sobre a história evolutiva e a estrutura genética dessas orquídeas, essenciais para estratégias de conservação eficazes. A identificação de marcadores em genes específicos, como matK e ndhJ, abre novas possibilidades para a pesquisa em Cypripedioideae.

3. Utilização de Amostras de Herbário e Custo Benefício

Um aspecto relevante do estudo é a possibilidade de utilizar amostras de herbário na análise comparativa, ampliando significativamente o acesso a material genético para estudos. A inclusão de amostras de herbário aumenta o número de indivíduos que podem ser estudados, incluindo aqueles coletados há décadas. Isso é particularmente importante para espécies ameaçadas, onde o material fresco pode ser escasso ou inacessível. O estudo destaca o baixo custo dos métodos de sequenciamento genômico e de bioinformática empregados, tornando a abordagem economicamente viável para estudos em larga escala, mesmo com a necessidade de analisar um número considerável de amostras. O custo-benefício desta metodologia contribui para o avanço da pesquisa em genética e conservação de Cypripedioideae, tornando-a aplicável em diferentes contextos e escalas.

V.Dados Adicionais

Foram analisados genomas de cinco indivíduos de orquídeas Cypripedioideae: um Cypripedium calceolus, um Phragmipedium longifolium, e três Paphiopedilum barbatum. Amostras de herbário com até 46 anos foram incluídas, demonstrando a viabilidade de análise de DNA antigo. O genoma do cloroplasto de Phragmipedium longifolium foi usado como referência, com um tamanho de 150.925 pb e conteúdo A+T de 63,9%. O projeto SYNTHESYS forneceu dados para duas das amostras de Paphiopedilum barbatum. O Grupo de Biossistemática da Universidade de Wageningen, Países Baixos, contribuiu com dados de 94 amostras (frescas e históricas). O estudo também discutiu diferentes métodos de inferência de árvores filogenéticas, como a análise Bayesiana e a máxima verossimilhança (Maximum Likelihood).

1. Espécies Analisadas e Técnicas Utilizadas

O estudo utilizou dados de sequenciamento genômico de cinco indivíduos de orquídeas Cypripedioideae, abrangendo três gêneros: um Cypripedium calceolus, um Phragmipedium longifolium, e três Paphiopedilum barbatum. A variedade de espécies analisadas contribui para a abrangência dos resultados. Os dados foram gerados por diferentes autores, utilizando-se de diversas técnicas de sequenciamento, incluindo Illumina HiSeq 2000, Roche 454 Next Generation Sequencing (NGS), e Sanger Sequencing. Essa variedade de fontes de dados e técnicas de sequenciamento reforça a confiabilidade e a amplitude da pesquisa, complementando-se mutuamente e fornecendo resultados mais robustos. A menção da utilização do Phragmipedium longifolium como referência para a montagem do genoma ressalta a escolha de uma espécie bem estudada para auxiliar na análise dos dados.

2. Dados de Sequenciamento e Montagem

Detalhes específicos sobre o sequenciamento são fornecidos para algumas amostras. O sequenciamento Roche 454 GS-FLX utilizando o Titanium Kit foi realizado por Fay et al. (não publicado) em Kew, Reino Unido. Os dados do Illumina HiSeq 2000 foram gerados pelo Danish National High-throughput Sequencing Center. Dois espécimes de herbário de Paphiopedilum barbatum foram sequenciados como parte do projeto europeu SYNTHESYS (finalizado em janeiro de 2012, www.synthesys.info). O Grupo de Biossistemática da Universidade de Wageningen, Países Baixos, também contribuiu com dados NGS para 94 amostras, incluindo material fresco e histórico, demonstrando colaboração internacional e o uso de uma grande quantidade de dados. A informação sobre a porcentagem de cpDNA recuperado em amostras de herbário (21,51% para uma amostra de 44 anos e 59,52% para uma de 46 anos) destaca os desafios e sucessos na utilização de material antigo.

3. Análise do Genoma de Paphiopedilum barbatum e Phragmipedium longifolium

O genoma completo do cloroplasto de Phragmipedium longifolium, com 150.925 pb e conteúdo A+T de 63,9%, serviu como referência. Seu conteúdo de A+T é comparável ao de outras orquídeas, como Phalaenopsis equestris (148.959 pb; 63,35%), Phalaenopsis afrodite (148.964 pb; 62,35%), Dendrobium officinale (152.221 pb; 62,5%), e Oncidium Gower Ramsey (146.484 pb; 62,7%). A similaridade do cpDNA de Phragmipedium longifolium com o de Dendrobium officinale (GenBank KC771275), apesar de ligeiras diferenças no conteúdo A+T, foi observada utilizando o BLAST. Para Paphiopedilum barbatum, a montagem final combinada dos três indivíduos apresentou 143.480 pb, com 0,73% de dados em falta, recuperando cerca de 95,07% do cpDNA, com profundidade média de reads de 11,6x. A similaridade do conteúdo A+T com P. longifolium reforça a validade da comparação.