Mercados Futuros – 05/08/08
5 de agosto de 2008
Nelore Brasil apresenta campeões do Nelore na Feicorte (Vídeo)
7 de agosto de 2008

Consolidando fontes de informação genética de touros de corte

A consolidação das informações do mesmo touro nos vários sumários através de meta-análises agregadoras resulta num ganho em acurácia nas DEPs das características analisadas, ou seja, aumenta-se o nível de confiança nas informações deste touro, pois remove-se o efeito de diferentes bases genéticas e combinam-se estas várias estimativas.

Prezados leitores do BeefPoint, dando continuidade à reapresentação de alguns trabalhos do nosso eterno amigo, mestre e mentor Luiz Fries, como uma forma de homenageá-lo e de relembrar alguns de seus importantes ensinamentos e suas contribuições para o desenvolvimento do melhoramento animal no Brasil, selecionamos, para este mês, uma versão do artigo “Consolidando fontes de informação genética de touros de corte”, originalmente apresentado no “5º Simpósio sobre Bovinos de Corte. ESALQ. Piracicaba, Julho de 2004”.
Com votos de boa leitura e muitas reflexões,

Equipe GenSys.

1. Introdução

O pecuarista brasileiro tem atribuído cada vez maior importância à utilização das DEPs (diferenças esperadas na progênie). Esta ferramenta é única para identificar touros que transmitam características econômicas necessárias para o incremento de produtividade do seu rebanho. O uso da inseminação artificial permite a formação de sub-amostras de progênies de um mesmo touro em diversos rebanhos, participantes de diferentes programas de melhoramento. Como esses programas utilizam informação apenas de seus rebanhos participantes para a publicação dos sumários, neles os mesmos touros figuram com diferentes DEPs e diferentes acurácias. Se os criadores pudessem dispor de DEPs calculadas com informação de todos os rebanhos, o nível de precisão e, possivelmente, de confiança nestas estimativas seria consideravelmente aumentado.

No início da década 1991-2000, comentava-se a interrupção no cálculo das DEPs e na emissão de sumários nacionais, para as raças zebuínas, desde 1988. Apenas o sumário de uma empresa independente continuava a ser produzido. Uma década depois, o problema era o oposto, existindo seis sumários na raça Nelore. Por um lado, isto atesta a importância desta ferramenta para os diferentes criadores, empresas, grupos privados e associações e o nível de competitividade que está instalado. Estes esforços individuais estabelecem uma rede de segurança e estimulam o desenvolvimento técnico/científico e a criatividade em marketing.

Como os resultados obtidos nos vários sumários (com diferentes amostragens, populações, bases genéticas, características e índices distintos e metodologias ou programas de avaliação genética), nos seus grandes números, confirmaram um ao outro, isto gerou um nível grande de aceitação e confiança por parte dos usuários. Porém, como são tantos os touros envolvidos, fica difícil para o criador considerar, simultânea e adequadamente, todos os fatores e componentes.

Ganhos adicionais podem ser obtidos se a informação contida em cada um destes conjuntos, para características semelhantes, puder ser reunida ou combinada.

2. Métodos

As DEPs de touros informadas em diferentes sumários de uma mesma raça podem ser combinadas de 3 formas:

(a)conversão de uma base para outra através de fatores de correção;
(b)Consolidado: reunião dos resultados de diferentes sumários publicados; e
(c)Unificado: análise conjunta de todos os dados de performance de todos bancos de dados, após consistências completas.

Sem dúvida esta última forma é a ideal, embora Schaeffer (1996) comente que em algumas situações a forma (b) pode ser melhor.

Vale lembrar que existe um alto nível de comprometimento das empresas/entidades com a informação tornada pública pois esta é verificável e contestável. Por isto, antes de sua publicação, cada sumário passa por criteriosa análise dos resultados por toda a equipe envolvida e a regra é que, depois de tudo pronto, sempre se faz necessária alguma correção e rodar tudo de novo. Na forma (c) – Unificado-, aumenta-se a distância ou o número de escalões entre quem coletou o dado ou conhece a situação de cada fazenda e quem está fazendo a sua edição/validação; este componente pode ser crítico em casos pontuais.

Banos (1999) relata que o primeiro método utilizado para comparar avaliações genéticas nacionais da raça Holandesa de diferentes países foi pela conversão da avaliação de cada touro em cada país para a base e escala do país desejado.

Schaeffer (1985, 1994) propôs o modelo MACE (Multiple Across Country Evaluations) que serviu de base para o estabelecimento do INTERBULL. De acordo com Banos (1999), avaliações de mais de 57 mil touros da raça Holstein, pertencentes a 23 populações foram reunidas através desta metodologia. O modelo MACE contempla a possibilidade de existirem diferentes grupos genéticos de touros, com diferentes populações de origem, etc.

Para consolidar dados de touros da raça Nelore que foram largamente utilizados em IA, é possível pensar numa simplificação adicional pela não consideração de diferentes grupos genéticos. O uso de grupos genéticos no modelo requeriria algum grau de cooperação pois não é publicado se grupos são utilizados ou não, qual a definição empregada e as respectivas matrizes de incidência.

O modelo multivariado MACE pode ser simplificado para uma situação univariada como:
y = Xs + Zt + e; onde:
y: é um vetor de observações com as DEPs “des-regredidas” de um touro num determinado sumário;
X: é uma matriz relacionando as observações aos seus respectivos sumários;
s: é um vetor contendo o efeito médio dos sumário;
Z: é uma matriz relacionando as observações aos seus respectivos touros;
t: é um vetor contendo o efeito genético (a DEP “consolidada” entre sumários) do touro; e
e: é um efeito residual;

No cálculo das DEPs, os efeitos médios dos touros são mais ou menos “regredidos” com relação a zero na medida em que os touros “possuam informação mais incompleta” ou seja, que a herdabilidade da característica seja menor, que o número de produtos do touro seja menor, que a distribuição destas progênies seja mais concentrada em poucos rebanhos ou grupos contemporâneos e/ou que estas progênies tenham valores extremos ou pertençam a grupos contemporâneos muito heterogêneos ou pouco conectados. É possível que em alguns sumários, alguns touros tenham progênies pequenas e por isto tenham seus efeitos muito regredidos.

É necessário, então, fazer uma “des-regressão” de cada uma destas DEPs particulares em cada sumário, combinar os efeitos todos nas equações do MACE, obtendo um novo valor para t e daí calcular um preditor mais conservador do que este valor de t: uma nova DEP, regredida (menos) agora pela informação total contida no conjunto de sumários. A quantidade de informação real para cada touro será maior do que em qualquer dos sumários e sempre será vantajoso reunir informação.

Embora seja óbvio, é importante ressaltar que, para aplicar o MACE, devem existir alguns touros com avaliações em dois ou mais sumários, ou seja, que os sumários sejam suficientemente conectados. De maneira geral, os touros Nelore usados em IA no país estão bem conectados e permitem uma consolidação. Mesmo assim, é necessário manter vigilância para que cada safra de touros jovens seja bem conectada com as anteriores, mesmo dentro de um mesmo programa.

2.1 Vantagens e desvantagens do MACE [ Schaeffer (1985, 1994) ]

O modelo MACE é o mais utilizado no mundo para reunir informação publicada em vários sumários/países e o maior usuário é o INTERBULL (Banos, 1999). Além disto, o método está bem documentado e o uso dos programas é totalmente franqueado pelo seu autor, inclusive no nosso meio ( Schaeffer, 1996). O conceito fundamental que está no cerne do MACE é o de desregredir DEPs antes de reuni-las. Assim se evita prejudicar a avaliação final de touros com poucas centenas de filhos bem distribuídos entre vários sumários em relação a touros com igual número de filhos mas com a progênie concentrada em poucos ou apenas um programa/sumário.

O MACE possuiu um componente forte e essencial para o seu uso em avaliações genéticas mundiais na raça Holandesa: ele reúne toda a informação disponível, leva em consideração as correlações existentes entre provas para cada par de países e devolve uma avaliação genética específica, com as DEPs de cada touro, para cada país (os valores desta matriz de correlações tem grande poder sobre as ordenações dos touros e geram discussões no âmbito do INTERBULL). Claramente, este seria um resultado não desejado para a situação do Nelore do país: por exemplo, ao reunir dados de 5 sumários não queremos de volta 5 DEPs para cada touro.

2.2 Abordagem bayesiana utilizada pela Cornell University

Zhang et al., 2002, apresentam duas maneiras de se considerar informação externa: uma através da combinação de dados internos e externos, chamada por eles de “Joint” (no nosso caso, resultaria num sumário “Unificado”); e outra através da incorporação de dados internos com as DEPs e acurácias externas, chamada de “Incorporative” (no nosso caso, seria o “Consolidado”). O estudo foi conduzido com dados simulados de peso ao nascer, peso à desmama e ganho pós-desmama, e os valores genéticos foram estimados por melhor predição linear não viesada (BLUP). Foram calculadas estimativas dos quatro procedimentos:
1)BLUP usando só dados internos;
2)BLUP usando só dados externos;
3)”Joint” ou Unificado – BLUP sobre o conjunto total de dados (internos+externos); e
4)”Incorporative” ou Consolidado – incorporando os BLUPs interno e externo.

As correlações entre as estimativas obtidas pelos quatro métodos e entre estas e os valores genéticos verdadeiros para peso a desmama, média de 160 replicações, são apresentados na Tabela 1.

Tabela 1. Coeficientes de correlação (com respectivos erros-padrão) entre os valores genéticos verdadeiros (VGV) e os valores preditos para peso à desmama por quatro procedimentos (Consolidado, Interno, Externo e Unificado)


Nota-se um considerável ganho em “acurácia” (aqui utilizado como a correlação entre os valores genéticos verdadeiros e os estimados por cada método) nos procedimentos “Joint” e “Incorporative”. Quando comparados com o interno, revelaram aumento de 52% (0,64/0,42) em acurácia. Já em relação ao externo, o aumento foi de 10% (0,64/0,58). Ou seja, esses resultados mostraram o quanto se pode obter de aumento na confiança das DEPs através do uso de um sumário consolidado ou de um sumário unificado.

2.3 Abordagem bayesiana utilizada no PAINT® Consolidado

Métodos bayesianos apresentam uma característica básica: à informação existente dentro de um conjunto de dados, sempre existe alguma informação pré-existente, na forma de componentes de variância ou de uma matriz de parentesco ou de outras fontes de informação publicadas (outros sumários). A reunião destas fontes gera um resultado final, no caso o Sumário PAINT® Consolidado.

O método bayesiano utilizado poderia ser descrito, de maneira condensada, por fazer uma média ponderada das DEPs “desregredidas”; e, de maneira mais completa:

(1)cada DEP é previamente ajustada para o efeito da respectiva base genética do seu sumário;
(2)depois é “desregredida” pelo inverso da regressão que sofreu dentro de cada sumário;
(3)quando uma média ponderada (pela quantidade de informação em cada sumário) é calculada; e, após,
(4)este valor é regredido pela quantidade de informação total em todos os sumários, para obter-se as DEPs consolidadas.

Um ponto crítico no uso do conceito de des-regredir é usar modos de des-regressão que sejam justos e que ponderem adequadamente a informação contida em cada sumário. Os diferentes sumários fornecem informação sobre a precisão de suas estimativas de diferentes formas: erro-padrão, número de filhos e rebanhos, acurácia real e acurácia BIF. Felizmente existe uma forte associação entre estas várias medidas e todas elas podem ser convertidas em outra. No caso do Sumário PAINT® Consolidado, optou-se por converter todas as medidas de risco em “equivalentes-progênie”. Para tal foram usadas informações próprias e disponíveis de sumários que publicam diferentes medidas de risco.

3. Resultados de experiências em consolidar sumários

A primeira grande constatação é a de que é plenamente possível realizar isto pois existe um grande número de touros em comum entre os sumários, criando fortes laços genéticos diretos, e conexões que permitem análises agregadoras.

A segunda grande constação é a de que o maior responsável por diferenças entre as DEPs para uma mesma característica dos mesmos touros nos vários sumários é o uso de diferentes bases genéticas nestes. De fato, para todas as características examinadas e consolidadas, modelos contendo apenas os efeitos de ” touro” e de “sumário” explicaram, no mínimo, 95% da variabilidade total das DEPs.

Os resultados mostraram que existe uma enorme quantidade de informação dispersa e que grandes ganhos em precisão podem ser obtidos simplesmente por reunir esta informação. A Tabela 2 a seguir – que permite comparação com resultados de Zhang et al., 2002 – mostra correlações entre os valores de DEP para ganho do nascimento à desmama de cinco sumários e deles com o Sumário PAINT® Consolidado 2002. Pode parecer óbvio mas é adequado chamar a atenção para o fato de que o Consolidado apresentou maior grau de associação com cada um dos sumários do que qualquer outro par de opções, pois ele combina todas as informações de todos eles. O esperado é que as DEPs do consolidado possuam uma maior correlação com o valor genético verdadeiro.

Tabela 2. Coeficientes de correlação de Pearson entre as DEPs para ganho do nascimento à desmama em cinco sumários da raça Nelore e no PAINT® Consolidado 2002


Clique na imagem para ampliá-la.

4. Comentários finais

A consolidação das informações do mesmo touro nos vários sumários através de meta-análises agregadoras resulta num ganho em acurácia nas DEPs das características analisadas, ou seja, aumenta-se o nível de confiança nas informações deste touro, pois remove-se o efeito de diferentes bases genéticas e combinam-se estas várias estimativas.

O uso de informação externa produz estimadores que possuem uma variância ainda menor do que qualquer método (BLUP, modelo animal completo multivariado, etc.) que considere apenas as informações internas ao programa.

A experiência adquirida neste período mostrou que o processo é relativamente simples, muito seguro e confere muita agilidade em incorporar ou atualizar informação.

5. Referências bibliográficas

Banos, G. 1999. Identifying genetically superior stock across country. In: Lopes et al. (1999). Anais do Simpósio Internacional de Genética e Melhoramento Animal. UFV, Viçosa, MG. 21-34

GENSYS Consultores Associados S/C Ltda. 2001. Sumário Nelore Aliança. Porto Alegre, RS. 54p.

LAGOA DA SERRA LTDA. 2003. Sumário PAINT Consolidado 2002. Sertâozinho, SP. 78p.

LAGOA DA SERRA LTDA. 2003. Sumário PAINT Consolidado 2003 – O GPS do Nelore. Sertâozinho, SP. 42p.

PIMENTEL, E.C.G. FRIES, L.A., QUEIROZ, S.A., KNACKFUSS, F.B., BRUNELI, F.A.T, OTAVIANO, A.R. 2002. Efeitos do uso de informação externa em avaliações genéticas. Anais do 5o Congresso Brasileiro das Raças Zebuínas. ABCZ, Uberaba, MG. P 275-277.

Schaeffer, L.R. 1985. Model for international evaluation of dairy sires. LPS (12): 105-115.

Schaeffer, L.R. 1994. Multiple country comparison of dairy sires. JDS (77): 2671-2678.

Schaeffer, L.R. 1996. Multiple country evaluations. in: Tópicos avançados em melhoramento animal. UNESP, Jaboticabal, SP, 11-15. (mimeo)

ZHANG, Z.W.; QUAAS, R.L.; POLLAK, E.J. Simulation study on the effects of incorporating external genetic evaluation results. In: Proc. 7th WCGALP, 2002, Le Corum, Montpellier – France. Session 20. Communication 20-14.

1 Comment

  1. Projeto CAPIM disse:

    Muito bom o site ter artigos abordando assuntos mais técnicos como esse, além daqueles que tratam de informações mais práticas.