EUA: outdoors promovem carne bovina aos latinos
13 de junho de 2002
Bertin está otimista com exportações
17 de junho de 2002

Combinando informação de vários sumários de touros de corte – exercícios preliminares

Por Luiz Fries1

No início da década passada comentava-se a interrupção no cálculo das DEP´s e na emissão de sumários nacionais, para as raças zebuínas, desde 1988. Apenas o sumário de uma empresa independente continuava a ser produzido. Hoje o problema é o oposto e existem seis sumários na raça Nelore. Por um lado, isto atesta a importância desta ferramenta para os diferentes criadores, empresas, grupos privados e associações e o nível de competitividade que está instalado. Estes esforços individuais estabelecem uma rede de segurança e estimulam o desenvolvimento técnico/científico e a criatividade em marketing. Como os resultados obtidos nos vários sumários (com diferentes amostragens, populações, bases genéticas e metodologias ou programas de avaliação genética) confirmaram um ao outro, nos seus grandes números, isto gerou um nível grande de aceitação e confiança por parte dos usuários. Ganhos adicionais podem ser obtidos se a informação contida em cada um destes conjuntos, para características semelhantes, puder ser consolidada.

As DEP´s de touros informadas em diferentes sumários de uma mesma raça podem ser combinadas de 3 formas:

(a) conversão para uma base única através de métodos de regressão;
(b) consolidação de resultados dos diferentes sumários através de um modelo linear;
(c) análise conjunta de todos os dados de performance de todos bancos de dados, após consistências completas.

Sem dúvida esta última forma é a ideal, embora Schaeffer (1996) comente que em algumas situações a forma (b) pode ser melhor. Enquanto se discute se e como reunir, validar, analisar e publicar esta informação, as formas mais rudimentares podem ser utilizadas até porque cada pessoa da área está tentando agregar esta informação de alguma maneira. Se um primeiro exercício for feito, usando material de domínio público, facilitará uma discussão focalizada e crítica e deverá resultar num procedimento mais aperfeiçoado e implementado de comum acordo entre todos os programas.

Métodos

Banos (1999) relata que o primeiro método utilizado para comparar avaliações genéticas nacionais da raça Holandesa de diferentes países foi pela conversão da avaliação de cada touro em cada país para a base e escala do país desejado de acordo com a equação:

PB= a + b * PA

onde:
PA é a avaliação genética de um animal expressa na base e escala do país A;
PB é a avaliação genética deste animal convertida para a base e escala do país B;
a é a diferença entre as bases dos países A e B; e
b é um coeficiente de regressão que leva em conta as diferenças de escala, performance e precisão das avaliações genéticas entre os países A e B.

Schaeffer (1985, 1994) propôs o modelo MACE (Multiple Across Country Evaluations) que serviu de base para o estabelecimento do INTERBULL. De acordo com Banos (1999), avaliações de mais de 57 mil touros da raça Holstein, pertencentes a 23 populações foram reunidas através desta metodologia. O modelo MACE contempla a possibilidade de existirem diferentes grupos genéticos de touros, com diferentes populações de origem, etc.

Para consolidar dados de touros da raça Nelore que foram largamente utilizados em IA, é possível pensar numa simplificação adicional pela não consideração de diferentes grupos genéticos. O uso de grupos genéticos no modelo requeriria algum grau de cooperação pois não é publicado se grupos são utilizados ou não, qual a definição empregada e as respectivas matrizes de incidência.

O modelo MACE, em notação matricial pode ser, então, simplificado/traduzido para:

y = Xs + Zt + e

onde:
y é um vetor de observações com as DEP´s “des-regredidas” de um touro num determinado sumário;
X é uma matriz de incidência relacionando as observações aos seus respectivos sumários;
s é um vetor contendo o efeito médio dos sumário (não-genético);
Z é uma matriz de incidência relacionando as observações aos seus respectivos touros;
t é um vetor contendo o efeito genético (a DEP “consolidada” entre sumários) do touro;
e é um efeito residual;

No cálculo das DEP´s, os efeitos médios dos touros são mais ou menos “regredidos” com relação a zero na medida em que os touros “possuam informação mais incompleta” ou seja, que a herdabilidade da característica seja menor, que o número de produtos do touro seja menor, que a distribuição destas progênies seja mais concentrada em poucos rebanhos ou grupos contemporâneos e/ou que estas progênies tenham valores extremos ou pertençam a grupos contemporâneos muito heterogêneos ou pouco conectados. É possível que em alguns sumários, alguns touros tenham progênies pequenas e por isto tenham seus efeitos muito regredidos.

É necessário, então, fazer uma “des-regressão” de cada uma destas DEP´s particulares em cada sumário, combinar os efeitos todos nas equações do MACE, obtendo um novo valor para t e daí calcular um preditor mais conservador do que este valor de t: uma nova DEP, regredida (menos) agora pela informação total contida no conjunto de sumários. A quantidade de informação real para cada touro será maior do que em qualquer dos sumários e sempre será vantajoso reunir informação.

Embora seja óbvio, é importante ressaltar que, para aplicar o MACE, devem existir alguns touros com avaliações em dois ou mais sumários, ou seja, que os sumários sejam suficientemente conectados. De maneira geral, os touros Nelore usados em IA no país estão bem conectados e permitem uma consolidação. Mesmo assim, é necessário manter vigilância para que cada safra de touros jovens seja bem conectada com as anteriores, mesmo dentro de um mesmo programa.

Exemplo 1

Este exemplo hipotético procura ilustrar o modelo MACE para uma situação simplificada (sem grupos genéticos) e um pouco do tipo de cálculo que é feito para chegar a um sumário consolidado. A Tabela 1 abaixo mostra a distribuição de um total de 750 produtos de 7 touros (Nel1, Nel2,., Nel7) em 3 sumários (A, B e C). Todos os números são expressivos, a estrutura é bem melhor conectada e balanceada do que se pode esperar na prática e os touros Nel1, Nel2 e Nel3 fornecem as ligações genéticas diretas entre os sumários.

Tabela 1. EXEMPLO 1 : distribuição dos produtos de 7 touros nos 3 sumários.

A Tabela 2 apresenta os efeitos verdadeiros dos sumários e dos touros, em vermelho, nos cabeçalhos e nas chamadas das linhas da tabela. Não são apresentadas unidades (%, kg, unidades de escores, etc.) para estes valores. A combinação ou soma destes efeitos é apresentada no corpo da tabela e representa o efeito do touro que seriam observado dentro de um sumário caso nenhum efeito de amostragem, interação ou erro de qualquer origem ocorresse. Na ausência de uma verdadeira interação genótipo-ambiental, os efeitos dos sumários devem ser entendidos como efeitos puramente ambientais e refletem as decisões de escolha de base genética. Um efeito de sumário igual a zero indicaria que, provavelmente, este sumário utiliza um conceito de base móvel. Se a média dos touros utilizados em IA e presentes neste sumário também fosse zero, isto significaria que a média dos animais todos avaliados não é muito diferente daquela dos animais de IA. Esta seria a situação do Sumário A.

Um efeito maior do que zero para sumário indica que foi escolhido como base genética um conjunto de animais abaixo da média da população. É aborrecedor ter que se lembrar que, quando olhamos para dados de DEP´s para peso à desmama de touros Angus dos USA, temos que descontar perto de 40 libras para ter uma idéia de quais animais estão acima ou abaixo da média genética atual naquela população. Este tipo de filosofia de negócio de curto prazo poderia facilitar alguma venda imediata de sêmen do pior touro (Nel5). O touro Nel3, com efeito genético real de -10, é avaliado como -10 no Sumário A (efeito de 0 deste sumário); +10 no Sumário B (efeito de 20 deste sumário) e -20 no Sumário C (efeito de -10 deste sumário).

Tabela 2. EXEMPLO 1 : Efeitos genéticos verdadeiros de 7 touros no geral e dentro dos 3 sumários e efeitos ambientais verdadeiros dos três sumários.

As seguintes etapas não serão aqui apresentadas:

(1) regredir os efeitos dos touros para obter as DEP´s iniciais dos sumários (os regressores seriam tão mais próximos de 0,00 e mais afastados de 1,00 a medida que as acurácias das avaliações ou o tamanho das progênies apresentadas na Tabela 1 fossem menores);
(2) “des-regredir” estas DEP´s para obter os efeitos dos touros obtidos em cada conjunto de dados (como apresentadas na Tabela 2); e
(3) regredir novamente os efeitos gerais estimados a partir da aplicação do MACE.

Se fizermos o produto da primeira coluna da Tabela 1 pela primeira coluna da Tabela 2 obteremos a primeira das equações resultantes da aplicação do MACE para o presente exemplo. Os 250 produtos do Sumário A conterão 250 vezes o efeito deste sumário (250*0), 100 vezes o efeito do touro Nel1 (100*10), 50 vezes o efeito do touro Nel2 (50*0) e 100 vezes o efeito do touro Nel3 (100*(-10)). O somatório dos dois produtos dos dois conjuntos de efeitos destas tabelas, contidos nas colunas respectivas ao Sumário A é zero. Esta equação contem 4 incógnitas (os efeitos do sumário A e dos touros Nel1, Nel2 e Nel3) e precisamos determinar quais são positivas e quais são negativas (e o quanto). Claro que esta equação sozinha não pode nos auxiliar pois existe um número infinito de soluções possíveis. Os produtos das respectivas colunas (3) e das linhas (7) de cada uma destas duas tabelas pode ser utilizada para nos produzir 10 equações com 10 incógnitas (3 sumários e 7 touros).

Estas 10 equações formam as chamadas “equações normais”. As deste problema são apresentadas a seguir, na forma matricial. O que se quer é uma solução simultânea para este conjunto de equações; fora a magnitude, é o mesmo problema que todos vimos nos bancos escolares nos sistemas de 2 equações com 2 incógnitas, 3 equações…. Em algumas situações de melhoramento animal, milhões destas equações são formadas.

A primeira linha representa a equação do Sumário A, descrita acima. A quarta linha é a linha do touro Nel1 e é obtida pelo produto dos elementos da primeira linha da Tabela 1 pelos elementos da primeira linha da Tabela 2. Esta linha contem toda a informação referente aos 150 produtos do touro Nel1. Estes 150 produtos contem 100 vezes o efeito do Sumário A, 50 vezes o efeito do Sumário C e 150 vezes o efeito do touro Nel1. A soma ponderada destas 150 observações é 1000, apresentada na linha 4, última coluna, destas equações.

Equações normais resultantes da aplicação do MACE no exemplo 1:

É relevante dizer que estas 10 equações com 10 incógnitas não possuem uma solução única pois a soma das três primeiras equações (totalizando as Tabelas 1 e 2 por colunas) é igual a soma das 7 últimas (totalizando as Tabelas 1 e 2 por linhas). Esta é a origem da necessidade da determinação das chamadas bases genéticas.

Na prática isto exige que se imponha alguma restrição, por exemplo: (1) zerando o valor de um determinado touro ou (2) zerando a soma de alguns ou de todos os touros. A opção (1) vai na direção de uma base genética fixa e a opção (2) representa casos de bases genéticas móveis. Qualquer alternativa é igualmente eficiente para eliminar esta dependência que existe entre as equações e uma delas deve ser adotada. Tecnicamente, qualquer opção é igualmente meritória pois o ranking dos animais e os contrastes entre sumários darão sempre o mesmo resultado. Mas o assunto carrega implicações comerciais e/ou educacionais não triviais.

Uma outra solução possível é escolher um dos sumários como base. Impondo a restrição de que o sumário A seja igual a zero e resolvendo as equações normais do MACE, como apresentado acima, chegaremos ao seguinte conjunto de soluções:

Note que as soluções obtidas obedecem a restrição imposta. Como esta restrição é idêntica ao efeito verdadeiro do Sumário A (e como o exemplo foi montado sem a ocorrência de interações e outras fontes de erro), todas as soluções obtidas para sumários e para touros correspondem aos valores verdadeiros apresentados na Tabela 2. Note que a soma dos efeitos de Sumários e a soma dos efeitos de touros não somam a zero.

Exemplo 2

Na prática nunca será obtido um resultado tão perfeito. Imaginemos uma outra situação, dada pelo exemplo 2, onde por mero efeito de amostragem, os efeitos registrados no Sumário B para os touros Nel2 e Nel3 fossem os apresentados na Tabela 3, com uma diferença de 9.9 e não mais 10.0.

Tabela 3. EXEMPLO 2 : Efeitos genéticos verdadeiros de 7 touros e efeitos ambientais verdadeiros dos três sumários. Existe uma interação entre touros (Nel2 e Nel3) e sumários (A e B).

Na Tabela 2 (Exemplo 1), a diferença entre os touros Nel2 e Nel3 é de exatas 10 unidades tanto no sumário A quanto no sumário B. No presente exemplo 2, esta diferença é 10 unidades no sumário A (como antes) e de 9.9 unidades no sumário B. Esta diferença é uma das menores que se pode imaginar mas serve para demonstrar que o modelo MACE é capaz de agregar, ponderando adequadamente, diferentes fontes de informação contendo informações não exatamente redundantes.

No exemplo 2, novas equações podem ser montadas, com diferenças nos somatórios dos produtos por sumário e por touro, e um novo vetor de soluções pode ser obtido.

Com o uso da mesma restrição do exemplo anterior, obtêm-se um novo vetor de soluções que é apresentado ao lado. Este vetor de soluções foi obtido pelo chamado método de quadrados mínimos, de forma a obter a menor soma dos quadrados dos resíduos possível ou, no caso, de melhor compatibilizar as informações decorrentes dos contrastes possíveis entre os 3 primeiros touros presentes nos três sumários. O touro Nel2 agora é superior ao touro Nel3 em 9,952 unidades [-0,034-(-9,986)], situando-se entre os valores de 9,95 e 10,0. As soluções para os outros efeitos também foram afetadas, com magnitude mínima, como esperado.

Talvez o conceito mais importante sendo demonstrado é o de que existe um procedimento simples capaz de reunir a informação de diferentes sumários publicados. Para utilizar este procedimento, basta que existam alguns touros em comum entre os sumários.

Conclusões ou comentários finais

O modelo MACE, utilizado para combinar informações de sumários nacionais nas raças de leite, através da agência INTERBULL pode ser simplificado e utilizado para a situação dos vários sumários da raça Nelore.

Mesmo que não seja a melhor opção possível ou que não seja aplicada da sua forma mais avançada ou sofisticada, os resultados deverão ser, em média, mais próximos da verdade do que o exercício feito por técnicos e criadores que tentam agregar todas estas informações através de cálculos ou ponderações mentais.

O objetivo maior deste exercício é o de provocar a unificação dos sumários da raça Nelore, pela reunião de esforços e dos bancos de dados ou, enquanto isto não ocorre, pelo aperfeiçoamento do modelo MACE com a participação de todos os grupos envolvidos e o fornecimento de toda a informação necessária.

Referências

Banos, G. 1999. Identifying genetically superior stock across country. In: Lopes et al. (1999). Anais do Simpósio Internacional de Genética e Melhoramento Animal. UFV, Viçosa, MG. 21-34

Schaeffer, L.R. 1985. Model for international evaluation of dairy sires. LPS (12): 105-115.

Schaeffer, L.R. 1994. Multiple country comparison of dairy sires. JDS (77): 2671-2678.

Schaeffer, L.R. 1996. Multiple country evaluations. in: Tópicos avançados em melhoramento animal. UNESP, Jaboticabal, SP, 11-15. (mimeo)

*Este trabalho foi apresentado durante o III Simcorte, realizado em 29/5 a 1/6 de 2002 em Viçosa/MG
_____________________________________
1GenSys Consultores Associados S/C Ltda
Lagoa da Serra Ltda

Os comentários estão encerrados.