Download Interfaz de R a DMU package para el uso de los Modelos Mixtos
Document related concepts
no text concepts found
Transcript
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R Interfaz de R a DMU package para el uso de los Modelos Mixtos aplicado al Modelo (Animal) Genético Cuantitativo Mila Sánchez Mayor Dr. Juan José Arranz Santos1 Dra. Beatriz Gutiérrez Gil1 1 Departamento of Producción Animal Universidad of León León, España msancm@unileon.es 23 de Octubre del 2014 ULE Mila Sánchez Mayor 1/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R Contenido 1 2 3 4 5 ULE Introducción Introducción Modelo Mixto General Formulación del Modelo Mixto General Estimando los Efectos Fijos y Prediciendo los Efectos Aleatorios Ecuaciones del Modelo Mixto (MME) Modelos para la Estimación de los Breeding Values. Modelos para la Estimación de los Breeding Values Interfaz de R a DMU package para el uso de los Modelos Mixtos Software's para la estimación del Modelo Animal Genético Cuantitativo DMU package Módulos de DMU Interfaz de R a DMU Ejemplos de Animal Breeding Ejemplos usando Rdmuai Mila Sánchez Mayor 2/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R Introducción Existen diferentes enfoques estadísticos que permiten la eciente estimación de parámetros genéticos-cuantitativos bajo arbitrarios marcos, incluyendo aquellos involucrados en extensos pedigrís, desigual tamaños de familias, apareamiento selectivo, etc. Nosotros mostraremos el Modelo Mixto Lineal Generalizado, el cual abarca la mayoría de los problemas de estimación en diferentes situaciones de Animal Breeding; usualmente llamado Modelo Animal en el escenario de Animal Breeding. Explicaremos el método general BLUP (Best Linear Unbiased Prediction) para la predicción de los efectos aleatorios, donde esta metodología asume que las componentes de varianza apropiadas son conocidas. BLUP es ahora la técnica dominante para la estimación de los Breeding values. ULE Mila Sánchez Mayor 3/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R Formulación del Modelo Mixto General Sea el modelo mixto: y = X β + Zu + e √ y vector fenotípico con n observaciones. √ β vector con f efectos jos. √ u ∼ (0, G ) vector con q efectos aleatorios y Gqxq = Cov (ui , uj ) como la matriz de covarianzas de los efectos genéticos aleatorios. e ∼ (0, R) vector con los errores residuales y Rnxn = Cov (ei , ej ) como la matriz de covarianzas de los errores residuales (generalmente nosotros asumimos que los errores residuales tienen varianza constante y están incorrelacionados R = σE2 I ). √ X matriz de incidencia indicando para cada observación los efectos jos por el cual esta es inuenciada. √ Z matriz de incidencia indicando para cada observación los efectos aleatorios por el cual esta es inuenciada. √ ∴ implicando y ∼ (X β, V ) = (X β, ZGZ 0 + R) Podemos observar y , X and Z , pero β , u , R y G son generalmente desconocidos. ∴ Este modelo involucra 2 cuestiones de estimación complementarias: √ Estimación de los vectores de los efectos jos y aleatorios, β y u . √ Estimación de las matrices de covarianzas G y R . Donde estas matrices son generalmente asumidas a ser funciones de algunas componentes de varianzas desconocidas. ,: Si hay una simple observación por cada individuo, entonces Z = I y la matriz de covarianzas para el vector de observaciones (y ) es: V = σA2 A + σE2 I ULE Mila Sánchez Mayor 4/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R Estimando los Efectos Fijos y Prediciendo los Efectos Aleatorios El objetivo principal del análisis cuantitativo-genético es a menudo solamente estimar las componentes de varianza, pero también hay numerosas situaciones en las que las inferencias acerca de efectos jos y/o efectos aleatorios son la motivación central. Inferencia sobre los efectos jos son conocidos como estimaciones y las que se reeren a efectos aleatorios se conoce como predicciones. Hay muchos tipos de procedimientos para obtener estos estimadores y predictores, pero los procedimientos más utilizados son BLUE (mejor estimador lineal insesgado) y BLUP (mejor predictor lineal insesgado). Describiendo los términos de cada expresión: √ mejor: en el sentido que ellos minimizan la varianza muestral. lineal: porque ellos son funciones lineales de los fenotipos observados y . √ insesgados: E [BLUE (β)] = β and E [BLUP(u)] = u √ β̂ = (X 0 V −1 X )−1 X 0 V −1 y ULE and û = GZ 0 V −1 (y − X β̂) Mila Sánchez Mayor 5/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R Problemas con estos estimadores y predictores. Solución Nótece que las soluciones de las previas ecuaciones, requieren la inversa de la matriz de covarianzas V , pero cuando y contiene muchos miles de observaciones, este cálculo se puede dicultar. Henderson fue un estadístico americano y pionero en animal breeding. Él ofreció un método más compacto para conjuntamente obtener β̂ y û en la forma de estas Ecuaciones del Modelo Mixto (MME). X 0 R −1 X Z 0 R −1 X X 0 R −1 Z + G −1 Z 0 R −1 Z β̂ û = X 0 R −1 y Z 0 R −1 y Importancia del BLUP: es primariamente usado para la identicación de individuos con máximos méritos genéticos en programas de selección y para monitorar la respuesta de selección actual. En general, BLUP se ha convertido en el método de elección para la estimación de los valores genéticos de los individuos a partir largos y complejos pedigrís. Note: Para que BLUP sea el mejor estimador insesgado, las varianzas genéticas apropiados deben ser conocidos sin error. ULE Mila Sánchez Mayor 6/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R Introducción a los Modelos para la Estimación de los Breeding Values Hay numerosas maneras de formular el Modelo Mixto General para aplicar el análisis BLUP. Tres variantes especícas del modelo proporcionan la base para la mayoría de los métodos de estimación de los breeding values: √ Modelo Animal: estima los breeding values de cada individuo medido. Modelo Gamético: Estima los breeding values de los individuos medidos en términos de contribuciones de los padres, es decir, este modelo se utiliza a menudo cuando los valores genéticos de los padres son más preocupantes que los valores de sus descendencias. √ Modelo Animal Reducido: Combina aspectos de ambos modelos, Animal y Gamético en aplicaciones especícas en el cual los breeding values de los padres son los únicos de interés. El pedigrí contiene sólo los padres y sus hijos, ignorando las terceras generaciones y más allá. √ ULE Mila Sánchez Mayor 7/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R Software's para la estimación del Modelo Animal Genético Cuantitativo Existen diferentes programas que pueden ajustar el Modelo Animal de alguna manera, como son: √ √ √ √ √ √ √ √ ASReml BGF90 DFREML DMU MATVEC PEST/VCE WOMBAT entre otros... En nuestro centro utilizamos una interfaz de R para DMU con el propósito de facilitar la especicación del Modelo y los datos. ULE Mila Sánchez Mayor 8/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R DMU package El programa DMU fue desarrollado en el centro de Genómica y Genética Cuantitativa, del Departamento de Genética y Biología Molecular en la Universidad de Aarhus, Dinamarca. Dicho software fue publicado en el World Congress on Genetics Applied to Livestock Production 2006. DMU incluye diferentes módulos: √ DMU1 DMU4 √ DMU5 √ DMUAI √ entre otros... √ ULE Mila Sánchez Mayor 9/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R Módulos de DMU DMU1 : El análisis en DMU siempre comienza ejecutando el módulo de inicialización de DMU1 seguido por uno de los otros módulos en el paquete. Las tareas principales aquí son: leer el modelo y la descripción de los datos; chequear el modelo y los datos; escribir una recodicación de los datos y la información del modelo para el uso de los módulos siguientes. DMU4 : Este módulo puede ser usado para predecir futuras respuestas de efectos aleatorios, ejemplos, los breeding values; y para estimar los efectos jos tanto simples como múltiples a través de las ecuaciones del modelo mixto. DMU4 puede manejar el mismo tipo de modelos como DMUAI. DMU5 : Este puede ser utilizado para resolver múltiples características de las ecuaciones del modelo mixto basado en la iteración de datos. ULE Mila Sánchez Mayor 10/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R Módulos de DMU DMUAI : Este módulo utiliza el método de estimación REML para la estimación de las componentes de (co)varianzas usando los algoritmos de Average Information (AI) o Expectation Maximization (EM). DMUAI puede manejar modelos de regresión aleatorios, modelos con efectos maternos y los modelos con efectos de dominancia. También se puede utilizar para el análisis de QTL multivariante. La componente de varianza para cada QTL es estimable basada en las matrices de las IBD (Idénticos por Descendencias) facilitada por el usuario. Es posible ajustar diferentes tipos de modelos de IBD (gaméticos, genotípicos y cluster), métodos IBD (Linkage, Linkage Desequilibrium y combinados Linkage y Linkage Desequilibrium) y modelos genéticos (pleiotropic, close linkage, epistatic). Los efectos aleatorios con una estructura de correlación especíca puede ser manejado a través de una matriz de correlación inversa suministrado por el usuario. Estos se pueden utilizar para la predicción genómica basado en la matriz de relación genómica. ULE Mila Sánchez Mayor 11/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R Interfaz de R a DMU DMU está escrito en Fortran 90/95 y se ha desarrollado bajo Linux en estaciones de trabajo basadas en 32 y 64 bits. Ha sido adaptada a una variedad de sistemas UNIX y Windows (32 y 64 bits). Interfaz R: Una interfaz de R para DMU fue desarrollada con el propósito de facilitar la especicación de los modelos y los datos. Usando la interface, el modelo se especica a través de una fórmula del lenguaje de R, DMU se ejecuta y los resultados se devuelven a R. Funciones para resumir los resultados y extraer varias componentes del análisis son también proporcionados. De esta manera la interfaz de R para DMU hace posible combinar la potencia de cálculo de DMU con las diversas herramientas disponibles y exibles dentro de R. A modo de ejemplo, los scripts de secuencias de comandos de R hace que sea fácil usar DMU para ajustar modelos mixtos dentro de un bucle (por ejemplo para detectar QTL) y las facilidades grácas de R hace que sea fácil de visualizar los resultados. ULE Mila Sánchez Mayor 12/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R Describiendo la función DMUAI Description: The function uses the model formula language in R to describe the model and from this generates the les needed to do an analysis using dmuai. Afterwards dmuai is executed and results are returned to R. Usage: Rdmuai(formula, data, corlist = NULL, NOCOV = NULL, VARREST = NULL, family = NULL, rescale = !is.null(start), control = list(), start = NULL, weights, oset, data.le = "data.txt", dir.le = "test.DIR", generate.data.le=TRUE, execute=TRUE) execute.dmuai(object) read.dmuai(object) check.dmuai(object) summary.dmuai(object) convergence.dmuai(object) coef.dmuai(object) ULE Mila Sánchez Mayor 13/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R Ejemplos usando Rdmuai library(Rdmu) setwd("...") Pedigree ]]] Read pedigree le. Get the external pedigree le ]]]]]]]]] ped.obj <- PED(anim.ID,le="pedigree.txt") ]]]]]]]]] Run the null model MM0 <- Rdmuai(Tvalue ∼ (1|anim.ID), corlist=list(ped.obj), control=list(SOL=TRUE), execute=TRUE, data=myphe) ]]] Simple case. Run the mixed model for one SNP. Slightly more complicated by including a xed factor ]]]]]]]]] MM1 <- Rdmuai(Tvalue ∼ mySNP + (1|anim.ID), corlist=list(ped.obj), control=list(SOL=TRUE), execute=TRUE, data=myphe) ULE Mila Sánchez Mayor 14/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R Ejemplos usando Rdmuai Fuction PED: Creates a pedigree le with four columns 'id', 'sire', 'dam'/'maternal grandsire' and a 'sort' variable. The pedigree le is used by dmuai to construct a correlation matrix for the random eect. In most cases is that the random eect have correlated levels due to shared ancestors given in the pedigree structure. If considering more than one correlated additive eect (for example direct and maternal eect) then the variables should be seperated by 0 +0 . Fuction COR: Describes the correlation of the levels of given random factor(s). However, 'COR' has later shown to also been useful in genomic prediction, where the matrix is an extended genomic relationship matrix. ULE Mila Sánchez Mayor 15/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R Ejemplos usando Rdmuai Caso Multivariado: La manera de especicar los modelos multivariados son como un vector de fórmulas o usando una matrix de respuesta. MM2 <- Rdmuai(c(Tvalue1 ∼ mySNP + (1|anim.ID), Tvalue2 ∼ mySNP + (1|anim.ID)), data=myphe) MM3 ULE <- Rdmuai(cbind(Tvalue1, Tvalue2) ∼ mySNP + (1|anim.ID)), data=myphe) Mila Sánchez Mayor 16/17 Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R GRACIAS GRACIAS ULE Mila Sánchez Mayor 17/17