Cover
Börja nu gratis ilovepdf_merged (4).pdf
Summary
# Cómo funciona un estudio de asociación del genoma completo (GWAS)
Un estudio de asociación del genoma completo (GWAS) busca identificar variaciones genéticas, como los polimorfismos de un solo nucleótido (SNP), que están significativamente asociadas con un fenotipo particular en una población [3](#page=3) [5](#page=5).
### 1.1 Principios fundamentales del GWAS
El GWAS parte de la hipótesis de que la variación genética observada entre individuos está significativamente asociada con la variación fenotípica. Se enfoca en fenotipos que pueden ser cuantitativos, binarios o categóricos, y típicamente utiliza modelos de regresión lineal [5](#page=5).
### 1.2 Modelos estadísticos en GWAS
#### 1.2.1 Modelo de ANOVA de efectos fijos
El modelo básico para analizar la asociación entre un SNP y un fenotipo es un Análisis de Varianza (ANOVA) de efectos fijos. La ecuación general es [4](#page=4):
$$Y_i = \mu + G_i \beta + \varepsilon_i$$
Donde:
* $\mu$ es el intercepto, representando la media muestral para el fenotipo [4](#page=4).
* $G_i$ es el genotipo de un SNP para el individuo $i$, codificado como 0, 1, o 2 (correspondiente a alelos homocigotos, heterocigotos o el otro homocigoto) [4](#page=4).
* $\beta$ es el efecto estimado (aditivo) de cada copia del SNP sobre el fenotipo [4](#page=4).
* $\varepsilon_i$ es el término de error residual, que se asume distribuido normalmente [4](#page=4).
Este modelo asume que los residuos ($\varepsilon_i$) seguirán una distribución normal, lo cual es una suposición común en el modelado lineal [5](#page=5).
> **Tip:** Es crucial recordar que este modelo prueba una hipótesis específica: la variación genética se relaciona con la variación fenotípica [5](#page=5).
#### 1.2.2 Modelo de ANOVA de efectos aleatorios (corregido por parentesco)
Para controlar la estructura poblacional y las relaciones de parentesco que pueden inflar falsamente las asociaciones, se utiliza un modelo de ANOVA de efectos aleatorios. La ecuación se extiende a [8](#page=8):
$$Y_i = \mu + G_i \beta + u_i + \varepsilon_i$$
En este modelo:
* $\beta$ sigue capturando la asociación directa del SNP analizado [8](#page=8).
* $u_i$ representa los efectos aleatorios que absorben la correlación poligénica de fondo debida al parentesco. Si los individuos estuvieran emparentados, estos efectos de fondo podrían inflar artificialmente el valor de $\beta$ [8](#page=8).
* Se pueden incorporar otras covariables relevantes, como sexo o edad [8](#page=8).
La diferencia fundamental radica en que el ANOVA de efectos fijos estima $\beta$ sin considerar la estructura poblacional, lo que puede llevar a exageraciones en las asociaciones. En contraste, el ANOVA de efectos aleatorios estima $\beta$ mientras controla los efectos aleatorios ($u_i$) que codifican la covarianza genómica. Por esta razón, este modelo a menudo se denomina "GWAS con control genético" o "regresión corregida por parentesco" [9](#page=9).
> **Tip:** La corrección por parentesco es esencial para evitar falsos positivos en GWAS, especialmente en poblaciones con estructura genética compleja [9](#page=9).
### 1.3 Interpretación de resultados de un GWAS
Los resultados principales de un GWAS son:
1. **Valor p para cada SNP:** Se obtiene comparando el modelo completo (que incluye el genotipo del SNP) con un modelo nulo (sin el término de genotipo). Un valor p bajo indica una asociación estadísticamente significativa entre el SNP y el fenotipo [10](#page=10).
2. **Efecto del SNP sobre el fenotipo ($\beta$):** Este valor cuantifica la magnitud y dirección del impacto de cada copia del SNP en el fenotipo [10](#page=10).
3. **Puntuaciones de Riesgo Poligénico (PRS):** Estas puntuaciones se calculan como una suma ponderada de los efectos de múltiples SNPs asociados con un fenotipo, permitiendo estimar el riesgo genético total de un individuo. La fórmula general es:
$$PRSi = (G_{i1} \beta_1 + G_{i2} \beta_2 + ... + G_{ip} \beta_p)$$
Donde $G_{ij}$ es el genotipo del SNP $j$ para el individuo $i$, y $\beta_j$ es el efecto estimado de ese SNP [10](#page=10).
#### 1.3.1 Representación gráfica: El gráfico de Manhattan
Los resultados de un GWAS se visualizan comúnmente en un gráfico de Manhattan. En este gráfico [11](#page=11):
* El eje X representa la ubicación genómica de los SNPs a lo largo de los cromosomas [11](#page=11).
* El eje Y muestra el nivel de asociación (generalmente el logaritmo negativo del valor p) para cada SNP [11](#page=11).
Los picos altos en el gráfico de Manhattan indican SNPs con una asociación fuertemente significativa con el fenotipo de interés, sugiriendo la presencia de loci de riesgo genético [11](#page=11).
> **Example:** Un gráfico de Manhattan de un GWAS para la enfermedad de cálculos renales mostraría picos en las posiciones genómicas donde se encuentran variantes genéticas que aparecen con mayor frecuencia en individuos con la enfermedad [11](#page=11).
---
# Interpretación y limitaciones de los GWAS
Los estudios de asociación del genoma completo (GWAS) son herramientas poderosas para identificar asociaciones entre variantes genéticas y fenotipos, pero su interpretación requiere cautela debido a la naturaleza de los modelos estadísticos y la complejidad de las interacciones genotipo-ambiente [13](#page=13) [1](#page=1).
### 2.1 La naturaleza de la varianza explicada por los GWAS
Un hallazgo común de los GWAS es que un gen explica un cierto porcentaje de la varianza fenotípica. Sin embargo, es crucial entender que esto no implica necesariamente causalidad directa ni que ese gen "cause" esa proporción del fenotipo [12](#page=12) [29](#page=29) [2](#page=2).
#### 2.1.1 La falacia de la causalidad directa
La atribución de un porcentaje de varianza a un gen no significa que ese gen sea el único o el principal "causante" de esa parte del fenotipo. Por ejemplo, la asociación de un alelo HLA con la capacidad de comer con palillos se debe a la frecuencia diferencial de ese alelo en distintas poblaciones, no a una función inmunológica en la destreza manual [6](#page=6).
> **Tip:** Los GWAS identifican asociaciones estadísticas, no mecanismos biológicos causales directos. La interpretación de los resultados debe considerar la historia evolutiva, la demografía y otros factores contextuales.
#### 2.1.2 Comparación con ANOVA
Al igual que el Análisis de Varianza (ANOVA), los GWAS permiten medir cómo varía un fenotipo, pero no explican necesariamente las causas subyacentes de esa variación [1](#page=1).
### 2.2 La tautología de la ecuación de GWAS y la descomposción de la varianza
La interpretación de los efectos genéticos y ambientales en los GWAS se basa en una reformulación de la ecuación fenotípica que revela una naturaleza tautológica, donde los componentes se definen de manera que la suma siempre reproduzca el fenotipo observado [19](#page=19) [21](#page=21).
#### 2.2.1 Reformulación de la ecuación fenotípica
La ecuación fenotípica se puede expresar como:
$$Y_i - \mu = (G_i - \mu) + (E_i - \mu) + (G_iE_i) + \epsilon_i$$ [19](#page=19).
Donde:
* $\mu$ es la puntuación media de todos los individuos de la población [20](#page=20).
* $Y_i$ es la puntuación fenotípica del individuo en cuestión [20](#page=20).
* $G_i$ es la puntuación media de todos los individuos con el mismo genotipo que el individuo en cuestión [20](#page=20).
* $E_i$ es la puntuación media de todos los individuos con el mismo entorno que el individuo en cuestión [20](#page=20).
* $G_iE_i$ representa la interacción genotipo-entorno, la parte de la desviación media que no se atribuye a la suma simple de las desviaciones genotípicas y ambientales por separado [20](#page=20).
* $\epsilon_i$ representa cualquier desviación individual residual, considerada aleatoria [20](#page=20).
#### 2.2.2 La naturaleza tautológica de la ecuación
En esta reformulación, lo que antes era un parámetro estimable ($\beta$) se convierte en un componente fenotípico definido a posteriori. Lewontin argumenta que esta ecuación es tautológica porque los "efectos" genéticos y ambientales no se estiman a partir de causas empíricas, sino que se definen de manera que su suma reproduzca el fenotipo observado. Una tautología es una afirmación verdadera por definición, como decir "todos los solteros son personas no casadas", que no aporta nueva información empírica [21](#page=21).
#### 2.2.3 Limitaciones de la medición
Esta aproximación no mide cómo varían los genotipos o los ambientes en sus propias unidades (ej. temperatura, concentración de nutrientes); todo está expresado en unidades fenotípicas. Lo que se mide es cuánto cambia el fenotipo, en promedio, al variar el ambiente o al comparar individuos con genotipos diferentes. Los GWAS no revelan cómo genes y ambiente producen el fenotipo; simplemente reparten la variación fenotípica en categorías (genético, ambiental, interacción), definidas de tal forma que la suma siempre cuadre [22](#page=22).
> **Tip:** Es crucial recordar que los GWAS descomponen la varianza fenotípica observada *en la muestra estudiada y en el contexto específico de esa muestra*. Esto no equivale a una descomposición causal fundamental.
### 2.3 Interpretación correcta de los hallazgos de GWAS
La interpretación de los resultados de GWAS debe ser cuidadosa, considerando que las ecuaciones se basan en medias y que los modelos lineales son locales [23](#page=23).
#### 2.3.1 El término ambiental y su dependencia del genotipo
El término $(E_i - \mu)$ puede ser pequeño por dos razones:
1. No hay variación ambiental significativa en la población estudiada.
2. El genotipo en cuestión es insensible a la variación ambiental observada [23](#page=23).
Esto plantea cuestiones como si la inferioridad de un grupo racial o la superioridad genética de los ricos son explicables por estas diferencias [23](#page=23).
#### 2.3.2 El impacto de las medias y el contexto
Los valores de $E_i$ (media para un entorno dado promediada sobre todos los genotipos) y $G_i$ (media para un genotipo dado promediada sobre todos los entornos) cambian con el contexto poblacional y ambiental. Por lo tanto, los resultados obtenidos en un estudio pueden variar si cambian las medias poblacionales o ambientales [23](#page=23).
#### 2.3.3 Modelos lineales como aproximaciones locales
Un modelo lineal es una aproximación local. No se puede extrapolar fácilmente a otros ambientes, lugares o poblaciones genéticamente distintas [23](#page=23).
> **Tip:** La extrapolación de resultados de GWAS a poblaciones o entornos diferentes a los del estudio original es un error común y debe evitarse sin una validación rigurosa.
### 2.4 La importancia de la interacción genotipo-entorno (GxE) y la norma de reacción
La interacción genotipo-entorno (GxE) es fundamental para entender la relación entre genes, ambiente y fenotipo [25](#page=25).
#### 2.4.1 Norma de reacción
La norma de reacción describe la relación entre genotipo (G), entorno (E) y fenotipo (F). En todos los casos, el fenotipo es sensible a cambios en E y G, y ambos causan cambios en F. Los gráficos de norma de reacción ilustran diversos escenarios [25](#page=25):
* Interacción GxE: Un genotipo puede ser superior a otro en promedio, pero esta relación puede invertirse bajo ciertas condiciones ambientales [25](#page=25).
* Efectos ambientales y diferencias entre genotipos: Se pueden observar diferencias entre genotipos que son consistentes o variables en función del ambiente [25](#page=25).
* Ausencia de efecto ambiental con fuerte interacción GxE: El ambiente no influye en promedio, pero la respuesta de los genotipos al ambiente es diferencial [25](#page=25).
#### 2.4.2 Aditividad y su escasa evidencia
La aditividad ocurre cuando las diferencias entre genotipos son las mismas en todos los entornos y las diferencias entre entornos son las mismas para todos los genotipos. Solo en casos de alta aditividad se pueden aspirar a encontrar relaciones funcionales robustas entre genotipos y fenotipos. Sin embargo, la evidencia empírica de una relación aditiva entre genotipos y entorno a gran escala es limitada [26](#page=26) [28](#page=28).
> **Tip:** La norma de reacción es una herramienta conceptual clave para visualizar cómo el mismo genotipo puede producir diferentes fenotipos en distintos entornos, y cómo diferentes genotipos pueden responder de manera diversa a un mismo entorno.
#### 2.4.3 Predicción y distancia genética
Cuando la aditividad es baja, la predicción del valor de un fenotipo en otra población se vuelve imprecisa, especialmente a medida que aumenta la distancia genética con la población de origen utilizada para estimar las varianzas [28](#page=28).
> **Tip:** No confundir la heredabilidad (porcentaje de varianza atribuida a factores genéticos en una población específica y en un entorno dado) con la determinancia genética directa del fenotipo [30](#page=30).
### 2.5 Conclusiones y advertencias
La interpretación de los GWAS debe basarse en una comprensión profunda de sus limitaciones. Es vital no confundir las asociaciones estadísticas con causalidad directa y considerar la complejidad de las interacciones genotipo-entorno [28](#page=28) [30](#page=30).
> **Tip:** Ante afirmaciones sobre la "heredabilidad" de un carácter, recordar siempre los conceptos de Lewontin y las normas de reacción. No confundir el "mapa" estadístico (la varianza explicada) con el "territorio" biológico (los mecanismos causales) [30](#page=30).
#### 2.5.1 El problema de la extrapolación
La búsqueda continua de métodos para estimar cantidades que pueden ser "inútiles" o mal interpretadas, como la descomposición de la varianza en contextos locales, puede desviar la atención de problemas reales. Los modelos lineales son locales y no deben extrapolarse sin precaución [23](#page=23) [28](#page=28).
#### 2.5.2 Implicaciones para la investigación
Se sugiere detener la búsqueda interminable de métodos para estimar cantidades que carecen de valor global o que han sido mal interpretadas. Hay muchos problemas reales en los que enfocar la investigación genética y bioestadística [28](#page=28).
Ejemplos de variantes genéticas asociadas con el cáncer de mama y próstata, junto con sus frecuencias alélicas y tamaños de efecto, ilustran los datos que típicamente se obtienen de los GWAS. Estos datos, aunque valiosos para identificar asociaciones, requieren una interpretación contextualizada [14](#page=14) [15](#page=15).
---
# El concepto de norma de reacción
El concepto de norma de reacción explica cómo los genotipos y los entornos interactúan para producir fenotipos.
## 3. El concepto de norma de reacción
La norma de reacción describe la relación entre el genotipo ($G$), el entorno ($E$) y el fenotipo ($F$). En todos los casos, el fenotipo es sensible tanto a los cambios en el entorno como a los cambios en el genotipo, y ambos contribuyen a las modificaciones en el fenotipo [25](#page=25).
### 3.1 Definición y componentes
La norma de reacción se define formalmente como la relación entre genotipo y fenotipo. Esto implica que tanto el genotipo como el entorno son causantes de cambios en el fenotipo [25](#page=25).
### 3.2 Tipos de interacciones genotipo-entorno
Se pueden observar diferentes patrones de interacción entre genotipos y entornos que resultan en distintos fenotipos:
* **Interacción $G \times E$**: Un genotipo ($G1$) puede ser, en promedio, superior a otro ($G2$), y el fenotipo ($F$) puede disminuir a medida que aumenta el entorno ($E$). Sin embargo, si el entorno es pequeño, $G2$ puede ser superior a $G1$ [25](#page=25).
* **Efecto principal del entorno**: Puede no haber una diferencia clara entre $G1$ y $G2$ en promedio, pero el fenotipo ($F$) siempre aumenta con el entorno ($E$) [25](#page=25).
* **Fuerte interacción $G \times E$ sin efecto del entorno**: Puede no haber un efecto discernible del entorno, pero $G1$ es mayor que $G2$, y existe una fuerte interacción entre genotipo y entorno [25](#page=25).
### 3.3 Aditividad entre efectos genotípicos y ambientales
Un caso particular de norma de reacción es cuando existe aditividad entre los efectos genotípicos y ambientales. En esta situación, las diferencias entre genotipos son constantes en todos los entornos, y las diferencias entre entornos son las mismas para todos los genotipos [26](#page=26).
> **Tip:** Solo en el caso de aditividad entre genotipos y entornos podemos aspirar a encontrar relaciones funcionales claras entre genotipos y fenotipos [26](#page=26).
### 3.4 Evidencia empírica
La existencia de pruebas empíricas que respalden la aditividad entre genotipos y entornos ha sido objeto de investigación. Cincuenta años después de la conceptualización de la norma de reacción, la evidencia sobre una relación aditiva entre genotipos y entorno continúa siendo relevante [26](#page=26) [27](#page=27).
---
## Errores comunes a evitar
- Revise todos los temas a fondo antes de los exámenes
- Preste atención a las fórmulas y definiciones clave
- Practique con los ejemplos proporcionados en cada sección
- No memorice sin entender los conceptos subyacentes
Glossary
| Término | Definición |
|------|------------|
| Estudio de Asociación del Genoma Completo (GWAS) | Un tipo de estudio genético que identifica variantes genéticas asociadas a enfermedades o rasgos. Examina todo el genoma de los individuos para encontrar diferencias genéticas que se presenten con mayor frecuencia en personas con una enfermedad particular. |
| Fenotipo | Las características observables de un individuo, que son el resultado de la interacción entre su genotipo y el medio ambiente. Incluye características físicas, bioquímicas y de comportamiento. |
| Genotipo | La composición genética de un organismo o individuo, específicamente en relación con un rasgo particular. Se refiere a las variantes genéticas (alelos) que posee un individuo. |
| Alelo | Una de dos o más versiones alternativas de un gen que se encuentran en la misma posición (locus) en un cromosoma. Los alelos pueden codificar diferentes características. |
| Variancia | Una medida estadística de la dispersión o propagación de un conjunto de datos. Indica cuánto se desvían los valores de la media del conjunto de datos. En genética, mide la variabilidad en un rasgo. |
| SNP (Polimorfismo de Nucleótido Único) | Una variación en una sola base nitrogenada del ADN que ocurre en una población en una frecuencia suficientemente alta. Son marcadores genéticos comunes utilizados en estudios de asociación. |
| ANOVA (Análisis de Varianza) | Un método estadístico utilizado para comparar las medias de dos o más grupos. Divide la variabilidad total observada en diferentes fuentes para determinar qué factores tienen un efecto significativo. |
| Intercepto (μ) | En un modelo estadístico, es el valor de la variable dependiente cuando todas las variables independientes son cero. Representa la media base del fenotipo en ausencia de efectos genéticos o ambientales específicos. |
| Efecto Aditivo (β) | El cambio promedio en el fenotipo asociado con la adición de una copia de un alelo particular de un SNP. Se asume que los efectos de diferentes alelos se suman linealmente. |
| Error Residual (εi) | La parte de la variabilidad en la variable dependiente que no puede ser explicada por las variables independientes incluidas en un modelo estadístico. Incluye factores no medidos y aleatoriedad. |
| Modelo Lineal | Un modelo estadístico en el que la relación entre la variable dependiente y las variables independientes se representa como una suma lineal. Asume que las variables contribuyen de forma independiente y aditiva. |
| Estructura Poblacional | Las diferencias genéticas y demográficas entre subgrupos dentro de una población. Ignorar la estructura poblacional puede llevar a falsos positivos en estudios de asociación. |
| Covarianza Genómica | La tendencia de los individuos emparentados a compartir más alelos similares, lo que puede inflar las asociaciones genéticas observadas si no se controla adecuadamente. |
| Valor p | La probabilidad de observar un resultado de estudio tan extremo, o más extremo, que el obtenido, asumiendo que la hipótesis nula es verdadera. Un valor p bajo sugiere evidencia en contra de la hipótesis nula. |
| Puntuación de Riesgo Poligénico (PRS) | Una medida que estima la predisposición genética de un individuo a una enfermedad o rasgo particular. Se calcula sumando los efectos de múltiples variantes genéticas asociadas. |
| Manhattan Plot | Una representación gráfica utilizada en GWAS para mostrar los resultados de las pruebas de asociación. Cada punto representa un SNP, y la posición en el eje Y indica la significancia estadística de su asociación. |
| Norma de Reacción | Describe cómo un genotipo particular produce diferentes fenotipos en respuesta a variaciones ambientales. Ilustra la plasticidad fenotípica y la interacción genotipo-entorno. |
| Interacción Genotipo-Entorno (GxE) | Ocurre cuando el efecto de un gen sobre un fenotipo depende del entorno en el que se expresa, o viceversa. Significa que la relación entre gen y fenotipo no es fija. |
| Tautología | Una afirmación que es verdadera por definición y no proporciona información empírica nueva. En el contexto de GWAS, se refiere a que los componentes de la variación fenotípica se definen de tal manera que siempre sumarán el total observado. |