Ver ítem
- xmlui.general.dspace_homeCentros e Institutos de InvestigaciónCICVyA. Centro de Investigación en Ciencias Veterinarias y AgronómicasInstituto de GenéticaPresentaciones a Congresosxmlui.ArtifactBrowser.ItemViewer.trail
- Inicio
- Centros e Institutos de Investigación
- CICVyA. Centro de Investigación en Ciencias Veterinarias y Agronómicas
- Instituto de Genética
- Presentaciones a Congresos
- Ver ítem
Imputación de genotipos faltantes mediante algoritmos de machine learning = Imputation of missing genotypes using machine learning algorithms
Resumen
Resumen. La imputación o inferencia de genotipos faltantes utilizando correlaciones entre variantes obtenidas a partir de paneles de referencia puede ser
llevada a cabo por programas específicos basados en la utilización de información genética familiar y/o poblacional o mediante la implementación de algoritmos de machine learning. El objetivo de este trabajo fue evaluar la precisión en la imputación lograda mediante distintas estrategias de machine
[ver mas...]
Resumen. La imputación o inferencia de genotipos faltantes utilizando correlaciones entre variantes obtenidas a partir de paneles de referencia puede ser
llevada a cabo por programas específicos basados en la utilización de información genética familiar y/o poblacional o mediante la implementación de algoritmos de machine learning. El objetivo de este trabajo fue evaluar la precisión en la imputación lograda mediante distintas estrategias de machine learning, tras comparar genotipos imputados con los obtenidos por genotipificación con un microarreglo de mediana densidad de SNPs. Sobre una base de datos con genotipos de 966 ovinos en 57.876 SNPs, con 53,4% de genotipos faltantes, se exploraron tres estrategias de imputación basadas en el algoritmo random forest. Un subconjunto de los genotipos imputados, correspondientes a 232 animales en
30.924 SNPs, fue comparado con genotipos obtenidos por genotipificación. El porcentaje de concordancia obtenido para las tres estrategias fue de alrededor de 60%. Este bajo porcentaje puede atribuirse a la gran cantidad de genotipos no
asignados del archivo de partida. Una estrategia para aumentar la precisión de la imputación podría ser aumentar el número de animales en la población de
referencia y, de este modo, reducir la proporción de genotipos faltantes en el conjunto de datos.
[Cerrar]
Abstract. The imputation or inference of missing genotypes using correlations
between variants obtained from reference panels can be carried out by specific
programs that utilize family and/or population genetic information or by
implementing machine learning algorithms. The objective of this study was to
evaluate the imputation accuracy achieved using different machine learning
strategies by comparing imputed genotypes with those obtained by
[ver mas...]
Abstract. The imputation or inference of missing genotypes using correlations
between variants obtained from reference panels can be carried out by specific
programs that utilize family and/or population genetic information or by
implementing machine learning algorithms. The objective of this study was to
evaluate the imputation accuracy achieved using different machine learning
strategies by comparing imputed genotypes with those obtained by genotyping
with a medium-density SNP microarray. To compare the performance of three
imputation strategies using the random forest algorithm, we analyzed a database
containing 966 sheep genotyped at 57,876 SNPs, where 53.4% of the data was
missing. A subset of the imputed genotypes, corresponding to 232 animals at 30,924 SNPs, was compared with genotypes obtained by genotyping. The percentage of concordance obtained for the three strategies was approximately 60%. This low percentage can be attributed to the large number of missing genotypes in the source file. One strategy for increasing imputation accuracy would be to increase the number of animals in the reference population and thus reduce the proportion of missing genotypes in the data set.
[Cerrar]

Descripción
Publicado en: JAIIO, Jornadas Argentinas de Informática
Revista de la Sociedad Argentina de Informática e Investigación Operativa (SADIO), 11 (3) : 155-165 (2025)
Fuente
54as Jornadas Argentinas de Informática e Investigación Operativa (54 JAIIO) , 17o Congreso Argentino de AgroInformática (CAI 2025), Ciudad de Buenos Aires, 4 al 7 de agosto de 2025
Fecha
2025-08
Editorial
Sociedad Argentina de Informática e Investigación Operativa (SADIO)
ISSN
2451-7496
Formato
pdf
Tipo de documento
documento de conferencia
Palabras Claves
Derechos de acceso
Abierto
Excepto donde se diga explicitamente, este item se publica bajo la siguiente descripción: Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Unported (CC BY-NC-SA 2.5)


