Mostrar el registro sencillo del ítem

resumen

Resumen
Resumen. La imputación o inferencia de genotipos faltantes utilizando correlaciones entre variantes obtenidas a partir de paneles de referencia puede ser llevada a cabo por programas específicos basados en la utilización de información genética familiar y/o poblacional o mediante la implementación de algoritmos de machine learning. El objetivo de este trabajo fue evaluar la precisión en la imputación lograda mediante distintas estrategias de machine [ver mas...]
 
Abstract. The imputation or inference of missing genotypes using correlations between variants obtained from reference panels can be carried out by specific programs that utilize family and/or population genetic information or by implementing machine learning algorithms. The objective of this study was to evaluate the imputation accuracy achieved using different machine learning strategies by comparing imputed genotypes with those obtained by [ver mas...]
 
dc.contributor.authorRaschia, Maria Agustina
dc.contributor.authorRios, Pablo Javier
dc.contributor.authorCordoba, Marcela Elisabet
dc.contributor.authorCaffaro, María Eugenia
dc.contributor.authorDonzelli, María Valeria
dc.contributor.authorMaizon, Daniel Omar
dc.contributor.authorDemitrio, Daniel Arturo
dc.contributor.authorPoli, Mario Andres
dc.date.accessioned2025-08-08T15:13:51Z
dc.date.available2025-08-08T15:13:51Z
dc.date.issued2025-08
dc.identifier.issn2451-7496
dc.identifier.urihttp://hdl.handle.net/20.500.12123/23378
dc.identifier.urihttps://revistas.unlp.edu.ar/JAIIO/article/view/19680
dc.descriptionPublicado en: JAIIO, Jornadas Argentinas de Informática Revista de la Sociedad Argentina de Informática e Investigación Operativa (SADIO), 11 (3) : 155-165 (2025)
dc.description.abstractResumen. La imputación o inferencia de genotipos faltantes utilizando correlaciones entre variantes obtenidas a partir de paneles de referencia puede ser llevada a cabo por programas específicos basados en la utilización de información genética familiar y/o poblacional o mediante la implementación de algoritmos de machine learning. El objetivo de este trabajo fue evaluar la precisión en la imputación lograda mediante distintas estrategias de machine learning, tras comparar genotipos imputados con los obtenidos por genotipificación con un microarreglo de mediana densidad de SNPs. Sobre una base de datos con genotipos de 966 ovinos en 57.876 SNPs, con 53,4% de genotipos faltantes, se exploraron tres estrategias de imputación basadas en el algoritmo random forest. Un subconjunto de los genotipos imputados, correspondientes a 232 animales en 30.924 SNPs, fue comparado con genotipos obtenidos por genotipificación. El porcentaje de concordancia obtenido para las tres estrategias fue de alrededor de 60%. Este bajo porcentaje puede atribuirse a la gran cantidad de genotipos no asignados del archivo de partida. Una estrategia para aumentar la precisión de la imputación podría ser aumentar el número de animales en la población de referencia y, de este modo, reducir la proporción de genotipos faltantes en el conjunto de datos.spa
dc.description.abstractAbstract. The imputation or inference of missing genotypes using correlations between variants obtained from reference panels can be carried out by specific programs that utilize family and/or population genetic information or by implementing machine learning algorithms. The objective of this study was to evaluate the imputation accuracy achieved using different machine learning strategies by comparing imputed genotypes with those obtained by genotyping with a medium-density SNP microarray. To compare the performance of three imputation strategies using the random forest algorithm, we analyzed a database containing 966 sheep genotyped at 57,876 SNPs, where 53.4% of the data was missing. A subset of the imputed genotypes, corresponding to 232 animals at 30,924 SNPs, was compared with genotypes obtained by genotyping. The percentage of concordance obtained for the three strategies was approximately 60%. This low percentage can be attributed to the large number of missing genotypes in the source file. One strategy for increasing imputation accuracy would be to increase the number of animals in the reference population and thus reduce the proportion of missing genotypes in the data set.eng
dc.formatapplication/pdfes_AR
dc.language.isospaes_AR
dc.publisherSociedad Argentina de Informática e Investigación Operativa (SADIO)es_AR
dc.rightsinfo:eu-repo/semantics/openAccesses_AR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/es_AR
dc.source54as Jornadas Argentinas de Informática e Investigación Operativa (54 JAIIO) , 17o Congreso Argentino de AgroInformática (CAI 2025), Ciudad de Buenos Aires, 4 al 7 de agosto de 2025es_AR
dc.subjectAlgoritmoes_AR
dc.subjectAlgorithmseng
dc.subjectAprendizaje Automáticoes_AR
dc.subjectMachine Learningeng
dc.subjectPolimorfismo de Nucleótido Únicoes_AR
dc.subjectSingle Nucleotide Polymorphismseng
dc.subjectGenotipadoes_AR
dc.subjectGenotypingeng
dc.subject.otherInferencia de Genotipos Faltanteses_AR
dc.titleImputación de genotipos faltantes mediante algoritmos de machine learning = Imputation of missing genotypes using machine learning algorithmses_AR
dc.typeinfo:ar-repo/semantics/documento de conferenciaes_AR
dc.typeinfo:eu-repo/semantics/conferenceObjecteng
dc.typeinfo:eu-repo/semantics/publishedVersioneng
dc.rights.licenseCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)es_AR
dc.description.origenInstituto de Investigación Genética, INTAes_AR
dc.description.filFil: Raschia, Maria Agustina. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Genética; Argentinaes_AR
dc.description.filFil: Rios, Pablo Javier. Universidad de Buenos Aires (UBA); Argentinaes_AR
dc.description.filFil: Rios, Pablo Javier. Universidad Nacional de La Plata (UNLP). Facultad de Ciencias Exactas; Argentinaes_AR
dc.description.filFil: Cordoba, Marcela Elisabet. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Genética; Argentinaes_AR
dc.description.filFil: Caffaro, María Eugenia. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Genética; Argentinaes_AR
dc.description.filFil: Donzelli, María Valeria. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Genética; Argentinaes_AR
dc.description.filFil: Donzelli, María Valeria. Facultad de Ciencias Agrarias. Universidad Nacional de Lomas de Zamora (UNLZ); Argentinaes_AR
dc.description.filFil: Maizon, Daniel Omar. Instituto Nacional de Tecnología Agropecuaria (INTA). Estación Experimental Agropecuaria Anguil; Argentinaes_AR
dc.description.filFil: Maizon, Daniel Omar. Universidad Nacional de La Pampa (UNLP). Facultad de Agronomía; Argentinaes_AR
dc.description.filFil: Demitrio, Daniel Arturo. Instituto Nacional de Tecnología Agropecuaria (INTA). Coordinación Nacional de Relaciones Institucionales y Vinculación Tecnológica; Argentinaes_AR
dc.description.filFil: Demitrio, Daniel Arturo. Universidad Nacional de La Plata (UNLP). Facultad de Ciencias Exactas; Argentinaes_AR
dc.description.filFil: Poli, Mario Andres. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Genética; Argentinaes_AR
dc.description.filFil: Poli, Mario Andres. Universidad del Salvador (USAL). Facultad de Ciencias Agrarias y Veterinarias; Argentinaes_AR
dc.subtypeponenciaes_AR


Ficheros en el ítem

Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

common

Mostrar el registro sencillo del ítem

info:eu-repo/semantics/openAccess
Excepto si se señala otra cosa, la licencia del ítem se describe como info:eu-repo/semantics/openAccess