Las poblaciones utilizadas para crear algoritmos de predicción de dosis de warfarina carecían en gran medida de participantes que reportaran etnia hispana o latina. Si bien la investigación anterior sugiere que el modelado no lineal mejora la predicción de la dosis de warfarina, esta investigación se ha centrado principalmente en poblaciones con ascendencia principalmente europea. Comparamos la precisión de la predicción estable de la dosis de warfarina utilizando modelos de aprendizaje automático lineales y no lineales en una gran cohorte enriquecida para latinos estadounidenses y latinoamericanos (ULLA). Cada modelo se probó usando las mismas variables publicadas por el Consorcio Internacional de Farmacogenética de Warfarina (IWPC) y usando un conjunto ampliado de variables que incluyen el origen étnico y la indicación de warfarina. Utilizamos un modelo de regresión lineal múltiple y tres modelos de regresión no lineal: árboles de regresión aditivos bayesianos, splines de regresión adaptativa multivariante y regresión de vectores de soporte. Comparamos la capacidad de cada modelo para predecir la dosis estable de warfarina dentro del 20 % de la dosis estable real, confirmando los modelos entrenados en un conjunto de datos de prueba del 30 % con 100 rondas de remuestreo. En todos los pacientes (n = 7030), la inclusión de variables predictoras adicionales condujo a una mejora pequeña pero significativa en la predicción de la dosis en relación con el algoritmo del IWPC (47,8 frente a 46,7 % en IWPC, p = 1,43 × 10-15). Los modelos no lineales que utilizan variables IWPC no mejoraron significativamente la predicción de la dosis con respecto al algoritmo lineal IWPC. En pacientes ULLA solos (n = 1734), el IWPC se desempeñó de manera similar a todos los demás algoritmos farmacogenéticos lineales y no lineales. Nuestros resultados refuerzan la validez del IWPC en una población grande y étnicamente diversa y sugieren que las variables adicionales que capturan la variabilidad de la dosis de warfarina pueden mejorar los algoritmos de predicción de dosis de warfarina.
Populations used to create warfarin dose prediction algorithms largely lacked participants reporting Hispanic or Latino ethnicity. While previous research suggests nonlinear modeling improves warfarin dose prediction, this research has mainly focused on populations with primarily European ancestry. We compare the accuracy of stable warfarin dose prediction using linear and nonlinear machine learning models in a large cohort enriched for US Latinos and Latin Americans (ULLA). Each model was tested using the same variables as published by the International Warfarin Pharmacogenetics Consortium (IWPC) and using an expanded set of variables including ethnicity and warfarin indication. We utilized a multiple linear regression model and three nonlinear regression models: Bayesian Additive Regression Trees, Multivariate Adaptive Regression Splines, and Support Vector Regression. We compared each model’s ability to predict stable warfarin dose within 20% of actual stable dose, confirming trained models in a 30% testing dataset with 100 rounds of resampling. In all patients (n = 7,030), inclusion of additional predictor variables led to a small but significant improvement in prediction of dose relative to the IWPC algorithm (47.8 versus 46.7% in IWPC, p = 1.43 × 10−15). Nonlinear models using IWPC variables did not significantly improve prediction of dose over the linear IWPC algorithm. In ULLA patients alone (n = 1,734), IWPC performed similarly to all other linear and nonlinear pharmacogenetic algorithms. Our results reinforce the validity of IWPC in a large, ethnically diverse population and suggest that additional variables that capture warfarin dose variability may improve warfarin dose prediction algorithms.