Análisis de microarrays, preproceso. Calidad en la selección de genes diferencialmente expresados
Palabras clave:
microarrays, optimización de procesos, mejora de la calidadResumen
Como consecuencia del éxito de la tecnología de microarrays, aparecen en la literatura un gran número de experimentos realizados con los mismos. Sin embargo los problemas de estandarización y las numerosas fuentes de variabilidad hacen necesarias técnicas de validación a posteriori. Por este motivo se ha tratado de estudiar cómo influye en la selección de genes diferencialmente expresados algunas de las principales técnicas de preproceso. Muchos de los estudios realizados para comparar estas técnicas, se han llevado a cabo sobre experimentos cuyos resultados óptimos se conocen a priori con el fin de intentar determinar cuál presenta mayor precisión. En nuestro caso no conocemos el resultado correcto a priori y lo que se ha realizado es un análisis comparativo de los resultados obtenidos en cada caso con el fin de poder predecir el comportamiento a priori de cada una de las técnicas analizadas en función de diversos factores como distribución de los datos iniciales, patrones de expresión objeto de interés, presencia de outliers, etc.
Se han aplicado tres técnicas de preproceso sobre un experimento de microarrays. Las técnicas aplicadas son GCRMA, MBEI y MAS5. Se han encontrado en nuestros datos principalmente tres patrones de expresión en aquellos genes diferencialmente expresados y se ha demostrado estadísticamente que existe una asociación entre la técnica de preproceso utilizada y el patrón predominante en la misma. Esta tendencia se ha relacionado con la eficiencia en la detección de valores atípicos y con la magnitud de cambio detectada con cada una de ellas. Por el momento, no se ha podido establecer un estadístico significativo a la hora de confirmar la concordancia entre los tres métodos tras la selección de genes diferencialmente expresados.
Descargas
Referencias
AFFYMETRIX, (2002): “STATISTICAL ALGORITHMS DESCRIPTION DOCUMENT”. Technical Report, Affymetrix, Santa Clara, CA.
ARIAS-CASTRO, E. CANDES, E. J., AND PLAN, Y., (2010): “GLOBAL TESTING AND SPARSE ALTERNATIVES: ANOVA, MULTIPLE COMPARISONS AND THE HIGHER CRITICISM”. AR-XIV:1007.1434.
BREMER, M., HIMELBLAU, E. AND MADLUNG, A., (2010): “STATISTICAL METHODS IN MOLECULAR BIOLOGY”. METHODS IN MOLECULAR BIOLOGY, 620(3):287-313.
BUTTE, A. J., (2009): “BIOINFORMATIC AND COMPUTATIONAL ANALYSIS FOR GENOMIC MEDICINE. ESSENTIALS OF GENOMIC AND PERSONALIZED MEDICINE, CHAP. 10”. HUNTINGTON F. WILLARD AND GEO_REY S. GINSBURG, ELSEVIER, ACADEMIC PRESS.
CALZA, S., VALENTINI, D., AND PAWITAN, Y., (2008): “NORMALIZATION OF OLIGONUCLEOTIDE ARRAYS BASED ON THE LEAST-VARIANT SET
OF GENES”. BMC BIOINFORMATICS, 9(1):140.
DALGAARD, P., (2008): “INTRODUCTORY STATISTICS WITH R”. SPRINGER, 2ND EDITION.
DE BIN, R. AND RISSO, D., (2011). “A NOVEL APPROACH TO THE CLUSTERING OF MICROARRAY DATA VIA NONPARAMETRIC DENSITY ESTIMATION”. BMC BIOINFORMATICS, 12:49.
DE HAAN, J.R., WEHRENS, R., BAUERSCHMIDT, S., PIEK, E., VAN SCHAIK, R. AND BUYDENS, L.M.C. (2007): “INTERPRETATION OF
ANOVA MODELS FOR MICROARRAY DATA USING PCA”. BIOINFORMATICS 2007, 23:184-190.
ELASHOFF, M., ALVARES, C. AND LAUREN, P., (2009): “METHOD AND SYSTEM FOR MANAGING AND QUERYING GENE EXPRESSION DATA
ACCORDING TO QUALITY”. US PATENT 7,558, 411, 2009.
GAN, G., MA, C. AND WU, J. (2009): “DATA CLUSTERING: THEORY, ALGORITHMS, AND APPLICATIONS”. SIAM, SOCIETY FOR INDUSTRIAL
AND APPLIED MATHEMATICS.
IRIZARRY, R.A., WU, Z. AND JA_EE, H.A., (2006): “COMPARISON OF AFFYMETRIX GENECHIP EXPRESSION MEASURES”. BIOINFORMATICS
22, 789-794.
LI, C. AND WONG, W. H., (2001A): “MODEL-BASED ANALYSIS OF OLIGONUCLEOTIDE ARRAYS: EXPRESSION INDEX COMPUTATION
AND OUTLIER DETECTION”. PROC NATL ACAD SCI U S A, 98(1):31-36.
LI, C. AND WONG, W. H., (2001B): “MODEL-BASED ANALYSIS OF OLIGONUCLEOTIDE ARRAYS: MODEL VALIDATION, DESIGN ISSUES
AND STANDARD ERROR APPLICATION”. GENOME BIOL, 2(8):RESEARCH0032.
MUIR, W.M. ROSA, G.J.M., PITTENDRIGH, B.R., XU, Z., RIDER, S.D. , FOUNTAIN, M. AND OGAS J., (2009): “A MIXTURE MODEL APPROACH
FOR THE ANALYSIS OF SMALL EXPLORATORY MICROARRAY EXPERIMENTS.COMPUTATIONAL”. STATISTICS AND DATA ANALYSIS, 53:1566-1576.
NAEF, F., AND MAGNASCO, M. O., (2003): “SOLVING THE RIDDLE OF THE BRIGHT MISMATCHES: LABELING AND ELECTIVE BINDING IN OLIGONUCLEOTIDE ARRAYS”. PHYSICAL REVIEW E 68, 011906.
NEPOMUCENO, J.A., TRONCOSO, A., AGUILAR-RUIZ, J.S., (2011): “BICLUSTERING OF GENE EXPRESSION DATA BY CORRELATIONBASED
SCATTER SEARCH”. BIODATA MIN., 4(1):3.
RAUCH, G., GEISTANGER, A., TIMM, J., (2011): “A NEW OUTLIER IDENTI_CATION TEST FOR METHOD COMPARISON STUDIES BASED ON ROBUST REGRESSION”. JOURNAL OF BIOPHARMACEUTICAL STATISTICS, 1520-5711, 21(1):151-169.
SORIN DRAGHICI, (2003): “DATA ANALYSIS TOOLS FOR DNA MICROARRAYS, 2A ED”. CHAPMAN & HALL/CRC, 2003.
WU, Z., IRIZARRY, R. A., GENTLEMAN, R., MURILLO, F. M., AND SPENCER, F., (2003): “A MODEL BASED BACKGROUND ADJUSTMENT FOR OLIGONUCLEOTIDE EXPRESSION ARRAYS”. TECHNICAL REPORT WORKING PAPER1, JOHNS HOPKINS UNIVERSITY, DEPT. OF BIOSTATISTICS WORKING PAPERS.
Descargas
Publicado
Número
Sección
Licencia
Atribución — Usted debe dar crédito de manera adecuada, brindar un enlace a la licencia, e indicar si se han realizado cambios. Puede hacerlo en cualquier forma razonable, pero no de forma tal que sugiera que usted o su uso tienen el apoyo de la licenciante.
NoComercial — Usted no puede hacer uso del material con propósitos comerciales.
CompartirIgual — Si remezcla, transforma o crea a partir del material, debe distribuir su contribución bajo la misma licencia del original.