This page contains a Flash digital edition of a book.
Conocimiento: Análisis de datos


Este capítulo aborda el tema de la gestión del conocimiento más allá de la gestión de la documentación para introducirse en el análisis y la prospección de datos como soporte para el desarrollo de productos nuevos o la mejora de los existentes. La tecnología por sí misma no es suficiente – el personal del laboratorio ha de conocer las prestaciones de las herramientas de análisis de datos – por lo que el análisis debe considerarse desde una perspectiva holística, comenzando por el diseño del experimento.


El análisis de datos es el término aplicado al proceso de análisis y visualización de los datos con el fin de extraer conclusiones y conocimiento de los mismos. El análisis de datos está adquiriendo creciente importancia, puesto que los laboratorios han de procesar e interpretar volúmenes cada vez más grandes de datos generados por sus sistemas. Sectores y disciplinas tan diversas como las instituciones financieras, las ciencias sociales y el comercio electrónico recurren al análisis de datos para mejorar la toma de decisiones comerciales. En el laboratorio, la finalidad principal consiste en verificar o refutar los modelos científicos existentes y mejorar el conocimiento sobre los productos y los procesos actuales y futuros de la institución. La prospección de datos es un proceso


afín que emplea el soſtware para descubrir patrones, tendencias y relaciones en el seno de los conjuntos de datos. Pese a que con frecuencia se tiende a pensar en el análisis y en la prospección de datos en un mismo contexto, el de los Big data, ambos persiguen objetivos distintos. La prospección de datos se definiría a grandes rasgos como un proceso de “análisis


38


secundario de datos” para el descubrimiento de conocimientos. Analiza datos que originalmente habrían sido recogidos con otras motivaciones. Ello lo diferencia del análisis de datos, cuyo objetivo primordial es el análisis exploratorio (exploratory data analysis EDA), con el que se descubren nuevas características en los datos, o el análisis confirmatorio de los mismos (confirmatory data analysis CDA), cuya finalidad es probar o rebatir las hipótesis planteadas. En los últimos años, algunos de los


principales suministradores de informática de laboratorio han comenzado a incluir las herramientas de análisis y visualización de datos en sus carteras de productos. Esas herramientas normalmente ofrecen una gama de procedimientos estadísticos que agilizan tanto el análisis como la visualización de los datos para facilitar la interpretación. Junto con las herramientas integradas para el análisis de datos, cada vez más proveedores ofrecen herramientas genéricas con soſtware que permiten extraer y procesar datos de sistemas sencillos a través de múltiples plataformas y formatos. La ventaja de las herramientas integradas para el análisis de datos es que constituyen el medio perfecto para acceder a los datos, eliminando cualquier tipo de problema relacionado con la incompatibilidad de los formatos de los datos. A semejanza de cualquier otro soſtware


de laboratorio, la definición de los requisitos funcionales y del usuario son pasos esenciales para tomar la elección correcta. Las áreas clave son que las herramientas dispongan de acceso adecuado al laboratorio y a otras fuentes de datos, que proporcionen las herramientas estadísticas necesarias y que ofrezcan opciones


de presentación y visualización en consonancia con las preferencias y los criterios generales de la empresa. El análisis de datos desempeña un papel


importante en la generación de conocimiento científico y, a semejanza de lo que ocurre con otros aspectos de la gestión del conocimiento, es importante entender la relación entre la tecnología, los procesos y las personas. En particular, el personal debe tener la preparación necesaria para interpretar, racionalizar y expresar


“ El análisis de datos desempeña un papel importante en la generación de conocimiento científico y, a semejanza de lo que ocurre con otros aspectos de la gestión del conocimiento, es importante entender la relación entre la tecnología, los procesos y las personas”


los resultados presentados por las herramientas de análisis de datos. Para aprovechar plenamente el análisis de datos, se debe pensar en esta disciplina como parte de un proceso holístico que comienza con el diseño del experimento. Una frase atribuida a Sir R. A. Fisher, en


torno a 1938, refleja este punto: “Llamar al estadístico una vez concluido el experimento es poco mas como pedirle que realice una autopsia: Puede ser que te diga la causa de muerte de tu experimento”. n


www.scientific-computing.com/BASL2015


Brian A Jackson/Shutterstock.com


Page 1  |  Page 2  |  Page 3  |  Page 4  |  Page 5  |  Page 6  |  Page 7  |  Page 8  |  Page 9  |  Page 10  |  Page 11  |  Page 12  |  Page 13  |  Page 14  |  Page 15  |  Page 16  |  Page 17  |  Page 18  |  Page 19  |  Page 20  |  Page 21  |  Page 22  |  Page 23  |  Page 24  |  Page 25  |  Page 26  |  Page 27  |  Page 28  |  Page 29  |  Page 30  |  Page 31  |  Page 32  |  Page 33  |  Page 34  |  Page 35  |  Page 36  |  Page 37  |  Page 38  |  Page 39  |  Page 40  |  Page 41  |  Page 42  |  Page 43  |  Page 44