Servicios de análisis de datos
Este servicio de Datatherapy consiste en analizar grandes conjuntos de datos/bases de datos para identificar patrones, tendencias, asociaciones e ideas que puedan generar evidencia científica que pueda respaldar las decisiones médicas y/o comerciales. Nuestro equipo de expertos en análisis de datos utiliza métodos y herramientas de machine learning y estadísticas avanzadas para extraer información significativa. En este sentido, ofrecemos una gama de servicios, que incluyen limpieza de datos, análisis de datos, visualización de datos y generación de informes.
Limpieza de datos
Nuestro servicio de limpieza de datos consiste en identificar y corregir errores e inconsistencias en los conjuntos de datos/bases de datos para garantizar que sean precisos y fiables en el momento de desarrollar un análisis estadístico. Para ello, utilizamos una variedad de técnicas modernas incluyendo:
- Inspección de los datos (características del conjunto de datos)
- Identificacion de valores faltantes
- Chequeo de duplicados
- Manejo de valores atípicos
- Normalizacion de datos
- Comprobacion de coherencia
- Conversion de los tipos de datos
- Archivado del conjunto de datos validado (limpios)
Análisis de datos
Aplicamos varios métodos estadísticos y de machine learning para analizar las distintas bases de datos, dependiendo de la pregunta de investigación y la naturaleza de los datos. Nuestro objetivo es seleccionar el método adecuado para garantizar resultados científicos robustos, precisos y significativos
- Estadística descriptivas
- Estadística inferenciales
- Visualización de datos (gráficos y tablas, paneles de control interactivos)
- Análisis de clústeres
- Data mining
- Análisis de asociación
Visualización de datos
Implementamos diferentes herramientas de visualización para el análisis de bases de datos, incluyendo la creación de representaciones visuales para ayudar al cliente a potenciar la compresión de los mismos:
Paneles de control e inteligencia empresarial:
- Apache Superset
- ELK
- Grafana
- Tableau Desktop (con Wine o virtualización)
- Pentaho
- Metabase
- Google Data Studio (basado en la web)
Otras herramientas utilizadas:
- R con ggplot2
- Plotly
- Matplotlib
- Jupyter Notebook
- D3.js
- Microsoft Power BI
- Google Smart Analytics
- QlikView
- Tableau
- MicroStrategy
- Sisense