Servicios de análisis de datos

Este servicio de Datatherapy consiste en analizar grandes conjuntos de datos/bases de datos para identificar patrones, tendencias, asociaciones e ideas que puedan generar evidencia científica que pueda respaldar las decisiones médicas y/o comerciales. Nuestro equipo de expertos en análisis de datos utiliza métodos y herramientas de machine learning y estadísticas avanzadas para extraer información significativa. En este sentido, ofrecemos una gama de servicios, que incluyen limpieza de datos, análisis de datos, visualización de datos y generación de informes.

 

Limpieza de datos

Nuestro servicio de limpieza de datos consiste en identificar y corregir errores e inconsistencias en los conjuntos de datos/bases de datos para garantizar que sean precisos y fiables en el momento de desarrollar un análisis estadístico. Para ello, utilizamos una variedad de técnicas modernas incluyendo:

  • Inspección de los datos (características del conjunto de datos)
  • Identificacion de valores faltantes
  • Chequeo de duplicados
  • Manejo de valores atípicos
  • Normalizacion de datos
  • Comprobacion de coherencia
  • Conversion de los tipos de datos
  • Archivado del conjunto de datos validado (limpios)

 

Análisis de datos

 Aplicamos varios métodos estadísticos y de machine learning para analizar las distintas bases de datos, dependiendo de la pregunta de investigación y la naturaleza de los datos. Nuestro objetivo es seleccionar el método adecuado para garantizar resultados científicos robustos, precisos y significativos 

  • Estadística descriptivas
  • Estadística inferenciales
  • Visualización de datos (gráficos y tablas, paneles de control interactivos)
  • Análisis de clústeres
  • Data mining
  • Análisis de asociación

 

Visualización de datos

 Implementamos diferentes herramientas de visualización para el análisis de bases de datos, incluyendo la creación de representaciones visuales para ayudar al cliente a potenciar la compresión de los mismos: 

Paneles de control e inteligencia empresarial:

  • Apache Superset
  • ELK
  • Grafana
  • Tableau Desktop (con Wine o virtualización)
  • Pentaho
  • Metabase
  • Google Data Studio (basado en la web)

Otras herramientas utilizadas:

  • R con ggplot2
  • Plotly
  • Matplotlib
  • Jupyter Notebook
  • D3.js
  • Microsoft Power BI
  • Google Smart Analytics
  • QlikView
  • Tableau
  • MicroStrategy
  • Sisense