Fundamentos de programación en R para Data Science

La ciencia de datos integra el conocimiento del dominio de la aplicación subyacente con la estadística, el análisis de datos, la informática y sus métodos relacionados para comprender y analizar fenómenos reales con datos. Utiliza técnicas y teorías extraídas de muchos campos dentro del contexto de las matemáticas, las estadísticas, las ciencias de la computación, las ciencias de la información y el conocimiento del dominio.

FECHA:

Del 21 de mayo al 16 de julio de 2024

Aula Virtual Darwin Eventur

CARACTERÍSTICAS

 

Modalidad: 100% vIRTUAL

Duración: 60 horas aproximadamente

Dirigido a: Toda persona interesada

Fecha límite inscripción: 4 de junio o hasta cubrir plazas

PRECIO:

ESTÁNDAR: 80 EUROS
ESTUDIANTE O DESEMPLEADO*: 65 EUROS
RESIDENTES EN MÉXICO, CENTRO Y SUDAMÉRICA*: 55 EUROS

*25% DESCUENTO PARA LOS SOCIOS Y SOCIAS DE NUESTRA ASOCIACIÓN: 60 EUROS

* VER CONDICIONES EN INSCRIPCIONES

N° de plazas: sólo 50 participantes PARA UNA MEJOR TUTORIZACIÓN Y ATENCIÓN PERSONALIZADA

¿Cómo realizo la inscripción?

¿Tienes dudas?: Mira este F.A.Q.

PRECIO

55,00 80,00  IVA incluido

PRESENTACIÓN Y OBJETIVOS

R es un entorno de software libre para computación estadística y gráficos. Se trata de uno de los lenguajes de programación más utilizados en investigación científica, siendo además muy popular en los campos de machine learning, minería de datos, econometría, investigación biomédica, bioinformática, entre otros. A esto contribuye la posibilidad de cargar diferentes bibliotecas o paquetes con funcionalidades de cálculo y graficación.

Con el curso de programación en R para Data Science se pretende adentrar al participante en este lenguaje de programación tan polifacético.

OBJETIVOS

  1. Promover y divulgar el software libre entre la comunidad universitaria y no universitaria como herramienta que está siendo cada vez más utilizada en la investigación de vanguardia.
  2. Aprender a usar herramientas de software libre como es R y entender su uso como un lenguaje de programación completo hasta poder escribir nuestro propio software, incluyendo nuestros propios paquetes.
  3. Saber leer con facilidad la documentación y la ayuda de las distintas funciones, comprender el significado de los mensajes de error para evitarlos o corregirlos.
DESTINATARIOS

→ Estudiantes de grado, máster o doctorado y profesionales vinculados a las áreas de Ciencias, Tecnología e Informática.

→ Investigadores que quieran obtener los conocimientos necesarios para su futuro profesional.

→ Docentes de cualquier sistema de enseñanza de la rama de Ciencias, Tecnología e Informática.

→ Cualquier persona que tenga interés por el aprendizaje de un lenguaje de programación aplicado a la ciencia de datos.

PROGRAMA

MÓDULO 1 SEMANA 1

Bloque 0 Preliminares

Declaración de intenciones

Breve introducción a la computación y la programación

Instalación de R y Rstudio – Comparación con otros IDE

Bloque 1. Elementos de la programación en R – Primera Parte

El intérprete y el terminal de R

Expresiones Constantes – Valores

Expresiones básicas: R como una calculadora

Sentencias y variables

Introducción a las funciones

Primeros Ejercicios

Apéndice: Enumeración de funciones aplicables en este bloque

Bloque 2. Elementos de programación en R – Segunda Parte

Creación de funciones básicas

Control condicional del flujo

Control del Iterativo del flujo:while

Ejercicios

MÓDULO 2 SEMANAS 2 y 3

Bloque 3. Contenedores de datos I – Vectores, matrices, arrays y listas

Vectores en R. Array programming

Vectores atómicos

Vectores recursivos: Listas

Matrices y arrays

Factores

Funciones con vectores

Bloque 4. Contenedores de datos II – Data frames

Data frames

Data Frames – Generalidades

Operaciones con filas y columnas

Data frames como tablas de datos relacionales

Gráficos y estadísticas

Tidyverse I. Tibbles y funciones para data science

Tidyverse II. Ggplot2

Ejercicios

MÓDULO 3 SEMANA 4

Bloque 5. Aspectos generales del lenguaje R

Instalación de paquetes

La memoria de R – Entornos (Environments)

Conexiones con el sistema operativo

Debugging

Tidyverse III. El operador pipe del MagrittR

Programación defensiva y manejo de excepciones – básico

Expresiones regulares (breve introducción)

Ejercicios

Bloque 6. Aspectos semi-avanzados de las funciones

Funciones recursivas. Operadores

Closures y Objetos del hombre pobre

Programación funcional

Tidyverse IV. Purrr

Ejercicios

MÓDULO 4 SEMANA 5

Bloque 7. Elaboración de paquetes propios en R

El sistema básico de paquetes en R.

Tidyverse V: Simplificación por Rstudio y devtools.

Ejercicios

Bloque 8. Programación orientada a objetos en R

Programación orientada a objetos en R. Clases S3 y S4

Paquete en R basados en S4. Bioconductor. (Ejemplos)

Recapitulación

Ejercicios

 

MÓDULO 5 SEMANAS 6 y 7 –  PROYECTO FINAL

Los participantes deberán desarrollar un proyecto final poniendo en práctica todo lo aprendido a lo largo del curso.

 

Este programa es susceptible de modificaciones por lo que algunos contenidos podrían variar.

DOCENTE

Odín, docente curso programación en R para Data Science

Odín Morón García

Licenciado en Biología por la Universidad de Granada, Máster en Modelado Matemático, Estadístico y Computacional por la Universidad de Navarra, y Doctorado en Fenotipado Automático de Plantas por la Universidad de Aberystwyth.

Ha seguido dos carreras paralelas, el afán académico por los modelos computacionales en Biología y el trabajo práctico en lo que hoy llamamos Ciencias Ómicas, Inteligencia Artificial y Aprendizaje Automático y Ciencias de Datos.

Como investigador posdoctoral de la Universidad de Aberystwyth ha sido analista de datos biológicos e imágenes en el National Plant Phenomics Center, también ha sido analista de datos biológicos en el EU GEOM project, y en EU y WEFO SMART RECOVERY y DECARBONIZATION WALES.

REQUISITOS PREVIOS Y TÉCNICOS

No será necesario ningún conocimiento básico del lenguaje R, aunque por supuesto es recomendable.

Por el contrario, sí será necesario tener una capacidad inquisitiva en la resolución de problemas, así como una paciencia y tolerancia a la frustración con aquellos que no veamos en primera instancia.

Es recomendable tener alguna experiencia con lenguajes de programación o con la solución de problemas computacionales, por ejemplo, manejo con bash en Linux o scripts de bioinformática.

Se recomienda tener conocimientos sólidos de su sistema operativo, sea Windows, Linux o Mac, para poder instalar y ejecutar un programa.

Los participantes deberán tener conocimientos de ofimática básica y se recomienda que el ordenador sea moderadamente actual, esté actualizado.

Con R y RStudio se puede trabajar tanto en Windows, Linux, como en Mac, por lo que el usuario podrá realizar el curso desde su sistema operativo favorito.

METODOLOGÍA

El curso Funtamentos de programación en R para Data Science es 100% VIRTUAL. El Aula Virtual estará disponible las 24 horas del día, los 7 días de la semana para acceder a ella cuando se desee. No es necesario entrar a una hora específica. Cada participante se establece su propio horario siempre teniendo en cuenta las fechas finales de entrega de los ejercicios propuestos.

Además, gracias a este sistema se puede compaginar con estudios y/o trabajo siendo adecuado para una correcta adquisición de conocimientos y disfrute de las diferentes temáticas propuestas.

♦ El curso tiene carácter NO PRESENCIAL con una duración de 60 horas totales durante semanas.

♦ Desde la Semana 1 a la Semana 5 se publicará el material didáctico necesario para desarrollar las actividades propuestas, estimándose unas 8 horas por módulo teórico, siendo un total de 40 horas.

♦ Las semanas 6 y 7 los participantes deberán desarrollar un Proyecto Final aplicando todos los conocimientos aprendidos, con una estimación de 15 horas.

La semana 8 se considerarán extras para la entrega de actividades atrasadas.

♦ La duración del curso es de 8 semanas finalizando el 16 de julio de 2024. A partir de dicha fecha y hasta el 16 de agosto de 2024 los participantes permanecerán matriculados en el curso para consulta y descarga del material, pero no dispondrán de tutorización mediante foros o mensajes privados con el docente.

♦ Los participantes establecerán su propio horario de lectura y visualización de material proporcionado, así como para la realización de los ejercicios propuestos, por lo que no será necesario estar conectado al Aula Virtual a una hora específica, a excepción del día a la semana en el que se realizará la conexión mediante ZOOM (aunque no es imprescindible pues se grabarán todas).

♦El curso consta de explicaciones teóricas incluyendo material en formato PDF y enlaces de interés sobre las materias necesarias para que los participantes puedan completar sin problemas los ejercicios prácticos que se planteen durante el curso y, además, se intentará que sea lo más interactivo posible.

♦ En cada módulo se realizará una conexión mediante ZOOM entre el docente y los asistentes en la que se explicarán aquellos aspectos más complicados del correspondiente módulo para facilitar la asimilación de la información. Se realizará una conexión por cada módulo teórico, con una duración total de unos 5 horas aproximadamente.

♦ A través del Aula Virtual los participantes podrán solicitar ayuda al docente sobre cualquier temática relacionada con el curso en todo momento mediante los FOROS habilitados para ello o por MENSAJES PRIVADOS y CORREO ELECTRÓNICO.

♦ Se realizará en su totalidad delante de un ordenador y será necesaria una conexión a internet.

EVALUACIÓN

Para poder obtener el Certificado de Aprovechamiento del curso de programación en R para Data Science los participantes deberán haber superado más del 80% del total, con una nota superior a 5 sobre 10 puntos.

♦ Si se quiere obtener el Certificado de Asistencia del curso los participantes deberán haber superado entre el 50% y el 80% del total.

♦ En ambos casos, se expedirá un Certificado Digital en formato PDF que se enviará al correo electrónico.

 

Porcentajes de valoración:

  • Ejercicios: 60%
  • Proyecto Final: 40%
INSCRIPCIONES

PRECIO:

  • Estándar: 80 euros.
  • Precio Estudiante o Desempleado*: 65 euros.
  • Residentes en México, Centro y Sudamérica**: 55 euros
  • ATENCIÓN: Nuestros socios y socias tendrán un descuento del 25% sobre el precio estándar, con lo que se quedaría en 60€.

* Una vez realizada la inscripción, para acceder al precio de Estudiante o Desempleado, se tiene que enviar un correo a info@darwineventur.es con lo siguiente:

– Resguardo del pago de la matrícula del año actual (secundaria, bachillerato, estudiantes de Formación Profesional, universitarios y doctorados).
– Justificante de alta en desempleo (desempleados).

** IMPORTANTE: para residentes, durante el curso, de México, Centro y Sudamérica (Aunque en el tipo de inscripción aparezcan euros, una vez indicado el país de procedencia en la facturación (al hacer el pago), el precio se actualizará a dólares).

INSCRIPCIONES: Para poder inscribirte al curso de programación en R para Data Science deberás elegir el Tipo de inscripción y pinchar en Añadir al carrito. Para finalizar la compra se deberá iniciar sesión. Si aún no estás registrado deberás registrarte pinchando en REGISTRO que verás en la parte superior de la web. Una vez iniciado sesión se deberá rellenar el formulario de facturación. El abono se realizará de forma segura mediante tarjeta de débito o crédito.

En este vídeo te indicamos como realizar los pagos.