Diplomado en ingeniería Big Data y fundamentos de arquitectura + certificación internacional
María Fernanda Bastos Suárez
Asistente Profesional
Celular: 317 398 03 13
Te invitamos a conocer todas las características y alcance de todos nuestros programas.
En nuestro canal de youtube puedes encontrar contenido que te ayudaran a tomar la mejor elección para actualizarte.
Siendo conocedores de la necesidad de recopilación, almacenamiento y clasificación de datos, uno de los recursos digitales más valiosos en los entornos tecnológicos y que ayuda en grandes magnitudes al crecimiento de las industrias de muchos sectores, es necesario contar con profesionales que sean capaces de crear y desarrollar mecanismos y métodos de recolección y análisis de los mismos para que las organizaciones y empresas puedan contar con herramientas altamente eficientes que aporten al fortalecimiento de sus organizaciones.
- ¿Por qué es importante este curso? Teniendo en cuenta el incremento y la importancia para las compañías de realizar recolección de datos con el objetivo principal de analizar y procesar dicha información para la contribución de su crecimiento, es necesario contar con profesionales capaces de diseñar modelos y sistemas que permitan el tratamiento de esa información obtenida en altos volúmenes de diferentes tipos y fuentes, transformándola en información útil a las compañías para la toma de mejores y más eficientes decisiones.
- ¿Cómo mejora la labor profesional de los participantes? El campo de Big Data ha tenido un incremento significativo en los últimos años, lo que ha generado una gran demanda de vacantes laborales donde se requiere este conocimiento. Estudiar Big Data da la posibilidad de oportunidades laborales a largo, mediano y corto plazo, teniendo en cuenta que tienen una tendencia de crecimiento en los próximos años, aún mayor a la actual.
- ¿Qué problema soluciona? Con su exponencial crecimiento en la industria del tema del Big Data, se ha generado un déficit entre la oferta y la demanda de profesionales del sector.
- ¿cuáles son los valores agregados o diferenciadores del programa? El método de aprendizaje permite tener el conocimiento detallado, así como realizar prácticas que permitan solucionar los problemas que puedan presentarse en la realidad.
- Personas de las áreas estratégicas de la empresa, como marketing o gestión de clientes, que necesiten identificar nuevas oportunidades de Negocio, acceso a clientes, productos y mercados.
- Personas que trabajen con grandes volúmenes de datos e información estructurada o no estructurada
Plan de estudios
Módulo 1: Fundamentos de Big Data
Cómo entender Big Data
Terminología y conceptos fundamentales
Factores tecnológicos y de negocio de Big Data
Características de los datos en los ambientes de Big Data
Tipos de conjuntos de datos en los ambientes de Big Data
Análisis y analíticas fundamentales
Tipos de Machine Learning
Inteligencia de negocios y Big Data
Visualización de datos y Big Data
Consideraciones para la adopción y planeación de Big Data
Módulo 2: Conceptos de Análisis y Tecnología de Big Data
Ciclo de vida del análisis de Big Data (desde la evaluación del caso de negocio hasta el análisis de los datos y la visualización)
Pruebas A/B, correlación
Regresión, mapas de calor
Análisis de series temporales
Empresa tradicional
Análisis de redes
Análisis de datos espaciales
Clasificación, agrupamiento
Filtrado (incluyendo filtrado colaborativo y filtrado basado en contenido)
Análisis de sentimientos, analíticas de textos
Cómo procesar las cargas de trabajo, Clusters
Computación en la nube y Big Data
Mecanismos fundamentales de tecnología de Big Data
Módulo 3: Laboratorio de Análisis y Tecnología de Big Data
Ejercicios de resolución de problemas para entender cómo funcionan los ambientes de Big Data en la realidad
Módulo 4: Fundamentos de Análisis y Ciencia de Big Data
Ciencia de datos, minería de datos y modelado de datos
Categorías de conjuntos de datos de Big Data
Alto volumen, alta velocidad, alta variedad, alta veracidad, conjuntos de datos de alto valor
Análisis exploratorio de datos (EDA)
Resúmenes numéricos de EDA, reglas y reducción de datos
Tipos de análisis de EDA, incluyendo univariante, bivariante y multivariante
Estadísticas esenciales, incluyendo categorías variables y matemáticas relevantes
Análisis estadísticos, incluyendo descriptivo, inferencial, covarianza, pruebas de hipótesis, etc.
Medidas de variación o dispersión, rango intercuartil y atípicos, puntuación Z, etc.
Probabilidad, frecuencia, estimadores estadísticos, intervalo de confianza, etc.
Manipulación de datos y Machine Learning
Variables y notaciones matemáticas básicas
Medidas e inferencia estadísticas
Análisis confirmatorio de datos (CDA)
Prueba de hipótesis CDA, hipótesis nula, hipótesis alternativa, significancia estadística, etc.
Distribuciones y técnicas de procesamiento de datos
Discretización de datos, Binning y agrupamiento
Técnicas de visualización, incluyendo gráfica de barras, gráfica de líneas, histograma, polígonos de frecuencia, etc.
Predicción de regresión lineal, error cuadrático medio y coeficiente de determinación R2, etc.
Agrupamiento K-medias, distorsión del agrupamiento, valores de características faltantes, etc.
Resúmenes numéricos
Módulo 5: Análisis y Ciencia de Big Data Avanzados
Modelado, evaluación de modelos, ajuste de modelos y sobreajuste de modelos
Modelos estadísticos, medidas de evaluación de modelos
Validación cruzada, sesgo-varianza, matriz de confusión y puntuación F
Algoritmos de Machine Learning e identificación de patrones
Reglas de asociación y algoritmo Apriori
Reducción de datos, selección de la dimensión de las características
Extracción de datos, discretización de los datos (Binning y agrupamiento)
Técnicas estadísticas avanzadas
Paramétrico versus no paramétrico,agrupamiento versus no agrupamiento
Basado en distancia, supervisado versus semisupervisado
Regresión lineal y regresión logística para Big Data
Reglas de clasificación para Big Data
Regresiones logísticas, Naïve Bayes, Suavizamiento de Laplace, etc.
Árboles de decisiones para Big Data
Poda de árboles, división de características,algoritmo de una regla (1R)
Identificación de patrones, reglas de asociación, algoritmo Apriori
Análisis de series de tiempo, tendencia, estacionalidad
K-vecinos cercanos (kNN), K-medias
Analíticas de texto para Big Data
Bolsa de palabras, frecuencia de términos, frecuencia de documentos inversos, distancia de coseno, etc.
Detección de atípicos para Big Data
Técnica estadística, basada en distancia, supervisada y semisupervisada
Módulo 6: Laboratorio de Análisis y Ciencia de Big Data
Ejercicios prácticos para afianzar y los conocimientos adquiridos en los módulos 4 y 5.
Módulo 7: Fundamentos de Ingeniería de Big Data
Técnicas y retos de ingeniería de Big Data
Almacenamiento de Big Data, incluyendo fragmentación, replicación, teorema de CAP, ACID y BASE
Maestro-esclavo, replicación entre pares, combinación entre replicación y fragmentación
Requerimientos de almacenamiento de Big Data, escalabilidad, redundancia y disponibilidad
Acceso rápido, almacenamiento a largo plazo, almacenamiento sin esquema y almacenamiento económico
Almacenamiento en disco, incluyendo sistema de archivos distribuidos y bases de datos
Introducción a NoSQL y NewSQL
Racional NoSQL y características
Tipos de bases de datos NoSQL, incluyendo clave- valor, documento,columna- familia y bases de datos gráficas
Motores de procesamiento de Big Data
Procesamiento de datos distribuido/paralelo, procesamiento de datos sin esquema
Soporte multi carga de trabajo, escalabilidad lineal y tolerancia a fallas
Requerimientos de procesamiento de Big Data, incluyendo modos por lotes, Cluster y en tiempo real
MapReduce para procesamiento de Big Data, incluyendo mapa, combinar, partición, barajar y ordenar y reducir
Diseño de algoritmos MapReduce
Paralización de tareas, paralización de datos
Módulo 8: Ingeniería de Big Data Avanzada
Mecanismos avanzados de ingeniería de Big Data Motores de serialización y compresión
Dispositivos de almacenamiento en memoria
Mallas de datos en memoria y Bases de datos en memoria
Enfoques de integración Read-Through, Read- Ahead, Write-Through and Write-Behind
Persistencia políglota
Explicación, problemas y recomendaciones
Procesamiento de Big Data en tiempo real
Volumen de la consistencia de la velocidad (SCV)
Procesamiento del flujo de eventos (ESP)
Procesamiento de flujos compuestos (CEP)
El principio SCV
Procesamiento general de Big Data en tiempo real y MapReduce
Diseños avanzados de algoritmos MapReduce
Motor de procesamiento paralelo sincrónico (BSP) masivo
BSP versus MapReduce
Paralelo sincrónico BSP
Datos de grafos y procesamiento de datos de grafos con el uso de BSP (Superpasos)
Canales de Big Data, incluyendo definición y etapas
Big Data con Extracción- carga-transformación (ELT)
Caracteríticas de las soluciones de Big Data, consideraciones de diseño y proceso de diseño
Módulo 9: Laboratorio de Ingeniería de Big Data
Laboratorio práctico con ejercicios que refuerzan los conocimientos aprendidos en los módulos 7 y 8.
Módulo 10:Fundamentos de Arquitectura de Big Data
Motores de seguridad, administradores de grupo y administradores de la gobernaza de datos
Motores de visualización y portales de productividad
Modelos arquitectónicos de procesamiento de datos a nivel máquina
Arquitecturas todo-compartido y nada-compartido
Arquitectura lógica de analíticas de Big Data
Fuentes de datos y capas de adquisición de datos
Capas de almacenamiento, procesamiento y por lotes
Procesamiento en tiempo real, incluyendo flujo de eventos y procesamiento de flujos complejos
Enfoques de bodega de datos empresariales e integración de Big Data (incluyendo series y paralelo)
Poly Source, incluyendo fuentes relacionales, de flujo, y basadas en archivos
Poly Storage, incluyendo replicación automática de datos y reducción de tamaño de los datos
Almacenamiento de acceso aleatorio, incluyendo alto volumen binario, tabular, vinculado, jerárquico y fragmentación de datos
Procesamiento de lotes a gran escala, descomposición compleja y procesamiento de abstracción
Poly Sink, incluyendo Sink relacional, Sink basado en archivos y ejecución automatizada de conjuntos de datos
Dispositivo de Big Data y virtualización de datos
Ambientes arquitectónicos, incluyendo ETL
Motores de analíticas y enriquecimiento de aplicaciones
Computación en la nube y consideraciones arquitectónicas de Big Data
Modelos de entrega y despliegue en nube para el hospedaje de soluciones de Big Data
Proceso de Matrícula y Financiación
Formulario
Empieza por diligenciar el formulario de inscripción. Una vez recibas tu solicitud, automáticamente se generará una orden de pago, la cual será enviada por correo electrónico.
Matrícula presencial
Dirígete a las oficinas de la División de Educación Continuada, Av. Cra. 9 No. 131 A - 02 Edificio Fundadores, Centro de Servicios Integrales, Primer piso, Mezannine, y proporcionar los siguientes datos:
- Nombre completo
- Tipo de Documento
- Número de Documento
- Fecha de Nacimiento
- Teléfono Fijo
- Teléfono Móvil
- Programa de interés
Métodos de pago
Conoce las opciones de financiación, formas de pago, descuentos y beneficios para formalizar la inscripción.
Métodos de financiación
Directo por la Universidad El Bosque, Cheques Posfechados.
Entidades bancarias
Sufi Bancolombia, Grupo Helm Bank, Banco Pichincha, Fincomercio, Financiar.
Formas de pago
Efectivo, Pagos en línea PSE, Tarjeta de crédito Visa o Master Card, Patrocinios.
Descuentos
15% Comunidad El Bosque, 10% Descuentos grupales (3 participantes), 10% Participantes de otros programas, 10% Cónyuges e hijos funcionarios de la Universidad El Bosque.
* Los descuentos no son acumulables
Pagos en línea
Puedes diligenciar el pago de tu recibo en nuestra plataforma con PSE.
Requisitos
Una vez realizado el pago, deberás hacer llegar el comprobante y los siguientes documentos por medio de correo electrónico o acercándote a las oficinas de la División de Educación Continuada:
- Fotocopia de la Cédula
- Fotocopia del Carné de la E.P.S.
- Fotocopia del diploma profesional o acta de grado
Importante
La Universidad podrá cancelar el programa seleccionado, cuando no haya un número mínimo de participantes, y procederá a tramitar la devolución del dinero recibido. También podrá posponer la realización del programa por razones de fuerza mayor. En este caso se informará a las personas preinscritas la nueva fecha programada. El medio de contacto será a través de los medios suministrados en el momento de la inscripción.
Institución de educación superior sujeta a inspección y vigilancia por el Ministerio de Educación Nacional.