Este curso cubre algunas de las metodologías, tecnologías y herramientas para el análisis de datos, también conocido como Ciencia de Datos. El curso inicia presentando los fundamentos del análisis de datos, profundizando en el análisis exploratorio y la calidad de datos. Posteriormente, se abordan los principios, técnicas y herramientas para la visualización de datos, finalizando con las bases del Machine Learning aplicado, con énfasis en los algoritmos de regresión y árboles de decisión con su respectiva interpretación.
El curso cuenta con un componente teórico a cargo del docente en donde se brindan las bases conceptuales para el análisis de datos, complementado con una serie de lecturas previas a cargo del estudiante. El componente práctico del curso permite al estudiante crear soluciones de software basadas en casos de estudio reales. Para lograr estas competencias, se ofrecen un conjunto de tutoriales guiados a cargo del docente, seguido de un trabajo autónomo por parte del estudiante. También se plantea un artículo de investigación el cual le permite al estudiante profundizar algunos de los conceptos adquiridos en clase así como indentificar los principales retos y oportunidades por resolver.
La línea de software de la carrera de Ingeniería de Sistemas de la Universidad El Bosque se compone de una serie de cursos a lo largo de ocho semestres que permiten al estudiante desarrollar las habilidades y competencias requeridas para el diseño y desarrollo de software como parte de su ejercicio profesional.
Si bien este curso cuenta con un componente teórico que busca dar seguimiento a lo aprendido hasta el momento, también fomenta el uso de diferentes tecnologías y herramientas vigentes para el análisis de datos, tan relevantes casi en cualquier dimensión del ejercicio profesional del ingeniero de sistemas actual.
La Ciencia de Datos no es una disciplina clásica y puede ser aplicada de formas diferentes en cada industria, por lo que también se dejan planteados algunas oportunidades y retos. Además del ejercicio profesional, se espera también motivar a los estudiantes a continuar con una formación académica en esta área del conocimiento.
Para lograr un buen desempeño en este curso, se espera que los estudiantes tengan un sólido conocimiento en las siguientes áreas:
Debido a que este curso es mayoritariamente práctico, no hay bibliografía oficial. Las presentaciones están basadas en un conjunto de lecturas seleccionadas cuidadosamente y la documentación oficial de las diferentes tecnologías que se trabajan. Cualquier referencia adicional será proporcionada oportunamente.