Sobre mí
¡Hola! Soy Gonzalo, Data & AI Engineer de Argentina. Soy Técnico Superior en Ciencia de Datos y actualmente curso la Licenciatura en Ciencia de Datos en la Universidad del Gran Rosario.
Mi trabajo se centra en el desarrollo con IA: diseño y construcción de agentes inteligentes, automatización de flujos de datos y tareas de ingeniería de datos orientadas a producción. Me apasiona construir sistemas que no solo analicen información, sino que actúen sobre ella de forma autónoma y eficiente.
Mi perfil combina la solidez analítica del dato con la mentalidad de ingeniería necesaria para llevarlo a sistemas reales: pipelines robustos, modelos en producción y soluciones que generan impacto concreto.
Te invito a explorar mi repositorio, donde comparto proyectos en estas áreas. Si te interesa la IA aplicada, los datos o simplemente quieres intercambiar ideas, será un placer conectarnos.
Áreas de Enfoque
Ciencia de Datos
- Desarrollo de modelos de predicción, clasificación, segmentación y series temporales para apoyar la toma de decisiones.
- Aplicación de algoritmos de aprendizaje supervisado y no supervisado.
- Preprocesamiento de datos: limpieza, normalización, imputación, ingeniería de características y selección de variables.
- Optimización y validación de modelos con técnicas de cross-validation, hiperparámetros y pipelines reproducibles en producción.
Inteligencia Artificial
- Diseño e implementación de agentes inteligentes capaces de automatizar procesos, interactuar con usuarios y tomar decisiones basadas en contexto.
- Uso de frameworks como LangChain y n8n para la orquestación de flujos, integración de herramientas y construcción de pipelines escalables.
- Aplicación de enfoques como prompt engineering, RAG (Retrieval-Augmented Generation) y diseño de herramientas (tools) para ampliar las capacidades de los agentes.
Ingeniería de Datos
- Administración, modelado y optimización de bases de datos relacionales y no relacionales.
- Diseño y orquestación de flujos de transformación de datos (DAGs) utilizando Apache Airflow.
- Construcción de pipelines de datos escalables para ingesta, transformación y carga de datos (ETL/ELT).
- Implementación de estrategias de gobernanza de datos: seguridad, trazabilidad y calidad.
Tech Stack
Educación
Tecnicatura en Ciencia de Datos e Inteligencia Artificial
Formación orientada al análisis estadístico, procesamiento de datos, desarrollo de modelos de machine learning y deep learning, con aplicaciones en visión por computadora, procesamiento de lenguaje natural y sistemas predictivos. Incluye conocimientos sólidos en programación (Python, R, SQL), bases de datos, matemáticas, estadística y ética en la inteligencia artificial.
- Minería de Datos
- Programación y Desarrollo de software
- Arquitectura de Soluciones
- Visualización de datos
- Bases de datos
Licenciatura en Ciencia de Datos
La Licenciatura en Ciencia de Datos de la Universidad del Gran Rosario ofrece una formación sólida en estadística aplicada, ingeniería de software, aprendizaje automático, aprendizaje profundo, procesamiento de lenguaje natural y visión por computadora.
- Visión por Computadora
- Procesamiento de Lenguaje Natural
- Aprendizaje por Refuerzo
- Ingeniería del Software
- Herramientas de Software para Análisis de Datos
Proyectos
Este repositorio está orientado a demostrar no solo habilidades técnicas, sino también una visión integral del desarrollo y despliegue de modelos, abarcando proyectos de ingeniería de datos y la creación de workflows con agentes de IA, desde la integración y automatización hasta su implementación en entornos reales.
Proyecto 1: Visualización de Estadísticas
El objetivo de este proyecto es analizar y visualizar la fase ofensiva del Manchester City durante la temporada 2023/2024 en la Premier League, con un enfoque especial en los pases y tiros. Para realizar este análisis, se extrajeron datos mediante scraping de una página web de estadísticas de fútbol utilizando Python, y luego fueron transformados para su visualización en Power BI.
Proyecto 2: Caso de Negocio + Business Experimentation
Una empresa de retail nacional, líder en la venta de productos electrónicos, ha decidido expandirse a nuevos mercados regionales. Actualmente opera en cinco ciudades principales y desea extender su presencia a tres nuevas ciudades donde aún no tiene operaciones. La dirección necesita una estrategia basada en datos para maximizar la rentabilidad y minimizar los riesgos asociados con esta expansión.
Proyecto 3: Shipping Container OCR
Este proyecto implementa un pipeline híbrido de detección y OCR para identificar, validar y hacer seguimiento de códigos ISO 6346 en contenedores marítimos. Combina modelos YOLOv8 para detección de regiones y caracteres con EasyOCR como método de respaldo y métodos de validación.
Cursos y Certificaciones
La carrera de Ingeniería de Datos tiene como objetivo formar profesionales especializados en diseñar, construir y optimizar sistemas que permitan la gestión eficiente de grandes volúmenes de datos. El egresado podrá desempeñarse en roles como ingeniero de datos o arquitecto de datos junior, con habilidades en integración de datos, manejo de bases de datos, desarrollo de pipelines de datos y despliegue de soluciones escalables que faciliten el análisis y la toma de decisiones.
Poder crear, usar, y desplegar imágenes es una habilidad necesaria para cualquier desarrollador o administrador de hoy en día, ahorra mucho tiempo en la preparación de diferentes ambientes de desarrollo, testing, staging y production. Este curso te dará las más que las bases para poder utilizar Docker de una forma productiva y funcional, aprenderemos mediante ejercicios prácticos y tareas.
La certificación en análisis de datos de Google cubre los conceptos fundamentales del análisis de datos, incluyendo herramientas y técnicas para transformar datos en insights significativos.
Certificación diseñada para capacitar en el uso de Power BI como herramienta para transformar datos en insights significativos, con enfoque en manejo de datos, visualización y creación de informes interactivos.
Libros
Fundamentals of Data Engineering
Data EngineeringGuía completa sobre el ciclo de vida de la ingeniería de datos, desde la generación hasta el servicio de datos, cubriendo arquitecturas, herramientas y mejores prácticas.
Software Engineering for Data Scientists
Software EngineeringPrincipios de ingeniería de software aplicados a proyectos de ciencia de datos, incluyendo testing, control de versiones, y diseño de código mantenible.
AI Engineering
AI EngineeringEnseña cómo diseñar, construir, evaluar y optimizar aplicaciones con modelos fundacionales de Inteligencia Artificial, incluyendo prompting, RAG, fine-tuning, datos y despliegue eficiente.
¡Gracias por visitar mi portfolio!
Me alegra que hayas explorado mis proyectos de Data. Si te interesa charlar o colaborar, puedes contactarme a través de mi email:
gonzadiaz160400@gmail.comNo dudes en escribirme!