Portada

Gonzalo Diaz

Data & AI

👋 Sobre mi

¡Hola! Soy Gonzalo, Data & AI Engineer de Argentina. Soy Técnico Superior en Ciencia de Datos y actualmente curso la Licenciatura en Ciencia de Datos en la Universidad del Gran Rosario.

Mi trabajo se centra en el desarrollo con IA: diseño y construcción de agentes inteligentes, automatización de flujos de datos y tareas de ingeniería de datos orientadas a producción. Me apasiona construir sistemas que no solo analicen información, sino que actúen sobre ella de forma autónoma y eficiente.

Mi perfil combina la solidez analítica del dato con la mentalidad de ingeniería necesaria para llevarlo a sistemas reales: pipelines robustos, modelos en producción y soluciones que generan impacto concreto.

Te invito a explorar mi repositorio, donde comparto proyectos en estas áreas. Si te interesa la IA aplicada, los datos o simplemente quieres intercambiar ideas, será un placer conectarnos.

🔎 Areas de Enfoque

Ciencia de Datos

  • Desarrollo de modelos de prediccion, clasificacion, segmentacion y series temporales para apoyar la toma de decisiones.
  • Aplicacion de algoritmos de aprendizaje supervisado y no supervisado.
  • Preprocesamiento de datos: limpieza, normalizacion, imputacion, ingenieria de caracteristicas y seleccion de variables.
  • Optimizacion y validacion de modelos con tecnicas de cross-validation, hiperparametros y pipelines reproducibles en produccion.

Visualización de Datos

  • Construcción de dashboards interactivos y reportes visuales adaptados a usuarios tecnicos y no técnicos.
  • Uso de herramientas de Business Intelligence como Power BI y Qlik Sense para representar datos de manera clara, accesible y visualmente atractiva.
  • Desarrollo de visualizaciones en Python con librerias especializadas como Plotly, Matplotlib y Seaborn.
  • Enfoque en la comunicacion efectiva de hallazgos, con enfasis en el storytelling con datos.

Ingenieria de Datos

  • Administración, modelado y optimizacion de bases de datos relacionales y no relacionales.
  • Diseño y orquestación de flujos de transformacion de datos (DAGs) utilizando Apache Airflow.
  • Construccion de pipelines de datos escalables para ingesta, transformacion y carga de datos (ETL/ELT).
  • Implementacion de estrategias de gobernanza de datos: seguridad, trazabilidad y calidad.

🛠 Tech Stack

PythonComputer VisionPyTorchPostgreSQLDockerLinuxDjangoETLApache AirflowDatabricks

🎓 Educacion

Instituto Superior Tecnologico Empresarial Argentino

Tecnicatura en Ciencia de Datos e Inteligencia Artificial

Formacion orientada al analisis estadistico, procesamiento de datos, desarrollo de modelos de machine learning y deep learning, con aplicaciones en vision por computadora, procesamiento de lenguaje natural y sistemas predictivos. Incluye conocimientos solidos en programacion (Python, R, SQL), bases de datos, matematicas, estadistica y etica en la inteligencia artificial.

  • Minería de Datos
  • Programacion y Desarrollo de software
  • Arquitectura de Soluciones
  • Visualizacion de datos
  • Bases de datos

Universidad del Gran Rosario

Licenciatura en Ciencia de Datos

La Licenciatura en Ciencia de Datos de la Universidad del Gran Rosario ofrece una formacion solida en estadistica aplicada, ingenieria de software, aprendizaje automatico, aprendizaje profundo, procesamiento de lenguaje natural y vision por computadora.

  • Visión por Computadora
  • Procesamiento de Lenguaje Natural
  • Aprendizaje por Refuerzo
  • Ingeniería del Software
  • Herramientas de Software para Análisis de Datos

💻 Proyectos de Analisis de Datos

Este repositorio esta pensado para demostrar no solo habilidades tecnicas, sino tambien una vision integral del ciclo de vida del dato, desde la extraccion y transformacion hasta su analisis, visualizacion y presentacion a usuarios finales o despliegue en entornos reales.

Proyecto 1: Visualizacion de Estadisticas

PythonWeb ScrapingPower BI

El objetivo de este proyecto es analizar y visualizar la fase ofensiva del Manchester City durante la temporada 2023/2024 en la Premier League, con un enfoque especial en los pases y tiros. Para realizar este analisis, se extrajeron datos mediante scraping de una pagina web de estadisticas de futbol utilizando Python, y luego fueron transformados para su visualizacion en Power BI.

Proyecto 2: Caso de Negocio + Business Experimentation

PythonAnalisis de NegocioExperimentacion

Una empresa de retail nacional, lider en la venta de productos electronicos, ha decidido expandirse a nuevos mercados regionales. Actualmente opera en cinco ciudades principales y desea extender su presencia a tres nuevas ciudades donde aun no tiene operaciones. La direccion necesita una estrategia basada en datos para maximizar la rentabilidad y minimizar los riesgos asociados con esta expansion.

Proyecto 3: Shipping Container OCR

PythonYOLOv8EasyOCRComputer Vision

Este proyecto implementa un pipeline hibrido de deteccion y OCR para identificar, validar y hacer seguimiento de codigos ISO 6346 en contenedores maritimos. Combina modelos YOLOv8 para deteccion de regiones y caracteres con EasyOCR como metodo de respaldo y metodos de validacion.

📚 Cursos y Certificaciones

Ingenieria de Datos

HUMAI · 2025

La carrera de Ingeniería de Datos tiene como objetivo formar profesionales especializados en diseñar, construir y optimizar sistemas que permitan la gestión eficiente de grandes volúmenes de datos. El egresado podrá desempeñarse en roles como ingeniero de datos o arquitecto de datos junior, con habilidades en integración de datos, manejo de bases de datos, desarrollo de pipelines de datos y despliegue de soluciones escalables que faciliten el análisis y la toma de decisiones.

Fundamentos de Ingenieria de DatosBases de Datos SQL y NoSQLETL y Pipelines de DatosBig Data y Procesamiento con PySparkPython AvanzadoAutomatización y Orquestación de Pipelines
Ver Certificado

Desarrollo con Docker

Dev/Talles · 2025

Poder crear, usar, y desplegar imágenes es una habilidad necesaria para cualquier desarrollador o administrador de hoy en día, ahorra mucho tiempo en la preparación de diferentes ambientes de desarrollo, testing, staging y production.Este curso te dará las más que las bases para poder utilizar Docker de una forma productiva y funcional, aprenderemos mediante ejercicios prácticos y tareas.

Dockerfiles e ImagenesDocker ComposePersistencia y RedesDeploy y Buenas Practicas
Ver Certificado

Certificacion Profesional en Analisis de Datos de Google

Google · 2024

La certificacion en analisis de datos de Google cubre los conceptos fundamentales del analisis de datos, incluyendo herramientas y tecnicas para transformar datos en insights significativos.

Fundamentos del Analisis de DatosPreparacion de DatosAnalisis de Datos en ExcelVisualizacion de DatosAnalisis Predictivo
Ver Certificado

Certificacion Profesional en Analisis de Datos con Microsoft Power BI

Microsoft · 2024

Certificacion disenada para capacitar en el uso de Power BI como herramienta para transformar datos en insights significativos, con enfoque en manejo de datos, visualizacion y creacion de informes interactivos.

Introduccion a Power BIPreparacion de Datos para el AnalisisVisualizacion de DatosModelado de Datos con DAXCreacion de Informes y Dashboards
Ver Certificado

📖 Libros

Portada de Fundamentals of Data Engineering

Fundamentals of Data Engineering

Joe Reis & Matt Housley

Data Engineering

Guia completa sobre el ciclo de vida de la ingenieria de datos, desde la generacion hasta el servicio de datos, cubriendo arquitecturas, herramientas y mejores practicas.

Portada de Software Engineering for Data Scientists

Software Engineering for Data Scientists

Catherine Nelson

Software Engineering

Principios de ingenieria de software aplicados a proyectos de ciencia de datos, incluyendo testing, control de versiones, y diseno de codigo mantenible.

Gonzalo Diaz

Gracias por visitar mi pagina!

Me alegra que hayas explorado mis proyectos de Data. Si te interesa charlar o colaborar, puedes contactarme a traves de mi email:

No dudes en escribirme!