Portada

Gonzalo Diaz Tamini

Data & AI

👋 Sobre mí

¡Hola! Soy Gonzalo, Data & AI Engineer de Argentina. Soy Técnico Superior en Ciencia de Datos y actualmente curso la Licenciatura en Ciencia de Datos en la Universidad del Gran Rosario.

Mi trabajo se centra en el desarrollo con IA: diseño y construcción de agentes inteligentes, automatización de flujos de datos y tareas de ingeniería de datos orientadas a producción. Me apasiona construir sistemas que no solo analicen información, sino que actúen sobre ella de forma autónoma y eficiente.

Mi perfil combina la solidez analítica del dato con la mentalidad de ingeniería necesaria para llevarlo a sistemas reales: pipelines robustos, modelos en producción y soluciones que generan impacto concreto.

Te invito a explorar mi repositorio, donde comparto proyectos en estas áreas. Si te interesa la IA aplicada, los datos o simplemente quieres intercambiar ideas, será un placer conectarnos.

🔎 Áreas de Enfoque

Ciencia de Datos

  • Desarrollo de modelos de predicción, clasificación, segmentación y series temporales para apoyar la toma de decisiones.
  • Aplicación de algoritmos de aprendizaje supervisado y no supervisado.
  • Preprocesamiento de datos: limpieza, normalización, imputación, ingeniería de características y selección de variables.
  • Optimización y validación de modelos con técnicas de cross-validation, hiperparámetros y pipelines reproducibles en producción.

Inteligencia Artificial

  • Diseño e implementación de agentes inteligentes capaces de automatizar procesos, interactuar con usuarios y tomar decisiones basadas en contexto.
  • Uso de frameworks como LangChain y n8n para la orquestación de flujos, integración de herramientas y construcción de pipelines escalables.
  • Aplicación de enfoques como prompt engineering, RAG (Retrieval-Augmented Generation) y diseño de herramientas (tools) para ampliar las capacidades de los agentes.

Ingeniería de Datos

  • Administración, modelado y optimización de bases de datos relacionales y no relacionales.
  • Diseño y orquestación de flujos de transformación de datos (DAGs) utilizando Apache Airflow.
  • Construcción de pipelines de datos escalables para ingesta, transformación y carga de datos (ETL/ELT).
  • Implementación de estrategias de gobernanza de datos: seguridad, trazabilidad y calidad.

🛠 Tech Stack

PythonComputer VisionPyTorchPostgreSQLDockerLinuxDjangoApache AirflowLangChainn8n

🎓 Educación

Instituto Superior Tecnológico Empresarial Argentino

Tecnicatura en Ciencia de Datos e Inteligencia Artificial

Formación orientada al análisis estadístico, procesamiento de datos, desarrollo de modelos de machine learning y deep learning, con aplicaciones en visión por computadora, procesamiento de lenguaje natural y sistemas predictivos. Incluye conocimientos sólidos en programación (Python, R, SQL), bases de datos, matemáticas, estadística y ética en la inteligencia artificial.

  • Minería de Datos
  • Programación y Desarrollo de software
  • Arquitectura de Soluciones
  • Visualización de datos
  • Bases de datos

Universidad del Gran Rosario

Licenciatura en Ciencia de Datos

La Licenciatura en Ciencia de Datos de la Universidad del Gran Rosario ofrece una formación sólida en estadística aplicada, ingeniería de software, aprendizaje automático, aprendizaje profundo, procesamiento de lenguaje natural y visión por computadora.

  • Visión por Computadora
  • Procesamiento de Lenguaje Natural
  • Aprendizaje por Refuerzo
  • Ingeniería del Software
  • Herramientas de Software para Análisis de Datos

💻 Proyectos

Este repositorio está orientado a demostrar no solo habilidades técnicas, sino también una visión integral del desarrollo y despliegue de modelos, abarcando proyectos de ingeniería de datos y la creación de workflows con agentes de IA, desde la integración y automatización hasta su implementación en entornos reales.

Proyecto 1: Visualización de Estadísticas

PythonWeb ScrapingPower BI

El objetivo de este proyecto es analizar y visualizar la fase ofensiva del Manchester City durante la temporada 2023/2024 en la Premier League, con un enfoque especial en los pases y tiros. Para realizar este análisis, se extrajeron datos mediante scraping de una página web de estadísticas de fútbol utilizando Python, y luego fueron transformados para su visualización en Power BI.

Proyecto 2: Orquestación y Trazabilidad Logística

Airflown8nAutomatización

Sistema de orquestación y automatización de datos que unifica la información logística de exportación integrando las bases de datos con la API de tracking marítimo ShipsGo. El pipeline combina sincronización programada en Airflow con eventos en tiempo real en n8n, garantizando información estandarizada, confiable y siempre actualizada para la toma de decisiones operativas.

Proyecto 3: Shipping Container OCR

YOLOEasyOCRComputer Vision

Este proyecto implementa un pipeline híbrido de detección y OCR para identificar, validar y hacer seguimiento de códigos ISO 6346 en contenedores marítimos. Combina modelos YOLOv8 para detección de regiones y caracteres con EasyOCR como método de respaldo y métodos de validación.

Trazabilidad de datos · DAG shipsgo_sync_pipeline

Ciclo de descubrimiento, registro, sincronización y captura de cambios — ejecución cada 2 horas.

Diagrama de flujo del pipeline de sincronización ShipsGo Flujo completo del DAG: descubrimiento de bookings, registro contra la API ShipsGo, máquina de estados de sincronización, captura de cambios CDC y propagación de eventos en tiempo real vía n8n. tms.pedidos Base interna · Exportación discover_new_bookings Filtra sub-pedidos · ventana 3d shipsgo.booking Bulk insert · sync_status=PENDING SELECT INSERT get_bookings_to_sync batch_size=200 · elegibilidad Cola de prioridades 1. PENDING 2. RETRY 3. SYNCED (refresh) Filtros de elegibilidad next_sync_attempt_at ≤ now() sync_attempts < 7 is_active = TRUE sync_all_bookings_in_series · loop con 1s sleep entre llamadas register_booking() POST /ocean/shipments ShipsGo API Tracking multi-naviera get_shipment_details() GET /shipments/<id> upsert_full_snapshot() shipment + containers · transacción PENDING Recién descubierto delay inicial 1h RETRY Backoff exponencial attempts² + interval SYNCED Tracking activo refresh cada 2h COMPLETED Entregado · DISCHARGED is_active = FALSE PERMANENT_ERROR Booking inválido o max attempts (7) resultado del sync shipsgo.shipment Estado actual del viaje ETA · vessel · status shipsgo.container Tracking por contenedor last_movement shipment_history CDC · insert-only changed_fields[] container_history CDC · insert-only por container_number ETA change detection freeze 1d · eta_diff_days n8n · webhooks Lógica de eventos Equipos · BD interna Notificación + actualización
Tareas Airflow
API ShipsGo
Tablas operativas
Tablas CDC (historial)
Lógica de control
Servicios externos

📚 Cursos y Certificaciones

Ingeniería de Datos

Humai · 2025

La carrera de Ingeniería de Datos tiene como objetivo formar profesionales especializados en diseñar, construir y optimizar sistemas que permitan la gestión eficiente de grandes volúmenes de datos. El egresado podrá desempeñarse en roles como ingeniero de datos o arquitecto de datos junior, con habilidades en integración de datos, manejo de bases de datos, desarrollo de pipelines de datos y despliegue de soluciones escalables que faciliten el análisis y la toma de decisiones.

Fundamentos de Ingeniería de DatosBases de Datos SQL y NoSQLETL y Pipelines de DatosBig Data y Procesamiento con PySparkPython AvanzadoAutomatización y Orquestación de Pipelines
Ver Certificado

Desarrollo con Docker

Dev/Talles · 2025

Poder crear, usar, y desplegar imágenes es una habilidad necesaria para cualquier desarrollador o administrador de hoy en día, ahorra mucho tiempo en la preparación de diferentes ambientes de desarrollo, testing, staging y production. Este curso te dará las más que las bases para poder utilizar Docker de una forma productiva y funcional, aprenderemos mediante ejercicios prácticos y tareas.

Dockerfiles e ImágenesDocker ComposePersistencia y RedesDeploy y Buenas Prácticas
Ver Certificado

Certificación Profesional en Análisis de Datos de Google

Google · 2024

La certificación en análisis de datos de Google cubre los conceptos fundamentales del análisis de datos, incluyendo herramientas y técnicas para transformar datos en insights significativos.

Fundamentos del Análisis de DatosPreparación de DatosAnálisis de Datos en ExcelVisualización de DatosAnálisis Predictivo
Ver Certificado

Certificación Profesional en Análisis de Datos con Microsoft Power BI

Microsoft · 2024

Certificación diseñada para capacitar en el uso de Power BI como herramienta para transformar datos en insights significativos, con enfoque en manejo de datos, visualización y creación de informes interactivos.

Introducción a Power BIPreparación de Datos para el AnálisisVisualización de DatosModelado de Datos con DAXCreación de Informes y Dashboards
Ver Certificado

📖 Libros

Portada de Fundamentals of Data Engineering

Fundamentals of Data Engineering

Joe Reis & Matt Housley

Data Engineering

Guía completa sobre el ciclo de vida de la ingeniería de datos, desde la generación hasta el servicio de datos, cubriendo arquitecturas, herramientas y mejores prácticas.

Portada de Software Engineering for Data Scientists

Software Engineering for Data Scientists

Catherine Nelson

Software Engineering

Principios de ingeniería de software aplicados a proyectos de ciencia de datos, incluyendo testing, control de versiones, y diseño de código mantenible.

Portada de AI Engineering

AI Engineering

Chip Huyen

AI Engineering

Enseña cómo diseñar, construir, evaluar y optimizar aplicaciones con modelos fundacionales de Inteligencia Artificial, incluyendo prompting, RAG, fine-tuning, datos y despliegue eficiente.

Gonzalo Diaz Tamini

¡Gracias por visitar mi portfolio!

Me alegra que hayas explorado mis proyectos de Data. Si te interesa charlar o colaborar, puedes contactarme a través de mi email:

No dudes en escribirme!