Gonzalo Diaz | Data Analyst

Portada
馃憢

Sobre mi

隆Hola! Soy Gonzalo, Analista de Datos y nacido en Argentina. Actualmente estoy cursando la Tecnicatura en Ciencia de Datos y perfeccionando mis habilidades en Machine Learning y Data Analytics. Tengo experiencia con herramientas como PostgreSql, Power BI, Qlik Sense, Python y R.

Como Analista de datos, ayudo a las empresas a tomar decisiones basadas en datos y a optimizar sus operaciones mediante visualizaciones y an谩lisis de datos. Estoy continuamente ampliando mis conocimientos y experiencia, con el objetivo de contribuir al campo de la ciencia de datos.

Te invito a explorar mi repositorio donde comparto mis proyectos. Si compartimos intereses o quieres hablar sobre datos, no dudes en conectarte conmigo. 隆Ser谩 un placer conversar!

馃攳 脕reas de Enfoque

馃

Machine Learning

  • Desarrollo de modelos de predicci贸n, clasificaci贸n y segmentaci贸n.
  • Aplicaci贸n de algoritmos de aprendizaje supervisado (como regresi贸n lineal, 谩rboles de decisi贸n, random forest, XGBoost, etc.) y no supervisado (clustering con k-means, PCA, etc.).
  • Evaluaci贸n de desempe帽o mediante m茅tricas como accuracy, recall, F1-score, ROC-AUC, entre otros.
  • Preprocesamiento de datos: limpieza, transformaci贸n, imputaci贸n y selecci贸n de variables.
馃搳

Data Visualization

  • Construcci贸n de dashboards interactivos y reportes visuales adaptados a usuarios t茅cnicos y no t茅cnicos.
  • Uso de herramientas de Business Intelligence como Power BI y Qlik Sense para representar datos de manera clara, accesible y visualmente atractiva.
  • Desarrollo de visualizaciones en Python con librer铆as especializadas como Plotly, Matplotlib y Seaborn
  • Enfoque en la comunicaci贸n efectiva de hallazgos, con 茅nfasis en el storytelling con datos.
馃寪

Desarrollo Web / Backend con Python

  • Creaci贸n de aplicaciones web y APIs RESTful utilizando el framework Django.
  • Dise帽o y construcci贸n de modelos de datos, interfaces administrativas y autenticaci贸n de usuarios.
  • Integraci贸n entre el servidor, base de datos y cliente, facilitando la consulta y visualizaci贸n de datos en tiempo real.
  • Automatizaci贸n de tareas anal铆ticas y despliegue de modelos de Machine Learning en producci贸n.
  • Gesti贸n de permisos, rutas seguras y validaci贸n de formularios para mejorar la interacci贸n del usuario con el sistema.

Tech Stack

Python Pandas NumPy scikit-learn Computer Vision MongoDB GitHub PostgreSQL TensorFlow Docker Linux Django
馃帗

Educaci贸n

Instituto Superior Tecnol贸gico Empresarial Argentino

Tecnicatura en Ciencia de Datos e Inteligencia Artificial

Formaci贸n orientada al an谩lisis estad铆stico, procesamiento de datos, desarrollo de modelos de machine learning y deep learning, con aplicaciones en visi贸n por computadora, procesamiento de lenguaje natural y sistemas predictivos. Incluye conocimientos s贸lidos en programaci贸n (Python, R, SQL), bases de datos, matem谩ticas, estad铆stica y 茅tica en la inteligencia artificial.

Durante la carrera se adquieren competencias para liderar proyectos de ciencia de datos, dise帽ar soluciones basadas en IA, y comunicar resultados de forma clara y efectiva. Se trabajan herramientas como pandas, NumPy, scikit-learn, redes neuronales y t茅cnicas de Big Data, aplicadas en contextos reales a trav茅s de pr谩cticas profesionalizantes.

  • An谩lisis estad铆stico y matem谩tico
  • Programaci贸n y desarrollo de software
  • Miner铆a de datos y machine learning
  • Visualizaci贸n de datos
  • Bases de datos y big data

Universidad del Gran Rosario

Licenciatura en Ciencia de Datos

La Licenciatura en Ciencia de Datos de la Universidad del Gran Rosario ofrece una formaci贸n s贸lida en estad铆stica aplicada, ingenier铆a de software, aprendizaje autom谩tico, aprendizaje profundo, procesamiento de lenguaje natural y visi贸n por computadora. A lo largo del plan de estudios se abordan herramientas de software para an谩lisis de datos, metodolog铆as de investigaci贸n y desarrollo de proyectos tecnol贸gicos orientados a problemas reales.

El perfil del egresado est谩 orientado a la aplicaci贸n pr谩ctica de t茅cnicas avanzadas de ciencia de datos para resolver desaf铆os complejos en diversos sectores. Se adquieren competencias para:

  • Dise帽ar, implementar y comunicar soluciones anal铆ticas
  • Desarrollar modelos predictivos
  • Gestionar sistemas de datos
  • Participar en equipos multidisciplinarios
  • Aportar valor estrat茅gico a la toma de decisiones basada en datos
馃捇

Proyectos de An谩lisis de Datos

Este repositorio est谩 pensado para demostrar no solo habilidades t茅cnicas, sino tambi茅n una visi贸n integral del ciclo de vida del dato, desde la extracci贸n y transformaci贸n hasta su an谩lisis, visualizaci贸n y presentaci贸n a usuarios finales o despliegue en entornos reales.

Proyecto 1: Visualizaci贸n de Estad铆sticas

El objetivo de este proyecto es analizar y visualizar la fase ofensiva del Manchester City durante la temporada 2023/2024 en la Premier League, con un enfoque especial en los pases y tiros. Para realizar este an谩lisis, se extrajeron datos mediante scraping de una p谩gina web de estad铆sticas de f煤tbol utilizando Python, y luego fueron transformados para su visualizaci贸n en Power BI.

Proyecto 2: Caso de Negocio + Business Experimentation

Una empresa de retail nacional, l铆der en la venta de productos electr贸nicos, ha decidido expandirse a nuevos mercados regionales. Actualmente opera en cinco ciudades principales y desea extender su presencia a tres nuevas ciudades donde a煤n no tiene operaciones. La direcci贸n necesita una estrategia basada en datos para maximizar la rentabilidad y minimizar los riesgos asociados con esta expansi贸n.

Proyecto 3: An谩lisis Exploratorio de Datos

El An谩lisis Exploratorio de Datos es una etapa fundamental en cualquier proyecto de ciencia de datos. A trav茅s del EDA, se busca explorar los datos de manera sistem谩tica para entender mejor su estructura, distribuci贸n y relaciones entre las variables. En este proyecto, el dataset utilizado contiene informaci贸n sobre la calidad de los vinos, con varias caracter铆sticas que describen sus propiedades f铆sicas y qu铆micas.

馃摎

Mis Cursos

Certificaci贸n Profesional en An谩lisis de Datos de Google

Resumen de la Certificaci贸n

La certificaci贸n en an谩lisis de datos de Google cubre los conceptos fundamentales del an谩lisis de datos, incluyendo herramientas y t茅cnicas para transformar datos en insights significativos. Est谩 orientada a principiantes y proporciona habilidades pr谩cticas aplicables en el mundo real.

Descripci贸n de los Cursos

  1. Fundamentos del An谩lisis de Datos: Introducci贸n a los conceptos b谩sicos del an谩lisis de datos, incluyendo el ciclo de vida de los datos y las habilidades necesarias para ser un analista de datos.
  2. Habilidades de Preparaci贸n de Datos: Se centra en la recopilaci贸n y limpieza de datos. Aprender谩s a usar hojas de c谩lculo y SQL para organizar datos de manera efectiva.
  3. An谩lisis de Datos en Excel: Ense帽a a usar Excel para realizar an谩lisis de datos, incluyendo f贸rmulas, gr谩ficos y an谩lisis de tendencias, para extraer insights valiosos.
  4. Visualizaci贸n de Datos: Aprendes a crear visualizaciones efectivas utilizando herramientas como Tableau y Google Data Studio para comunicar hallazgos de manera clara y atractiva.
  5. An谩lisis Predictivo: Introducci贸n a t茅cnicas de an谩lisis predictivo utilizando herramientas de an谩lisis y algoritmos para hacer pron贸sticos basados en datos hist贸ricos.
  6. Proyecto Final: Un proyecto pr谩ctico donde aplicas todas las habilidades adquiridas en un estudio de caso real, creando un an谩lisis completo que demuestre tu capacidad como analista de datos.

Certificaci贸n Profesional en An谩lisis de Datos con Microsoft Power BI

Resumen de la Certificaci贸n

La certificaci贸n en An谩lisis de Datos con Microsoft Power BI est谩 dise帽ada para capacitar a los estudiantes en el uso de Power BI como herramienta para transformar datos en insights significativos. Se enfoca en el manejo de datos, la visualizaci贸n y la creaci贸n de informes interactivos.

Descripci贸n de los Cursos

  1. Introducci贸n a Power BI: Proporciona una visi贸n general de Power BI, su interfaz, y c贸mo conectar y cargar datos desde diferentes fuentes.
  2. Preparaci贸n de Datos para el An谩lisis: Se centra en la limpieza y transformaci贸n de datos utilizando Power Query para garantizar que los datos est茅n listos para el an谩lisis.
  3. Visualizaci贸n de Datos: Ense帽a a crear visualizaciones interactivas y a utilizar gr谩ficos y tablas para representar datos de manera efectiva en Power BI.
  4. Modelado de Datos: Introducci贸n a la creaci贸n de modelos de datos, incluyendo relaciones y c谩lculos, utilizando DAX (Data Analysis Expressions).
  5. Creaci贸n de Informes y Dashboards: Aprendes a dise帽ar informes y dashboards interactivos en Power BI para comunicar resultados a diferentes audiencias.
  6. Compartir y Colaborar: Este curso aborda c贸mo compartir y colaborar en informes y dashboards utilizando el servicio en l铆nea de Power BI.
  7. Proyecto Final: Aplicaci贸n de las habilidades adquiridas en un proyecto pr谩ctico que consiste en el desarrollo de un informe y un dashboard de Power BI a partir de un conjunto de datos real.

DataTalks - Machine Learning Zoomcamp

Parte 1: Algoritmos de Machine Learning

La Parte 1 se centra en los principales algoritmos de aprendizaje autom谩tico y su aplicaci贸n pr谩ctica utilizando Python. Los temas tratados incluyen:

  • Regresi贸n Lineal: Ingenier铆a de caracter铆sticas, manejo de variables categ贸ricas y la importancia de la regularizaci贸n.
  • Clasificaci贸n: Regresi贸n log铆stica y la importancia de las caracter铆sticas.
  • 脕rboles de Decisi贸n y Aprendizaje por Conjuntos: T茅cnica de boosting por gradiente y XGBoost, un popular algoritmo de aprendizaje por conjuntos.
  • Redes Neuronales y Aprendizaje Profundo: Redes Neuronales Convolucionales (CNN) y t茅cnicas de transferencia de aprendizaje para abordar problemas complejos con aprendizaje profundo.
  • Python y Jupyter Notebooks: Trabajo de manera eficiente con c贸digo.
  • NumPy y Pandas: Conceptos de 谩lgebra lineal como matrices y manipulaci贸n y an谩lisis de datos.
  • Matplotlib y Seaborn: Visualizaci贸n de datos y representaciones gr谩ficas.
  • Scikit-Learn: Aplicaci贸n de varios algoritmos de aprendizaje autom谩tico a conjuntos de datos del mundo real.
  • TensorFlow y Keras: Frameworks populares para construir redes neuronales y modelos de aprendizaje profundo.
Part 1: Machine learning algorithms and their implementation

Parte 2: Despliegue de Modelos

La Parte 2 est谩 dedicada al despliegue de modelos, que implica poner modelos de aprendizaje autom谩tico en producci贸n. En esta secci贸n, adquirir谩s habilidades pr谩cticas utilizando marcos y herramientas populares. Los temas tratados incluyen:

  • Flask, Pipenv y Docker: Despliegue de modelos de aprendizaje autom谩tico, lo que te permitir谩 trasladar tus modelos de notebooks a servicios y aplicaciones.
  • AWS Lambda y TensorFlow Lite: Aprendizaje profundo sin servidor, comprendiendo c贸mo operar de manera eficiente dentro de este paradigma.
  • Kubernetes y TensorFlow Serving: Automatizaci贸n del despliegue, escalado y gesti贸n de aplicaciones en contenedores.
Part 2: Deployment