etl-pipelines

End-to-end Azure Data Factory project transforming raw sales data into customer-level insights using pivot transformation and storing results in Blob Storage.

data-transformation data-engineering blob-storage azure-data-factory etl-pipelines mapping-data-flows pivot-transformation

Updated

chetnarathore10 / data_warehouse_project

Star

This project demonstrates a comprehensive data warehousing and analytics solution, from building a data warehouse to generating actionable insights. Designed as a portfolio project, it highlights industry best practices in data engineering and analytics.

data-modeling data-architecture etl-pipelines analytics-and-reporting

Updated
TSQL

ragztigadi / BigData-ETL-Pipelines-Ecommerce

Star

Big Data ETL pipeline for Brazilian e-commerce data. Implements data ingestion, transformation, and storage using Apache Spark, Hadoop, and SQL. Designed for scalable data processing and analytics.

mysql sql mongodb python3 powerbi azure-databricks azure-devops etl-pipelines

Updated
HTML

angelxd84130 / Airflow-ETL

Star

Build ETL piplines on AirFlow to load data from BigQuery and store it in MySQL

mysql bigquery airflow etl apache-airflow etl-pipeline airflow-dags etl-pipelines

Updated
Python

prneidhardt / Apache-Data-Pipeline

Star

Sparkify project

python aws airflow-dags etl-pipelines

Updated
Jupyter Notebook

siddharthgada / Udacity-Data-Engineering-with-AWS-Nanodegree

Star

Complete portfolio of data engineering projects from Udacity's Data Engineering with AWS Nanodegree.

apache-spark relational-databases nosql-database airflow-dags etl-pipelines lakehouse-architectures automated-workflows-using-aws-services

Updated
Jupyter Notebook

Sakshingale / Data-Warehouse

Star

Modern Data Warehouse and Analytics Project implementing Medallion Architecture (Bronze, Silver, Gold) with ETL pipelines, SQL data modeling, and analytical reporting.

data-science sql sql-server etl data-warehouse sql-query data-engineering data-analytics datawarehousing data-analysis sqlserver data-science-portfolio datawarehouse data-cleaning datalake data-warehousing etl-job etl-pipelines data-lakehouse medallion-architecture

Updated
TSQL

Willie-Conway / IBM-Relational-Database-Administrator-with-GenAI-Portfolio

Star

🗄️ IBM Relational Database Administrator with GenAI Certificate Portfolio – A comprehensive collection of projects, labs, and assignments showcasing expertise in relational database administration, 🏘️data warehousing, 🔁ETL pipelines, and 🤖Generative AI integration for modern database management.

mysql linux sql postgresql data-engineering database-administration erd relational-databases apache-kafka data-modeling shell-scripting data-warehousing apache-airflow star-schema backup-restore snowflake-schema database-security etl-pipelines generative-ai sql-optimization

Updated
PLpgSQL

Willie-Conway / IBM-Data-Engineering-Portfolio

Star

🚀 A comprehensive showcase of projects and skills from the IBM Data Engineering Professional Certificate! 📚 Features include: 🔄 ETL pipelines, 🗄️ data warehousing, ⚡ big data processing with Spark/Hadoop, 🛠️ database administration, and 📈 business intelligence dashboards. Built with 🦾 to demonstrate real-world data engineering capabilities!

mysql python machine-learning sql kafka big-data apache-spark mongodb hadoop nosql postgresql databases data-visualization data-warehouse data-engineering business-intelligence data-analysis data-pipeline apache-airflow etl-pipelines

Updated
PLpgSQL

Ratnesh-181998 / AWS-Services-For-Data-Engineering-With-Projects

Star

Master the AWS Data Stack! 🚀 This repository features 15+ Industrial Data Engineering Projects covering Serverless ETL, Real-Time Streaming, & Data Warehousing. Hands-on labs for S3, Lambda, Spark, Airflow, Snowflake, Redshift, Kinesis, & Glue. Includes production-grade CICD pipelines. A complete roadmap to becoming a top Data Professional.

aws aws-lambda snowflake pyspark data-engineering amazon-kinesis amazon-dynamodb cicd amazon-redshift real-time-streaming amazon-s3 amazon-athena apache-airflow aws-step-functions aws-glue github-actions delta-lake etl-pipelines

Updated

edugmenes / azure-data-engineering

Star

This repository contains my first end-to-end Data Engineering project, built using Microsoft Azure Cloud and Azure Databricks with PySpark.

data cloud spark azure pyspark data-structures data-engineering databricks microsoft-azure delta-lake etl-pipelines lakehouse data-lakehouse medallion-architecture lakehouse-architectures

Updated
Jupyter Notebook

Improve this page

Add a description, image, and links to the etl-pipelines topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the etl-pipelines topic, visit your repo's landing page and select "manage topics."

Learn more

URL: https://github.com/topics/etl-pipelines

⇱ etl-pipelines · GitHub Topics · GitHub

etl-pipelines

Here are 44 public repositories matching this topic...

Zipstack / unstract

yobix-ai / extractous

Burla-Cloud / burla

patterns-app / patterns-devkit

level-vc / useful

datacompose / datacompose

Chek0rrdn / DataEngineer_ETL

abrahamkoloboe27 / Airflow-Pipeline-Dashboard-Compagnie-Aerienne

EmmanuelEzenwere / DataSift

ShxradJadhav / Azure-Data-Factory-Transformation-Project

chetnarathore10 / data_warehouse_project

ragztigadi / BigData-ETL-Pipelines-Ecommerce

angelxd84130 / Airflow-ETL

prneidhardt / Apache-Data-Pipeline

siddharthgada / Udacity-Data-Engineering-with-AWS-Nanodegree

Sakshingale / Data-Warehouse

Willie-Conway / IBM-Relational-Database-Administrator-with-GenAI-Portfolio

Willie-Conway / IBM-Data-Engineering-Portfolio

Ratnesh-181998 / AWS-Services-For-Data-Engineering-With-Projects

edugmenes / azure-data-engineering

Improve this page

Add this topic to your repo