Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Appearance settings

Spotify-DemoProject/docs

Open more actions menu

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
14 Commits
 
 

Repository files navigation

  • README.md is written in KOREAN

Spotify Demo Project

Spotify API로부터 앨범 및 아티스트 데이터를 수집 & 적재하는 자동화 데이터 파이프라인입니다.
간단한 사용자 추천 시스템을 구현하고 있습니다.

Pipeline Structure

스크린샷 2024-01-08 오후 2 36 23

Used Stacks

Scheduling

  • Airflow (Docker 기반의 서비스 빌드) : API 서버 작업 스케줄링 & Kafka 메세지 발행
  • Cron : Postgres DB 백업 & Spotify Access Token 재발급

API & ETL

  • FastAPI + uvicorn[standard] : ETL 프로세스 수행

Processing

  • Spark
    (Streaming Kafka Application) : Kafka 메세지의 파라미터를 기반으로 데이터 가공
    (ML) : 데이터 분석 및 추천 시스템 구현
  • Kafka : Spark 어플리케이션 작업 스케줄링

DL(Storage)

  • PostgreSQL : 반복 사용 API 파라미터 적재
  • AWS S3 : 백업 스냅샷(.sql) 및 가공 데이터(.parquet) 적재

Monitoring

  • Grafana: Kafka 서버 모니터링

Results

Parquet 데이터 적재 (앨범 / 아티스트)

스크린샷 2023-12-30 오후 9 57 48

Postgres 데이터 백업

스크린샷 2023-12-31 오후 9 03 25

추천 시스템 구현

스크린샷 2024-01-08 오후 2 40 35

About

Spotify Demo Project 소개 페이지

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Morty Proxy This is a proxified and sanitized view of the page, visit original site.