Docker를 활용한 로컬에서 실행 가능한 AWS Glue PySpark ETL 예제
Jupyter Notebook을 이용해서 로컬 환경에서 Docker와 PySpark을 이용해서 AWS Glue에서 제공되는 Transform 함수들을 직접 실습해 볼 수 있습니다.
이 Jupyter Notebook은 Building an AWS Glue ETL pipeline locally without an AWS account 내용을 정리해서 만들었습니다.
자세한 내용은 AWS-Glue-ETL-PySpark-Cheatsheet.ipynb 참조하세요.