일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 그리디
- 프로그래머스
- BOT
- 백준 온라인 저지
- MySQL
- datacamp
- leetcode
- data_engineer
- terraform
- Python
- airflow webserver
- 2023년 목표
- SQL
- delete join
- Data Engineering
- 백준온라인저지
- telegram
- docker container
- hackerrank
- Spark
- 빅데이터를 지탱하는 기술
- 알고리즘
- dsf
- Pseudo Lab
- Dynamic Programming
- 데이터 엔지니어
- docker image
- airflow architecture
- docker
- Airflow
Archives
- Today
- Total
Lim Seunghyun Space
Airflow 구조 본문
Single Node Architecture
Multi Node Architecture
airflow 실행 구조
Single Node Architecture
- Single Node Architecture : 하나의 서버에서 실행되는 아키텍처
- Metadata Database에서 메타 정보를 가지고 있으므로, Webserver와 Scheduler가 메타 정보를 읽어온다.
- Executor에서 Scheduler에 의해 DAG가 실행된다.
- Metadata Database에서 실행 중인 DAG의 정보가 업데이트된다.
Multi Node Architecture
- Multi Node Architecture : Worker를 여러 노드로 구성한 구조
- Celery Broker(Queue) : Queue에 Task들을 담고 각 Worker 노드에서 Task를 받아 실행한다. (단일 노드 구조와의 큰 차이)
- 실행한 정보는 Metadata Database에 업데이트를 시켜준다.
Airflow 실행 구조
- Task로 구성된 DAG를 작성
- Web Server와 Scheduler가 DAG를 파싱
- Scheduler는 Metadata Database를 통해 DAG Run Object 생성 및 실행
- DAG Run : 작성한 DAG의 인스턴스
- Scheduler는 Task Instance를 스케쥴링
- Trigger에 의해 Executor는 Task Instance를 실행
- Task를 수행 후 Metadata Database에 DAG의 상태를 완료로 변경
- Web Server와 Scheduler는 Metadata Database의 업데이트 된 정보를 확인
Reference
- Single Node Architecture : https://airflow.apache.org/docs/apache-airflow/stable/concepts/overview.html
- Mutli Node Architecture : https://apache.googlesource.com/airflow-on-k8s-operator/+/HEAD/docs/design.md
728x90
'Data Engineering > Airflow' 카테고리의 다른 글
airflow WEB UI - DAG Details (0) | 2022.01.20 |
---|---|
airflow Web UI 살펴보기 - DAGs (0) | 2022.01.20 |
airflow user 관리 (0) | 2022.01.20 |
Airflow (0) | 2021.12.17 |
[Airflow] Airflow 설치 (0) | 2021.12.03 |