Tezμ MR
Hiveμλ MapReduce μμ§κ³Ό Tez μμ§, Spark μμ§μ΄ μλ€. μ΄μ€ Tezμ MRμ μ°¨μ΄λ₯Ό μμ보μ.
MapReduce
- ν¬κ² λ°μ΄ν°λ₯Ό μνλ Key-Value ννλ‘ λ§λλ μμ μΈ Mapκ³Ό Map μμ μ΄ λλ λ°μ΄ν°λ₯Ό ν©μΉλ Reduce μμ μΌλ‘ λλ μ μλ€.
- Map-Reduce μμ ν HDFSμ μ μ₯μ λ°λ³΅νλ κ³Όμ μμ Disk I/Oκ° λ°μνκ² λμ΄ μμ μ μλκ° λλ €μ§κ² λλ€.
Tez
- 미리 μ€νκ³νμ κ³μ°νμ¬ DAG(λΉλκΈ° μ¬μ΄ν΄ κ·Έλν)λ‘ μμ μμ, 리μμ€λ₯Ό μ΅μ ν νμ¬, Map λ¨κ³μ λ°μ΄ν°λ₯Ό Diskκ° μλ Memoryμ μ μ₯νμ¬ Reduceμ μ λ¬ν¨μΌλ‘μ¨ λ°μ΄ν° μμ μ²λ¦¬ μλλ₯Ό μ¦κ°μμΌμ€λ€.
- Stage(Map-Reduceκ° λ°λ³΅λμ΄ Disk I/Oκ° λ°μνλ λ¨κ³)κ° λλμ΄μ§μ§ μλ κ°λ¨ν μμ μ λν΄μλ μ²λ¦¬μλ ν₯μμ κΈ°λνκΈ° μ΄λ ΅λ€.
κ·Έλ¦ΌμΌλ‘ 보면 μλμ κ°λ€.
νμ΄λΈ μ€ν μμ§ μ€μ μ hiveμμ μλμ κ°μ΄ ν μ μλ€.
set hive.execution.engine=mr;
set hive.execution.engine=tez;
Leave a comment