- Today
- Total
내 머릿속 데이터베이스
https://github.com/lsegal/atom-runner/issues/94
다수의 테이블을 합쳐서 통계를 산출 시에 UNION을 많이 사용하게 된다. UNION과 UNION ALL의 차이는 다들 알고 있으리라 언급하자면 중복 데이터를 제거하는 과정이 UNION에 포함되어있다. 테이블을 합칠 때 UNION으로 합치게 되면 각 테이블마다 정렬이 들어가는 것을 실행계획을 통계 알 수 있다.(그래서 느리다.) UNION ALL 을 사용하게 되면 중복 상관없이 그냥 합쳐주기만 해서 빠르다.다수의 테이블인 경우엔 각 테이블마다 중복데이터를 제거해가면서 합치는 것보다 일단 다 합쳐놓고 중복데이터를 제거하는게 빠르다. 실제로 UNION을 이용한 쿼리에선 HIVE의 CBO(Cost-based Optimizer)가 동작하지 않는다. UNION ALL을 이용하여 테이블을 합치려다가 HIVE는 CT..
팀블로그 자료 퍼옴 http://wp.me/p7MUY6-1U
팀 블로그에 내가 쓴 글을 옮겨옴http://wp.me/p7MUY6-q
날려먹고 이 글이 3번째 쓰는 글이다. 이번이 마지막이길. 파이썬 쓰레드는 GIL(Global Interpreter Lock) 때문에 오히려 싱글쓰레드보다 속도저하가 일어난다는 사실은 파이썬 개발자라면 다 알 것이다. 모른다면 관련 글인 아래를 참고... 하용호 - 파이썬으로 클라우드 하고 싶어요 : http://www.slideshare.net/kthcorp/h32011c6pythonandcloud-111205023210phpapp02파이썬의 멀티쓰레딩과 멀티프로세스 : http://qkqhxla1.tistory.com/m/post/270 위 글에선 싱글스레드로 3.34초가 나오는 연산이 듀얼스레드로 4.65초가 나온다고 했다. 위 내용은 오래된 내용으로 파이썬 2.x 버전에선 계속 나타날 것이라 생각..