- Today
- Total
내 머릿속 데이터베이스
하둡 배포 업체 하둡은 오픈소스 아파치 프로젝트라서 이를 이용하여 여러가지 개선된 버전의 하둡이 등장. 대표적인 플랫폼은 다음과 같다. 참고 : '하둡'이라면 알아야 할 업체 9곳의 장단점(http://cafe.daum.net/kosena21/SkmT/37) 아마존 웹 서비스(AWS)호튼웍스(Hortonworks) - HDP(Hortonworks Data Platform)클라우데라(Cloudera)IBMIntel맵R 테크놀로지(MapR Technologies)피보탈 소프트웨어(Pivotal Software)테라데이타(Teradata) 클라우데라는 하둡을 기반하지만 순수 오픈소스 제품이 아님. 클라우데라는 자체 제품에 클라우데라 매니저(claudera manager)라는 관리와 모니터링 툴부터 임팔라(Im..
출처 : http://ji-ggu.tistory.com/entry/Amazon-Elastic-Compute-Cloud-Amazon-EC2Amazon Elastic Compute Cloud (EC2)는 클라우드에서 컴퓨팅의 파워에 따라 규모를 자유자재로 변경할 수 있는 웹 서비스입니다. Amazon EC2는 사용자가 필요한 만큼의 용량을 얻어 구성할 수 있는 간단한 웹 서비스 인터페이스를 제공하며, 컴퓨팅 리소스에 대한 완전한 제어권을 제공하며, 새로운 인스턴스를 획득하여 부팅하는 시간을 단축시켜 컴퓨팅 요구 사항 변화에 따라 신속하게 용량의 축소와 확장이 가능합니다. 또한 사용한 용량만큼의 비용만 지불하기 때문에 컴퓨팅의 비용을 절약할 수 있습니다. 1. 컴퓨팅 용량 조절 Amazon EC2는 여러개의 ..
http://blog.naver.com/pusan1roomm/70171032304 http://blog.naver.com/ggg03062/60182503402
출처 : Sir커뮤니티 (http://sir.co.kr/bbs/board.php?bo_table=pg_tip&wr_id=13055) 여기저기 SQL 관련 포럼을 다니다보면, 아주 기본적인 통계산출 방법중에 하나인 count, sum 을 활용하지 못하는 경우를 많이 봅니다.... 이럴 땐 정말 안타까운 마음이 들기도합니다. .......................................... 저는 오라클을 문법으로 SQL을 작성합니다. (제가 오라클만 써봤기때문입니다.) 가끔 QnA 에 Oracle 로 쉽게 구현이 되나 mySQL 로 구현이 안되는 부분을 많이 접합니다....mySQL로 되는지 안되는지는 저도 알수없습니다...ㅡㅡ;;모르기때문에... 하지만 sum() count() 와 같은 그룹함수..
질의(결과 입력) * hive 테이블에 입력hive> insert overwrite table zipcode_result select zip, sido, gugun, dong, doro from zipcode where ver='2012-01-01' and doro like '%역%'; * 결과를 HDFS에 저장hive> insert overwrite directory '/tmp/zipcode_result'select zip, sido, gugun, dong, doro from zipcode where ver='2012-01-01' and doro like '%역%'; * 결과를 로컬 디렉토리에 저장hive> insert overwrite local directory '/tmp/zipcode_result..