- Today
- Total
목록파이썬 (3)
내 머릿속 데이터베이스
R을 이용해 데이터 분석을 하다가 Anaconda를 접하게 되었다. 데이터 분석과 관련된 파이썬 패키지들을 손쉽게 설치하고 다룰 수 있다. 관련글은 아래에.아나콘다 설치법 : https://medium.com/@younggun/anaconda-fe67e9c9709d#.51374wgvd아나콘다 공식홈페이지 : https://www.continuum.io파이썬을 이용한 시스템 트레이딩(기초편) : https://wikidocs.net/book/110
https://www.acmicpc.net/blog/view/16위 예제의 다음 코드를 실행하니 CP949 관련 에러가 났다. 인코딩 에러가 나는 라인은 웹페이지의 일본어 텍스트를 파싱할 때 발생했다. 이 문제를 해결하려고 UTF-8 부터 CP949부터 모든 인코딩 관련 처리를 스택오버플로우에서 검색해서 다 사용해봤지만 결국 찾아낸 원인은 단순했다. 웹페이지도 UTF-8 캐릭터셋이 맞고, 파이썬도 utf-8 캐릭터셋을 사용하는데 출력하는 콘솔(도스창)이 CP949 캐릭터셋을 쓴다.일본어는 한글 윈도우에서 사용하는 CP949 캐릭터셋을 지원하지 않아서, 내부 값들은 잘 저장되더라도 출력하지 못하는 것이었다. 어쨋거나 출력 결과를 콘솔에 띄워보기 위해서 cp949 캐릭터셋을 지원하지 않는 캐릭터들은 걍 날려..
파이썬에서 Mysql을 접속하는 방법은 PyMysql 라이브러리를 이용하는 편이다. 그래서 Hive를 접속하려고 pyHive를 받아보았으나 에러가 펑펑 난다. 알아보니 개발이 늦다. hive를 접속할 수 있는 라이브러리들을 뒤지기 시작했고, pyhs2 요놈을 또 많이들 쓴다고는 하는데 깃헙을 보면 알겠지만 개발자도 포기했다. 따라서 마지막 방법은 ODBC를 활용하는 것이었고, 나는 hortonworks 하둡을 사용하니, 호튼웍스에서 odbc를 다운받아 설치하였다. 도큐멘트 항목을 읽어보니 driver항목의 명시를 조금 특이하게 하는 것 같아서 접속이 안되고, 직접 ODBC 설정으로 dsn을 생성해서 DNS명으로 접속해야 했다. import pyodbc cnxn = pyodbc.connect('DSN=HI..