효율적인 프로그래밍을 위해 병렬 프로그래밍을 하곤 합니다. joblib은 파이썬 프로그래밍에서 병렬처리를 가능하게 만들어줍니다. 파이썬에는 병렬 연산 디폴트 패키지로 multiprocessing이 있습니다. multiprocessing은 pandas의 DataFrame을 다루는 데에 유용하며, joblib은 일반적인 python 코딩에 두루 쓰입니다. joblib의 dump, load 메소드는 python 객체를 저장하거나 불러오게끔 할 수 있습니다. 본 게시물에서는 병렬 처리를 도와주는 joblib의 Parallel, delayed에 대한 설명을 하도록 하겠습니다. 설치 pip install joblib Thread 기반 병렬 처리 vs Process 기반 병렬 처리 joblib.Parallel은 기본..
안녕하세요 laeto입니다. 이번 글에서는 비트마스크에 대해 다뤄보도록 하겠습니다. 비트 마스크란? 컴퓨터의 최소 연산 단위는 bit입니다. bit는 이진수를 나타내기 위해 0과 1로만 이루어져 있죠. 우리는 이 비트 연산을 이용하여 문제를 빠르게 풀 수 있습니다. 예를 들어, 많은 알고리즘 문제에서 방문을 체크하는 리스트가 존재할 수 있습니다. 가령 10곳을 우리가 방문 체크해야 한다면 기존에는 아마 아래처럼 리스트를 이용하여 확인할 수 있습니다. visited = [False] * 10 하지만 비트마스크 기법을 이용한다면 똑같이 표현할 수 있습니다. visited = 0b0000000000 비트마스크에서 각 비트는 하위 주소(오른쪽)부터 인덱스를 세면 됩니다. 예를 들어 4번째 도시를 우리가 방문했다..
안녕하세요 laeto입니다. 이번 글에서는 리눅스(linux)에서 디스크 용량을 확인하는 방법을 알아보도록 하겠습니다. 주로 df, du 명령어를 많이 사용합니다. 두 명령어는 각각 어떤 상황에서 사용해야 할까요? df는 리눅스 시스템 전체의 디스크 사용량을 확인할 수 있습니다. 파일 시스템, 전체 디스크 용량, 현재 사용량, 남은 공간, 사용량, 그리고 마운트되어 있는 지점을 확인할 수 있습니다. df: 디스크에 남아있는 용량 확인 df -k: 킬로바이트(kb) 단위로 남은 용량 확인 df -m: 메가바이트(mb) 단위로 남은 용량 확인 그리고 -h 옵션을 통해 사용자가 보기 원하는 형태로 디스크의 정보를 확인할 수 있습니다. df -h: 좀더 깔끔한 형태로 디스크 용량 확인 다음은 du입니다. du는..
안녕하세요 laeto입니다. 이번 글에서는 아나콘다(anaconda) 가상환경에 대해 알아보고자 합니다. 가상환경이란? 독립적인 작업환경에서 패키지 및 버전관리를 하기 위한 가상의 환경 이런 작업 환경들을 프로젝트별로 관리하고 공유도 할 수 있도록 도와주는 것이 바로 가상환경입니다. $ conda create -n 가상환경이름 python==버전 가상환경 확인 현재 제가 생성해놓은 가상환경을 확인해봅시다. $ conda info --envs 가상환경 라이브러리 확인 $ conda env list 가상환경 삭제하기 $ conda remove -n 가상환경이름 --all 가상환경 활성화 / 비활성화 생성한 가상환경을 활성화하여 접근해보도록 하겠습니다. $ conda activate 가상환경이름 반대로 가상환..