전체 글

(tensor == target_value).nonzero(as_tuple=True) python list에서 특정 값의 index를 찾는 것 처럼 tensor에서 특정 값의 index 위치 정보를 얻고 싶으면 상단 command를 활용하면 된다. 아래는 이를 활용한 예제 new_sizes = tensor([4, 4, 0, 4, 4, 4, 3, 4, 4, 4, 0, 4, 4, 4, 0, 4, 4, 4, 0, 4, 4, 4, 3, 4, 4, 4, 0, 4, 4, 4, 0, 4, 4, 4, 0, 4, 4, 4, 0, 4, 4, 5, 0, 4, 4, 4, 0, 4, 4, 4, 0, 4, 4, 4, 0, 4, 4, 4, 3, 4, 4, 4, 3, 4, 4, 6, 3, 4, 4, 5, 3, 4, 4, 4, 0, ..
pytorch로 구성된 모델을 로딩하는 도중, 아무런 반응이 없이 멈춰있는 경우가 발생했다. 실제 Ctrl C로 로그를 살펴보니 아래처럼 cpp_extension.py에서 time.sleep으로 멈춘 경우가 발생했다. File "/opt/conda/envs/PROJECT/lib/python3.8/site-packages/torch/utils/cpp_extension.py", line 1080, in load return _jit_compile( File "/opt/conda/envs/PROJECT/lib/python3.8/site-packages/torch/utils/cpp_extension.py", line 1307, in _jit_compile baton.wait() File "/opt/conda/e..
pdf2image라는 패키지를 사용해서 PDF 내 각 페이지를 이미지로 저장해보자. 아래 커맨드로 pdf2image를 설치해준다. pip install pdf2image 아래는 내가 짠 샘플 코드로, 각 pdf 별 세부 하위폴더를 만든 후 페이지 별 이미지를 저장하게끔 하였다. 코드는 단순하고, 주석도 넣어놨기 때문에 부가적인 설명은 제외한다. 추가적으로 glob, tqdm 정도만 pip로 설치해줘도 될 것 같다. import os import glob from pdf2image import convert_from_path from tqdm import tqdm if __name__ == "__main__": # target_path : pdf 문서가 있는 경로 target_path = "./pdf_da..
다음과 같이 짝수개 요소가 들어있는 list를 보고, 두개씩 짝지어서 return하고 싶을 때 간단한 기록용 #for문을 쓰면 직관적이지만, 깔끔하지 못함 test = [1, 2, 3, 4, 5, 6, 7, 8] new = [] for i in range(0, len(test), 2): new.append([test[i], test[i+1]]) print(new) #[[1, 2], [3, 4], [5, 6], [7, 8]] 한줄로 묶기위해선 zip과 list slicing을 활용 # 한 줄로 작성 test = [1,2,3,4,5,6,7,8] result = [[x, y] for x, y in zip(test[0::2], test[1::2])] print(result) # [[1, 2], [3, 4], [..
1. ColorThief PIL, python을 기반으로 하고 있는 모듈로 특정 이미지 내 color palette를 추출하거나 대표 컬러를 추출할 수 있음. 설치 방법은 아래 PIP 명령어 참고 $pip install colorthief 사용법은 아래와 같다 ColorThief 설치 후, 이미지를 colorthief 객체에 넣어준다. get_color 함수와 get_palette함수로 원하는 컬러를 얻어온다. 각 함수에 대한 자세한 설명은 다음 링크를 참고하자. GitHub - fengsp/color-thief-py: Grabs the dominant color or a representative color palette from an image. Uses Python and Pillow Grabs t..
json 으로 열고 작성할 때, 아래 사진과 같이 unicode형태로 한글이 저장되는 현상이 존재한다. with open(output_jsonpath, 'w', encoding='utf-8-sig') as f: output_json = json.dumps(output_json_dict, ensure_ascii=False, indent='\t') f.write(output_json) 다음과 같이 "ensure_ascii=False"를 dumps 함수 인자로 넣어주면 해당 현상이 사라진다.
pip로 Package 설치 또는 삭제 과정에서 다음과 같은 에러를 뱉는 경우가 존재한다. 이럴 때는 아래와 같이 "--ignore-installed" 옵션을 두어서 설치하면 정상적인 설치가 가능하다. pip install --ignore-installed PACKAGE_NAME # 만약 requirements.txt로 한번에 여러 패키지를 설치할때도 동일하게 처리해 주면 된다. pip install --ignore-installed -r requirements.txt
https://datacarpentry.org/image-processing/aio/index.html#rgb-colour-table-optional-not-included-in-timing Image Processing with Python As computer systems have become faster and more powerful, and cameras and other imaging systems have become commonplace in many other areas of life, the need has grown for researchers to be able to process and analyse image data. Considering the large volu datac..
아래 링크 참고: https://stackoverflow.com/questions/4716533/how-to-attach-debugger-to-a-python-subproccess How to attach debugger to a python subproccess? I need to debug a child process spawned by multiprocessing.Process(). The pdb degugger seems to be unaware of forking and unable to attach to already running processes. Are there any smarter python stackoverflow.com import sys import pdb class Forke..
rsync --help로 옵션을 확인하고 진행 특정 파일을 제외하고 싶을 때 rsync -av --exclude '$FILE_NAME' $SRC_DIRECTORY $DST_DIRECTORY ex) rsync -a --exclude '*.txt' ./ ../target_folder 특정 디렉토리(폴더)를 제외하고 싶을 때 rsync -av --exclude '$FOLDER_NAME' $SRC_DIRECTORY $DST_DIRECTORY ex) rsync -av --exclude 'data' ./ ../target_folder +) 여러 폴더, 디렉토리, 파일을 제외하고 싶을 때 rsync -av --exclude {'$FOLDER_NAME','$FOLDER_NAME_2','$FILE_NAME','$FOLD..
Js.Y
Y초보프로그래머