728x90
반응형
nn.Embedding()을 사용할 때, input vocab_size를 잘못잡아주면서 오류가 발생..
device-side assert triggered
THCudaCheck FAIL file=/pytorch/aten/src/THC/THCCachingHostAllocator.cpp line=265 error=59 : device-side assert triggered *** RuntimeError: cuda runtime error (59) : device-side assert triggered at /pytorch/aten/src/THC/THCCachingHostAllocator.cpp:265
해결 방법으로는 Embedding(inputs)에서 inputs를 까봤을 때, vocab_size보다 큰 값이 들어갈 경우, 오류가 발생한다.
나같은 경우엔 뭣도 모르고 vocab을 992로 했는데 inputs안에 데이터가 bert vocab을 사용하면서, 아래와 같이 큰 값이 맵핑되버렸다.
vocab 사이즈를 잘 보고, 사용
[ 101, 4607, 1996, ..., 0, 0, 0],
[ 101, 3328, 2091, ..., 0, 0, 0],
[ 101, 3328, 2091, ..., 0, 0, 0],
이 외에도 아래 블로그에 따르면,
- Loss function은 -1, 255값을 받지 못함.
- 클래스 인덱스 번호가 1부터 시작하는 경우..
- softmax 함수에 잘못된 dimension을 넣은 경우 : 간혹 틀린 label -1이 들어가는 경우가 있는데 이것이 문제 유발
등등....
출처 : brstar96.github.io/shoveling/device_error_summary/
728x90
반응형
'사소한 Tip . 오류 해결법' 카테고리의 다른 글
Ubuntu Nvidia Process kill / GPU 프로세스 삭제 / Python(Ctrl+Z) Kill (0) | 2020.11.16 |
---|---|
Python 32bit, 63bit Check 확인법 (0) | 2020.10.26 |
Windows nvidia-smi / 윈도우 GPU 사용량 cmd 명령어 (0) | 2020.09.28 |
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape (0) | 2020.09.24 |
Jupyter notebook Anaconda 가상환경 (2) | 2020.09.23 |