GPU를 사용해서 PrivateGPT를 좀 더 빠르게 만드는 방법
CPU로 연산시 query에 대한 답변을 받는데 거의 2분 가까이 시간이 소요되기 때문에 너무 느리다는 느낌이 있습니다. 그래서 GPU를 사용해서 PrivateGPT를 실행하는 방법에 대해 알아봅니다. GGML V3 모델 파일을 다운받아서 models 폴더 안에 복사합니다. 링크: https://huggingface.co/TheBloke/Manticore-13B-GGML/resolve/main/Manticore-13B.ggmlv3.q8_0.bin 아래 커맨드로 CUDA toolkit 11.8 과 cuDNN 8.9.1 버전을 설치합니다. conda install cuda -c nvidia/label/cuda-11.8.0 conda install cudnn -c nvidia/label/cudnn-8.9.1 ..