티스토리 뷰
최신 버전의 RTX TITAN을 장착한 컴퓨터에 Tensorflow gpu 버전을 설치하게 되어서 간단하게 정리합니다.
사실 외국 글들을 보면 너무 잘 정리된 글이 있어서 별도로 글을 남길 필요가 있을 정도지만 그래도 삽질 한거를 정리하고자...
간단하게 정리하면 RTX TITAN은 cuda10을 사용하기 때문에 설치방법은 "build from source" 입니다.
tensorflow에서 1월정도에 RTX(cuda10)을 지원 해준다고 했는데 아직은 안되네요...
* 해당글은 2019년 2월에 작성된 경험 및 정리글이므로 현재 버전의 텐서플로우와는 설치방법이 다를수 있습니다. 공식홈페이지의 설치방법을 진행해보시고 안될경우에 참고 해주시면 좋을듯 합니다.
최초에 일반적인 설치방법(pip install 등)으로 설치를 하면 설치는 가능하지만 코드를 실행해보면
segment fault 혹은 core dump같은 오류를 만나게 됩니다.
그래서 검색을 하면서 뭐가 문제인지를 알아보았고 답은 nividia driver와 cuda, cudnn을 설치하고 텐서플로우를 설치할 때는
bazel을 설치하고 build from source를 통해 개인의 설정에 맞는 whl파일을 생성하고 생성된 whl파일로 pip 설치를 하면 됩니다.
https://medium.com/@saitejadommeti/building-tensorflow-gpu-from-source-for-rtx-2080-96fed102fcca
두개의 블로그에서 단계별로 설명이 잘되어 있기에 링크를 공유드립니다.
개인적으로는 텐서플로우 빌드를 할 때 "configuration"을 어떻게 해야하나 고민을 많이 했는데
개인에 맞게 설정을 해주시면 되고 잘모르는 경우에는 디폴트 혹은 NO를 해주시면 됩니다.
또 bazel에서 빌드를 할때 생각보다 오랜시간이 걸리는데 환경에 따라서는 2~3시간씩 걸리는 경우도 있다고 합니다.
운영체제는 Ubuntu 16.04 입니다.
왜 16.04인가?
처음에는 18.04로 설치를 진행했는데 nvidia driver를 설치하는 과정에서 16.04가 더 편리했습니다.
18.04의 경우 NVIDIA에서 드라이버를 다운받고 실행하면 되지만 설치하는 과정에서 우분투 드라이버와 충돌이 나서
16.04의 sudo add-apt-repository ppa:graphics-drivers/ppa 를 통해 외부 레파지토리로 설치했습니다.
18.04의 경우 레파지토리에서 업데이트가 안되었는지 설치가 안됬습니다.
[참고 자료]
'기계학습' 카테고리의 다른 글
[Python] 데이터 셋 간단하게 나누기 (0) | 2020.02.21 |
---|---|
경량 딥러닝 간단한 흐름 정리 (0) | 2019.09.06 |
[세팅] window10 tensorflow gpu 설치하기 (1) | 2019.08.23 |
[keras] fit vs fit_generator (1) | 2019.02.13 |
라벨링툴 공유 - labelme, VIA(VGG Image Annotatoe) (0) | 2019.02.11 |
댓글