기본 콘텐츠로 건너뛰기

Division 2 를 통해 테스트해본 7840u 시스템에서의 OCulink egpu 병목

 정확한 측정을 위해서는 PCI 인터페이스 에서의 부하를 봐야 하는 게 맞지만, 이미 증상 만으로 어느 정도 결론이 난 상태라 추가로 확인해 볼 필요는 없는 듯


전주 주말에 세일 해서 구매 후 캐릭터 생성만 하고 못 잡던 디비전2을 각 잡고 진행했다. 의외로 WIN4 (2022-6800u) 내장 그래픽으로도 잘 돌아서. 짬짬히 출퇴근 시간에 할 수 있지 않을까라는 희망을 가졌지만, 1호선 출퇴근 길의 테더링 인터넷으론 택도 없더라.


여하간, 결론부터 말하자면 7840u + 4090 eGPU (OCulink)는 여전히 OCulink의 대역폭보단, CPU 병목서 벗어나질 못 하고 있다.

실수로 CPU 클럭에 따른 테스트를 2회 하게 됐는데. 이로 인해 디비전2는 굉장히 CPU 사양을 타는 게임임을 알 수 있었다.

테스트 영상 :

DX11 No Vertical sync (Disabled CPU boost clock) : https://youtu.be/rGKSIKDOmRA

DX12 No Vertical sync (Disabled CPU boost clock) : https://youtu.be/Iaa4QzV0m6s

DX12 No Vertical sync (CPU boost clock Enabled) : https://youtu.be/2CtCHLcbJvA

DX11 benchmark : https://youtu.be/Qzyub2hbLVI

DX12 benchmark : https://youtu.be/y-97i8aOyZk

사실 DX11은 이제와서 별 의미는 없다 판단 되서 DX12만 두고 보면.

CPU 부스트 클럭이 꺼져 있으면 7840u는 3.3Ghz로 동작한다. 켜져있으면 올코어 3.8Ghz로 안정화된다.

프레임을 보면 대충 3.3Ghz에서는 80-100fps, 3.8Ghz에서는 90-120fps정도로 볼 수 있는데.

아이러니하게도 대충 클럭 비례하여 속도가 올라간 걸 알 수 있다.

또한 GPU 인코더로 한 영상 녹화는 프레임에 큰 영향을 주지 않아서, 여전히 GPU가 인코딩 한 영상을 옮겨줄 정도의 대역폭은 남아있다고 판단되는 상황이지만, 좀 더 고민을 해보기로 했다.

찾아보니 해외 사용자 글에서 x3D로 CPU 변경시 동일 GPU를 사용중에도 프레임 상승률이 거의 22% 가까이 오른다는 걸 보면(142->174) 굉장히 CPU에 연관된. (그리고 캐시크기에 연관된) 상황으로 볼 수 있다.

https://www.overclock.net/threads/5800x3d-owners.1798046/page-158

여기서 처음 사용한 11900K는 마침 캐시크기가 16MB이다. 인텔과 AMD기도 하고 발매시기, 세대도 달라 IPC차이가 있겠지만, 어느 정도 유의미한 비교군이라 판단되어 11900K를 가지고 4090 테스트를 한 결과가 있는가 찾아봤다.

있었다.

https://www.youtube.com/watch?v=hXL7SDNyDCA

8:44부터가 디비전 2인데, 11900K+4090은 4K서 113fps가 찍힌다. (그리고 4080과 프레이 차이가 저 뿐 안나는 결과로 봐서 엄청난 병목이다.) 아마 시기상 DX11로 테스트 했다고 치면, 93fps의 7840u DX11 벤치랑 비교해야 하는데. 의외로 이 또한 납득 가능한 결과임을 알 수 있다. (3.8Ghz vs 5.3Ghz) 클럭비례로 본다면 7840u가 81fps가 나와야 하지만, 7840u가 그나마 최신 세대라 IPC가 더 나아졌다 치고, L2캐시가 훨씬 크고, 램클럭 차이를 고려해본다면 가능한 일.

요는 OCulink보다는 CPU 병목이 문제가 되는 상황으로 보이고. OCulink는 솔직히 7840u급의 CPU에는 대역폭 병목을 걱정할 수준은 아니고, CPU에 부하가 가해질수록 GPU를 못 쓰는 상황이 온다는 것이다.

 썬더볼트의 경우 이 경우 더 나쁜 결과가 예상되는데, 당연하지만 썬더볼트 컨트롤러 자체도 CPU 자원을 먹기 때문. 가뜩이나 버거워하는 CPU에게 더 부담을 줘 성능이 낮아질 것은 당연지사다. 물론 모바일 CPU다보니 오큐링크라 해도, PCI 인터페이스를 처리할 메인보드 칩셋 없이 CPU가 처리하기에 PCI 사용에도 CPU에 어느 정도 부하가 있다. 썬더볼트에 비할 바는 아니지만.

 여담으로, 내장 그래픽의 경우 특히 영상녹화를 CPU x264 인코더를 써보니 확실히 차이가 느껴졌는데,(녹화시 30-40, 비녹화시 55-60) 이 또한 디비전2가 CPU 영향을 크게 받는 게임임을 증명하는 게 아닌가 싶다.


추가로, 메인컴(5950x, 3200Mhz 64GB DDR Ram, Gigabyte 4090 OC) 에 드디어 4K모니터를 붙여서 테스트를 해 봤다.

https://www.youtube.com/watch?v=a_j8O2KTwAE

.. 예상외로 차이가 얼마 없어서 

1. 디비전은 AMD에 친절하지 않다.

2. 여하간 OCulink는 성능 하락을 일으키는 요소는 아니다.

만 증명이 된 듯.

이 블로그의 인기 게시물

일 때문에 구매한 (Lenovo) Thinkpad T14s Gen 4 (AMD) 간단 후기

 급하게 업무용 노트북이 필요해져서 휴대와 성능을 같이 잡을 노트북을 고민할 일이 있었다. 초저전력에서는 e코어를 쓰는 인텔이 더 대기 전력이 좋다는 건 알고 있었지만, 다시 임베디드 때문에 잡게 된 시리얼이나, 네트워크를 통신을 사용하는 다 클라이언트 개발을 위해 VM을 돌리는 상황이다. 이 경우 필요한 성능이 e코어 만으로는 택도 없는 지라. 이미 AMD CPU를 사용하기로 마음을 굳힌 상태였다. (인텔 P코어를 쓰기 시작하면 전성비 및 발열서 불리하다는 건 좀 조사해본 사람들은 알 내용이다.) 이미 GPD WIN 4 (2023)을 쓰고 있기에 7840u CPU 성능은 차고 넘친다는 것을 이미 알고 있던 터라, 이게 최적의 CPU 선택이라는 부분에는 망설임이 없었다.  하지만, 이미 쓰고 있는 umpc인 GPD WIN 4 (2023)의 7840u랑 겹치는 CPU가 달린 기기를 결국 고르게 되어 이게 맞나..? 싶었는데. 결과적으로는 옳은 선택이었다. 노트북에 개발 및 생산성 활동 이외의 프로그램을 깔고자 하는 잡념이 완전 없어졌기 때문 [..] 어자피 동일 CPU와 램이 박힌 게임용 기기가 있기에. 이런 이유로 직접 T14s를 구매하고, 세팅하고 사용하면서 느낀 후기를 간략하게 남겨본다. 돈 좀 아끼겠다고 초기 AS는 포기하고 그냥 리퍼로 구매했기에 원하는 제품을 구매한다기 보다는, 가장 용도에 적합하다고 생각한 물건을 골라 구매한 상태. 그래서 최적의 제품을 골라 구매한다는 선택지는 없었다. (동일 성능 정가 대비 30-50만원 이상 저렴한 가격은, 1년 이상 AS를 안 받는 경우 이득 인지라 포기하기가 어려웠다.) 특히 가장 궁금해 하는 부분은 거의 동일 사양인 P14s랑 비교일 것으로 보여 그 부분을 신경써서 남겨본다. (실제 P14s를 만지거나 사용한 건 아니지만, 대체적 내용과 비교) 구매한 스펙은 32GB RAM (6400Mhz), 14인치 WUXGA 400nits 저전력, 256GB SSD로 121만 천원. 물론 SSD는 구매 ...