성능

GPU 가속

QXel은 기본적으로 CPU 커널에서 게이트 연산을 실행합니다. 약 20큐비트를 넘어서면 GPU가 압도적으로 빠른데, 큐비트가 하나 늘 때마다 상태 벡터가 두 배로 커지고 GPU는 그 벡터에 게이트를 대규모 병렬로 적용하기 때문입니다. compute_type 옵션으로 이를 선택할 수 있습니다.

커널 세트 선택하기

compute_type은 게이트 연산을 실행할 커널을 선택합니다: • 'cpu': CPU 커널(기본값). 어디서나 동작합니다 • 'cuda': 직접 튜닝한 CUDA GPU 커널. 보통 가장 빠릅니다 • 'cuquantum': NVIDIA cuQuantum 라이브러리

GPU에서 실행하기

compute_type을 run()에 키워드 인자로 전달하세요. 회로의 나머지는 모두 그대로 유지됩니다:

python

qxel = LocalSimulator(backend="QXel-sv")
result = qxel.run(circuit, shots=1000, compute_type="cuda").result()
print(result.measurement_counts)

수치 결과는 CPU 실행과 동일하며, 달라지는 것은 실행 시간뿐입니다. GPU가 사용되는지 확실하지 않다면, 큰 회로를 실행하는 동안 다른 터미널에서 nvidia-smi를 실행해 GPU 사용률이 올라가는지 확인하세요.

참고 'cuda'와 'cuquantum'은 호환되는 드라이버가 있는 NVIDIA GPU가 필요합니다. CPU 전용 머신에서는 오류가 발생하므로 그런 환경에서는 기본값 'cpu'를 유지하세요. 먼저 'cuda'를 시도하세요. 일부 게이트 패턴에서는 'cuquantum'이 더 빠를 수 있으니, 워크로드에 대해 둘 다 벤치마크해 보세요.

← PennyLane 스토리지 오프로딩 →