양자 우위 논쟁: 학계와 산업계가 같은 단어를 다르게 쓰는 이유
'양자 우위' 선언이 거듭될수록 커지는 신뢰 공백 — 벤치마크 기준 부재가 낳은 언어의 혼전
Google이 2019년 '양자 우위(quantum advantage·quantum supremacy)'를 선언한 이후, 비슷한 발표가 해마다 이어지고 있다. 그러나 학계 연구자들은 "고전 컴퓨터로 동일하게 풀 수 없는 실용적 문제를 해결했는가"라는 근본 질문에 여전히 부정적이다. 같은 용어를 쓰면서도 학계와 산업계가 전혀 다른 기준을 적용하고 있다는 사실이, 양자컴퓨팅 논의의 가장 큰 혼선으로 자리 잡았다.
양자 우위란 무엇인가 — 정의부터 어긋난다
'양자 우위'는 양자 컴퓨터가 특정 계산 과제에서 최선의 고전 알고리즘보다 유의미하게 빠르거나 정확한 결과를 낼 때 성립한다고 통상 정의된다. 그러나 이 정의에는 결정적인 유연성이 내재해 있다. '특정 과제'의 범위를 어디까지 허용하느냐, '최선의 고전 알고리즘'을 누가 얼마나 최적화했느냐에 따라 결론이 달라진다.
학계, 특히 계산복잡도 이론 연구자들은 양자 우위를 계산 복잡도 클래스 간의 분리 문제와 연결 짓는다. BQP(양자 다항 시간 클래스)가 BPP(고전 확률적 다항 시간 클래스)를 진정으로 포함하는지는 아직 수학적으로 증명되지 않았다. 즉, 이론적 층위에서 양자 우위는 미결 명제다. 반면 산업계는 특정 하드웨어 플랫폼에서 특정 벤치마크를 실행하는 것을 기준으로 삼는다. 이 간극이 모든 혼란의 출발점이다.
2019년 이후의 '선언들' — 무엇이 달랐나
Google은 2019년 54큐비트 Sycamore 프로세서로 특정 무작위 회로 샘플링(RCS) 문제를 200초 만에 풀었다고 발표하며 양자 우위를 주장했다. IBM은 곧 "고전 슈퍼컴퓨터가 디스크 스토리지를 활용하면 2.5일 안에 같은 결과를 낼 수 있다"고 반박했고, 이후 실제로 알고리즘 개선으로 고전 시뮬레이션 비용이 지속적으로 낮아졌다.
이후에도 여러 기업과 연구 그룹이 포톤 보손 샘플링, 이온트랩 기반 최적화, 중성원자 어레이 실험 등에서 '우위' 혹은 '이점'을 주장했다. 그러나 학계의 반응은 대체로 두 가지로 수렴한다. 첫째, 해당 과제가 실용적 의미가 없는 인위적 문제라는 것. 둘째, 고전 알고리즘과의 비교가 충분히 공정하지 않다는 것이다. 무작위 회로 샘플링 자체가 양자 컴퓨터에 유리하게 설계된 과제라는 비판은 지금도 유효하다.
오류율과 오류 정정 — 진짜 장벽
현재 산업계가 운용하는 양자 컴퓨터는 대부분 NISQ(Noisy Intermediate-Scale Quantum) 범주에 속한다. 수십에서 수천 개의 물리 큐비트를 가지고 있지만, 게이트 오류율이 10⁻² ~ 10⁻³ 수준이어서 깊은 회로를 돌리면 결과가 노이즈에 묻힌다.
오류 내성 양자 컴퓨팅(fault-tolerant quantum computing)을 달성하려면 물리 큐비트 수천~수만 개를 묶어 하나의 논리 큐비트를 구성해야 한다. 표면 코드(surface code) 방식에서는 논리 큐비트 하나당 수천 개의 물리 큐비트가 필요하다는 것이 현재 연구의 대략적 합의다. Google의 Willow 칩(2024년 말 발표)은 오류 정정 임계값을 실험적으로 넘었다는 결과를 제시했지만, 여전히 논리 큐비트 수준의 완전한 오류 정정까지는 거리가 있다.
학계 연구자들은 NISQ 시대의 '우위 실험'이 오류 정정 없이 이루어진다는 점을 강조한다. 동일한 노이즈 수준에서 출력된 결과를 '정답'으로 취급하는 것 자체가 기준의 타협이라는 시각이다.
산업계가 '우위'를 강조하는 구조적 이유
기업 입장에서 '양자 우위' 선언은 투자 유치와 고객 확보에 직결된다. 양자컴퓨팅 시장에서 내러티브 경쟁은 기술 경쟁만큼이나 치열하다. IBM, Google, IonQ, Quantinuum, QuEra 등 주요 기업들은 각자의 로드맵을 발표하며 진전을 가시화해야 하는 압력을 받는다.
이 과정에서 '양자 이점(quantum advantage)', '양자 우위(quantum supremacy)', '실용적 양자 이점(practical quantum advantage)' 등의 용어가 문맥에 따라 섞여 쓰인다. 엄밀한 정의 없이 사용되는 이 용어들은 대중과 투자자에게 실제보다 앞선 인상을 심을 수 있다. 학계에서는 이를 '양자 세탁(quantum washing)'이라고 부르기도 한다.
반면 일부 학자들도 연구비 경쟁과 논문 출판 압력 속에서 자신의 실험 결과를 가능한 긍정적으로 포장하려는 유인이 있다. 산업계만의 문제가 아니라는 지적도 있다.
공통 기준을 향한 움직임과 남은 과제
미국 NIST와 여러 국제 표준화 기구는 양자컴퓨팅 성능 벤치마크를 표준화하려는 작업을 진행 중이다. 큐비트 수, 게이트 충실도, 회로 깊이, 양자 부피(quantum volume), CLOPS(회로 계층 연산 초당 횟수) 등 다양한 지표가 제안되고 있으나, 어느 하나도 범용 기준으로 자리 잡지는 못했다.
연구자들이 공통으로 지적하는 핵심 요건은 두 가지다. 첫째, 비교 대상인 고전 알고리즘을 충분히 최적화해야 한다. 둘째, 주장된 우위가 재현 가능하고 제3자 검증이 가능해야 한다. 현재까지 선언된 우위 실험 중 이 두 조건을 모두 명확히 충족한 사례는 드물다. 벤치마크 표준화 없이 선언이 계속된다면, 신뢰 공백은 기술 발전 속도보다 빠르게 커질 수 있다.
참고 자료
- Quantum supremacy using a programmable superconducting processor (Google, Nature 2019) (paper)
- Quantum computing progress and prospects (National Academies of Sciences) (paper)
- IBM response to Google quantum supremacy claim(article)
- Quantum Volume as a metric for near-term quantum hardware (IBM Research) (blog)
- Benchmarking the quantum advantage: a survey(paper)