[인사이트 리포트] “화면 밖으로 나온 AI… 피지컬 AI 시대가 열린다”

생성형 AI는 인간이 축적한 텍스트·이미지·영상 데이터를 대규모로 학습하며 성장해 왔다. 그런데 이제 AI의 다음 무대는 화면 안이 아니라 현실 세계다. 엔비디아는 최근 AI의 다음 물결을 ‘피지컬 AI’로 규정하며, 물리 세계를 이해하고 로봇·공장·물류 시스템에서 실제로 작동하는 인공지능의 시대를 강조하고 있다. 이 변화는 단순한 기술 유행이 아니라 산업 구조 전체를 다시 짜는 전환으로 읽힌다.

공장과 로봇 환경에서 작동하는 피지컬 AI를 상징하는 이미지
생성형 AI가 화면 속 도구를 넘어 로봇과 산업 시스템으로 확장되는 ‘피지컬 AI’ 시대가 본격화하고 있다.

데이터 흡수에서 피지컬 AI까지, 지능이 현실 세계로 내려오는 방식

이정찬 기자 ㅣ 미디어원

최근 AI를 설명하는 말 가운데 가장 자극적인 표현은 두 면을 뚫고 현실 세계로 내려오는 ‘피지컬 AI’다. 얼핏 보면 과장된 비유처럼 들리지만, 이 두 표현은 지금 AI 산업이 어디로 가고 있는지를 꽤 정확하게 보여준다. 생성형 AI가 인간이 축적한 방대한 텍스트·이미지·영상 가지다.

하나는 인간이 만든 지식과 창작물을 끝없이 빨아들이는 ‘뱀파이어 같은 AI’이고, 다른 하나는 이제 화데이터 위에서 성장해 왔다면, 다음 단계의 AI는 그 지능을 현실의 기계와 로봇, 공장, 물류, 이동체에 연결하는 방향으로 진화하고 있다. 엔비디아는 최근 공식 발표와 행사에서 이런 흐름을 반복해 설명하며, AI의 다음 물결을 ‘physical AI’로 규정하고 있다.

생성형 AI가 ‘뱀파이어 같다’는 말은 단순히 무섭다는 뜻이 아니다. 이 비유의 핵심은 성장의 원천에 있다. 오늘의 대형 AI 모델은 진공 상태에서 탄생하지 않았다. 인류가 수십 년, 길게는 수백 년 동안 쌓아온 문서, 기사, 책, 사진, 그림, 영상, 코드 같은 결과물을 대규모로 학습하며 성능을 끌어올렸다.

그래서 AI 논쟁은 언제나 기술 찬양만으로 끝나지 않는다. 인간의 창작물이 어떤 방식으로 학습에 활용됐는지, 그 과정에서 저작권과 보상, 데이터 주권은 어떻게 다뤄져야 하는지가 동시에 제기된다. 저작권과 학습 데이터의 관계를 둘러싼 학계·법률계 논의도 이미 상당히 축적돼 있다. 결국 생성형 AI는 인간의 축적된 표현물을 에너지로 삼아 자라는 산업이며, 이 점이 바로 ‘데이터 흡수형 지능’이라는 불편한 진실을 만든다.

하지만 AI의 본질은 여기서 멈추지 않는다. 지금 더 중요한 변화는 지능이 더 이상 텍스트 창 안에만 머물지 않는다는 점이다. 엔비디아는 GTC 2024와 그 이후 발표에서 AI가 물리 세계를 이해하고, 시뮬레이션을 통해 학습하며, 현실에서 작동하는 단계로 넘어가고 있다고 강조해 왔다.

쉽게 말해 과거의 AI가 질문에 답하는 ‘똑똑한 소프트웨어’였다면, 앞으로의 AI는 중력과 마찰, 거리와 속도, 물체의 충돌과 균형 같은 현실의 조건을 고려하는 ‘행동하는 지능’이 된다. 이때 중요한 것은 단순한 로봇 팔 하나가 아니다. 공장 자동화, 자율주행, 물류 로봇, 산업용 시뮬레이션처럼 현실 세계의 변수와 직접 맞닿는 시스템 전체가 AI의 무대가 된다는 점이다.

디지털 트윈과 산업 자동화를 상징하는 미래형 로봇 시스템 이미지
AI의 다음 경쟁력은 더 많은 답변이 아니라, 현실 세계의 물리 법칙을 이해하고 실제 시스템에서 작동하는 능력에 달려 있다.

이 흐름을 이해하려면 ‘지능’과 ‘신체’를 따로 보던 과거의 시선을 버려야 한다. 인간은 머리로만 존재하지 않는다. 보고, 만지고, 넘어지고, 부딪히고, 반복하며 배운다. AI도 비슷한 방향으로 가고 있다. 그동안의 생성형 AI는 말하고 요약하고 분류하고 예측하는 데 탁월했지만, 현실 공간에서 행동하려면 전혀 다른 학습이 필요했다.

그래서 등장한 것이 시뮬레이션과 디지털 트윈, 가상 환경 훈련 같은 개념들이다. 실제 공장이나 도로, 창고에서 수백만 번 실패할 수 없으니, 가상 세계에서 먼저 배우게 하는 것이다. 엔비디아가 Omniverse와 물리 기반 학습을 강조하는 이유도 여기에 있다. AI가 ‘현실을 이해하는 수준’을 넘어 ‘현실에서 작동하는 수준’으로 진입하려면, 결국 몸을 가진 것처럼 배워야 하기 때문이다.

이 변화가 시장에서 큰 의미를 갖는 이유는 단순하다. AI가 언어를 다루는 도구에 머물면 생산성 향상은 주로 사무와 정보 처리 영역에 집중된다. 그러나 AI가 현실의 장비와 공정, 이동 수단, 로봇과 결합하기 시작하면 이야기가 달라진다. 제조업, 물류, 국방, 에너지, 건설, 의료기기 같은 산업 전체가 다시 설계될 수 있다. 즉 AI는 더 이상 ‘챗봇 산업’이 아니라 ‘산업 운영체제’에 가까운 존재가 된다.

이 때문에 투자자와 기업들이 AI를 일시적 유행이 아니라 구조적 전환으로 보는 것이다. 거품 논쟁은 늘 존재하지만, 최소한 한 가지는 분명하다. AI는 지금 텍스트 생성 도구의 단계를 넘어, 현실 시스템과 결합하는 방향으로 외연을 넓히고 있다.

그렇다고 해서 장밋빛 미래만 말할 수는 없다. 오히려 이 지점에서 더 복잡한 문제가 시작된다.

첫 번째는 여전히 데이터다. AI가 계속 발전하려면 더 질 좋은 학습 데이터가 필요하다. 그런데 무차별적인 웹 수집 방식은 법적·윤리적 충돌을 낳고, 고품질 데이터는 점점 더 비싸지고 희소해진다.

두 번째는 통제 문제다. 피지컬 AI가 현실에 들어올수록 오류의 대가는 커진다. 화면 속 오답은 정정하면 그만이지만, 공장 로봇의 오작동이나 자율 시스템의 판단 실패는 사람과 시설, 물류 전체에 피해를 줄 수 있다.

세 번째는 권력 문제다. 누가 데이터를 쥐고, 누가 모델을 만들고, 누가 그 지능을 현실 인프라와 결합하느냐에 따라 산업의 질서가 재편될 수 있다. AI가 ‘도구’인지 ‘주인’인지의 문제는 결국 기술이 아니라 소유와 통제의 문제로 돌아온다.

우리에게 중요한 것은 공포에 빠지는 것도, 유행어에 취하는 것도 아니다. ‘뱀파이어’라는 표현은 AI가 인간의 축적된 결과물을 먹고 자라는 구조를 드러낸다. ‘피지컬’이라는 표현은 그 지능이 이제 현실의 몸을 얻고 있다는 사실을 말해준다. 이 두 가지를 함께 보면 지금의 AI 산업이 왜 무서우면서도 거대한지 이해할 수 있다. 흡수하는 지능이 행동하는 지능으로 바뀌는 순간, 게임의 규칙이 달라지기 때문이다.

결국 질문은 하나로 모인다. AI가 인간을 대신하느냐, 이기느냐의 문제가 아니다. 더 본질적인 질문은 따로 있다. 인간이 만든 지능이 이제 몸을 얻고 현실에 개입하기 시작할 때, 우리는 그 힘을 어떤 방향으로 설계할 것인가. 기술은 언제나 도구로 시작하지만, 통제에 실패하면 곧 질서가 된다. AI를 둘러싼 오늘의 논쟁은 그래서 유행이 아니라, 앞으로의 산업과 사회를 누가 설계할 것인가를 묻는 전초전이다.