피지컬 AI 연구개발 완전 가이드 소개

2026. 2. 20. 00:24·Tech
반응형

시리즈: 피지컬 AI 연구개발 완전 가이드 (총 9편) | 목차

피지컬 AI 연구개발 완전 가이드 — 시리즈 목차

로봇이 세상을 보고, 이해하고, 직접 손으로 일하는 시대가 열리고 있어. 이 시리즈는 VLA 모델부터 데이터, 학습, 하드웨어, 안전, 글로벌 경쟁, 상용화 현실까지 — 피지컬 AI의 기술 스택 전체를 9편에 걸쳐 완전히 해부해.


이 주제를 선택한 이유

  • AI가 화면 밖으로 나왔어. ChatGPT 같은 디지털 AI를 넘어, 실제 세상에서 물건을 집고 옮기는 피지컬 AI가 폭발적으로 주목받고 있거든. Figure AI가 6.75억 달러를 투자받고, Boston Dynamics가 Google DeepMind와 손잡은 게 우연이 아니야.
  • 기술 스택이 한꺼번에 움직이고 있어. VLA 모델, 데이터 인프라, 정책 학습, 촉각 센서, 엣지 컴퓨팅, 안전 표준 — 이 모든 게 2025~2026년에 동시에 큰 전환점을 맞고 있어. 한 가지만 봐서는 전체 그림이 안 보여.
  • "데모"와 "상용화"의 간극이 크거든. 화려한 데모 영상만 보면 로봇이 곧 집에 올 것 같지만, 현실의 안전 인증, 운영비, 신뢰성 문제는 완전히 다른 이야기야. 그 간극을 솔직하게 짚어주는 콘텐츠가 필요했어.
  • 한국의 기회도 있어. 글로벌 경쟁에서 전체 스택을 다 하기는 어렵지만, 촉각/구동 부품, 엣지 컴퓨트 칩, 안전 표준 참여 같은 특정 레이어에서는 한국의 제조·반도체 역량이 빛날 수 있거든.

시리즈 구성

편 제목 핵심 내용
1편 피지컬 AI란 무엇인가 — 로봇이 세상을 이해하는 방법 피지컬 AI 정의, 6대 기술 축, 상용화까지의 현실적 거리
2편 VLA 파운데이션 모델: 로봇의 두뇌가 진화하고 있다 RT-2 표준 레시피, OpenVLA(7B)가 55B를 이긴 비결, Diffusion Policy/pi0
3편 데이터 인프라: 로봇 학습의 연료를 어떻게 모을까 Open X-Embodiment, DROID, RoboTwin, pretrain→finetune 워크플로우
4편 정책 학습: 시뮬레이션에서 현실 세계로 HumanUP 6초 기립, RTR 교사-학생 학습, 장기 작업의 누적 오차
5편 하드웨어와 제어: 계층적 아키텍처의 시대 S0/S1/S2 계층 제어, 촉각 3g 감도, Jetson Thor, 10Gbps 데이터 오프로드
6편 글로벌 플레이어 지도: 미국·중국·유럽·일본·한국 5개 경쟁 축, Unitree 5,500대 출하, 한국의 레이어별 기회
7편 안전과 표준화: 신뢰할 수 있는 로봇을 만드는 법 IEEE RAS 6대 위험군, ISO WD 25785-1, 의미적 안전과 가드레일
8편 상용화 현실 점검: Figure·BD·Tesla·Agility의 현재 Figure-BMW PoC, Agility GXO RaaS, TCO와 운영비, HITL 경로
9편 피지컬 AI의 미래: 2026~2028 전망과 관전 포인트 촉각 스케일업, 실패 복구 제품화, 의미적 안전 규범화, 엣지 TCO

편별 핵심 요약

1편 — 피지컬 AI, 한마디로 뭘까

피지컬 AI는 "진짜 세상에서 일하는 AI"야. ChatGPT는 화면 안에서 텍스트로 대화하지만, 피지컬 AI는 로봇의 몸을 빌려 실제 물건을 집고 옮기고 조립하지. 핵심 기술 축은 모델(VLA)·데이터·정책학습·시뮬/배포·하드웨어/센서·안전/검증 6가지인데, 어느 하나라도 빠지면 데모 수준에 머물러. 상용화의 열쇠는 "더 큰 모델"이 아니라 "더 빠른 현장 학습 루프"와 "더 강한 안전 운영"에 있다는 게 이 시리즈 전체를 관통하는 메시지야.

2편 — VLA, 로봇 두뇌의 새 표준

VLA(Vision+Language+Action)가 로봇 지능의 표준 인터페이스가 됐어. RT-2가 "인터넷 지식을 로봇 행동으로 전이하는" 레시피를 만들었고, OpenVLA는 7B 파라미터로 55B 폐쇄형 모델을 이기면서 오픈 생태계의 힘을 증명했지. Diffusion Policy와 pi0는 정밀 접촉 작업을 위한 연속 행동 생성이라는 새로운 방향을 열었고, 다음 경쟁은 모델 크기가 아니라 행동 생성 방식·실시간성·개방성에서 벌어지고 있어.

3편 — 로봇 데이터, 어떻게 모을까

로봇 데이터는 비싸고, 편향되고, 부족한 삼중고에 시달렸어. 그런데 최근 3개 축이 동시에 이 병목을 뚫고 있지 — Open X-Embodiment(22개 로봇 통합), DROID(564개 현실 장면), RoboTwin(합성 데이터로 성공률 40~70% 향상). 이 셋이 결합되면서 "대규모 pretrain → 소량 현장 finetune"이라는 사실상의 표준 워크플로우가 만들어졌어.

4편 — 시뮬에서 현실로, 정책 학습

로봇이 기술을 배우는 방법은 크게 모방학습(시범 따라하기)과 강화학습(시행착오)이야. HumanUP은 휴머노이드가 넘어졌다 일어나는 걸 6초 만에 해냈고(핸드크래프트 11초), RTR은 교사 로봇이 학생 로봇을 물리적으로 잡아주면서 안전하게 학습시키는 시스템 혁신을 보여줬어. 아직 남은 벽은 장기 작업에서의 누적 오차와 실패 복구야 — BEHAVIOR Challenge가 1,200시간 데이터를 공개하면서 이 문제에 도전하고 있지.

5편 — 계층적 제어, 하드웨어의 진짜 역할

AI 모델이 아무리 똑똒해도 로봇 손이 물건을 미끄러뜨리면 끝이야. Figure의 Helix 02가 보여준 S0(1kHz 안정화)·S1(200Hz 비주모터)·S2(저주파 계획) 계층 구조가 사실상 레퍼런스가 됐어. Figure 03은 손바닥 카메라와 3g 감도 촉각 센서로 "손 근처의 관측"을 혁신했고, 10Gbps mmWave 데이터 오프로드로 로봇을 "현장 데이터 머신"으로 설계했지. 추론을 어디서 할지(서버 vs 엣지)가 제품 설계의 중심 변수가 된 시대야.

6편 — 글로벌 경쟁, 누가 앞서 있나

피지컬 AI 경쟁은 모델·데이터·학습·하드웨어·안전 5개 축의 총력전이야. 미국(DeepMind·Figure·BD·NVIDIA)은 모델과 인프라에서 선두, 중국(Unitree 5,500대 출하)은 저비용 양산과 스케일, 유럽은 제조업 파트너십과 규제 친화 검증, 일본(Toyota T-HR3)은 정밀 토크 제어에서 각각 강점을 보여. 한국은 전체 스택 경쟁은 어렵지만, 촉각/구동 부품·엣지 컴퓨트·안전 인증이라는 특정 레이어에서 기회를 잡을 수 있어.

7편 — 안전과 표준, 신뢰의 시작

기존 산업용 로봇 안전(ISO 10218)으로는 휴머노이드를 다루기 부족해. IEEE RAS가 6대 위험군을 체계화하고 "행동 기반 안전"을 의제로 올렸고, ISO WD 25785-1이 동적 안정성 표준 초안으로 준비 중이야. 가장 까다로운 건 LLM이 만들어내는 "의미적 안전" — 지시를 잘못 해석해서 물리적 위험으로 이어지는 문제야. 모듈형 가드레일(모니터링+개입+감사 로그)이 대응 방향으로 떠오르고 있어.

8편 — 상용화, 데모와 현실 사이

초기 상용화는 "범용 가정용"이 아니라 "통제된 산업 환경의 반복 작업"에서 시작돼. Figure-BMW는 Fortune 분석에 따르면 비생산시간 PoC 수준이었고, BD는 검증된 안정성으로 산업 배치에서 유리한 위치야. Agility Digit의 GXO RaaS 계약이 가장 현실적인 실배치 사례이고, 1X NEO는 HITL 하이브리드로 가정용에 도전 중이야. 진짜 병목은 로봇값이 아니라 운영비(데이터 수집·유지보수·안전·인력)로 구성되는 TCO야.

9편 — 2026~2028, 네 가지 관전 포인트

앞으로 2~3년의 핵심은 네 가지야. 첫째, 촉각 데이터의 스케일업 — 시각 중심에서 촉각 기반 정책 학습으로. 둘째, 실패 복구의 제품화 — 성공률보다 "실패했을 때 어떻게 하느냐"가 가동률을 결정해. 셋째, 의미적 안전의 규범화 — 이게 해결 안 되면 기술이 돼도 출시를 못 해. 넷째, 엣지 컴퓨트의 TCO — 전력·열·비용 효율이 로봇 설계의 중심이 될 거야.


이 시리즈를 읽으면 좋은 사람

  • AI/로봇 분야에 관심 있는데, 피지컬 AI의 전체 그림을 한번에 잡고 싶은 사람
  • 피지컬 AI 투자나 사업 기회를 탐색 중인 투자자/사업가
  • 로봇공학·AI 전공 학생이나 연구자로, 업계 흐름을 빠르게 파악하고 싶은 사람
  • 제조·물류 현장에서 로봇 도입을 검토하고 있는 실무자

수준별 읽기 가이드

"피지컬 AI가 뭔지부터 알고 싶어"

→ 1편 → 2편 → 6편
기본 개념부터 잡고, VLA 모델의 작동 원리를 이해한 다음, 글로벌 경쟁 구도를 보면 전체 그림이 잡혀.

"기술 스택을 깊이 파고 싶어"

→ 2편 → 3편 → 4편 → 5편
VLA 모델 → 데이터 인프라 → 정책 학습 → 하드웨어/제어 순서로 읽으면 기술의 층위가 하나씩 쌓이는 느낌이야.

"투자/사업 관점에서 핵심만 보고 싶어"

→ 6편 → 8편 → 9편
글로벌 플레이어 지도로 시장 구조를 보고, 상용화 현실을 점검한 다음, 2~3년 전망과 행동 지침을 확인하면 돼.

"안전과 규제가 제일 궁금해"

→ 7편 → 5편 → 9편
안전/표준 프레임을 먼저 보고, 계층적 제어가 안전과 어떻게 연결되는지 확인한 다음, 의미적 안전의 미래 전망으로 마무리하면 돼.

"한국에서의 기회가 알고 싶어"

→ 6편 → 5편 → 9편
한국의 포지션(6편)을 먼저 확인하고, 기회가 있는 레이어(촉각·엣지·부품)의 기술적 맥락(5편)을 이해한 다음, 이해관계자별 행동 지침(9편)으로 구체화하면 돼.


시리즈 핵심 수치 모음

수치 의미 관련 편
6.75억 달러 Figure AI Series B 투자 규모 (26억 달러 기업가치) 1편, 6편, 8편
7B vs 55B OpenVLA(7B)가 RT-2-X(55B)를 이긴 파라미터 비교 2편
97만 개 OpenVLA 학습에 사용된 실제 로봇 에피소드 수 2편
22개 로봇 Open X-Embodiment에 포함된 로봇 플랫폼 수 3편
564개 장면 DROID가 실세계에서 수집한 서로 다른 장면 수 3편
+40~70% RoboTwin 합성 pretrain 후 조작 성공률 향상 3편
6초 vs 11초 HumanUP 학습 정책(6초) vs 핸드크래프트(11초) 기립 시간 4편
1kHz / 200Hz Figure S0(안정화) / S1(비주모터) 계층 제어 주파수 5편
3g 감도 Figure 03 촉각 센서 감도 (약 물방울 무게 수준) 5편
10Gbps Figure 03 mmWave 데이터 오프로드 속도 5편
5,500대 Unitree 2025년 휴머노이드 출하량 (보도 기준) 6편
6대 위험군 IEEE RAS가 정의한 휴머노이드 전용 위험 분류 7편
1,200시간 BEHAVIOR Challenge 장기 가정 작업 데이터 총량 4편
61개 연속 동작 Helix 02 설거지 데모에서 자율 수행한 연속 동작 수 5편, 8편

참고 자료 (References)

데이터 출처

출처 설명 링크
RT-2 VLA 패러다임을 연 Google DeepMind 논문 arXiv
OpenVLA 오픈소스 VLA 7B 모델, 55B를 넘어선 성과 arXiv
Open X-Embodiment 22개 로봇 통합 데이터셋 arXiv
Figure AI Helix 02/Figure 03, 계층 제어와 센서 혁신 공식 블로그
IEEE RAS 휴머노이드 전용 안전 위험군 체계화 AutomationMag
반응형

'Tech' 카테고리의 다른 글

피지컬 AI 연구개발 완전 가이드 (총 9편) | 2편 VLA 파운데이션 모델: 로봇의 두뇌가 진화하고 있다  (0) 2026.02.20
피지컬 AI 연구개발 완전 가이드 (총 9편) | 1편 피지컬 AI란 무엇인가 — 로봇이 세상을 이해하는 방법  (0) 2026.02.20
보스턴다이내믹스 기업분석 완전 가이드 (총 9편) | 9편 2026-2028 전망: BD의 확실한 축과 옵션 가치  (0) 2026.02.20
보스턴다이내믹스 기업분석 완전 가이드 (총 9편) | 8편 현대차그룹 x BD: 단순 인수가 아닌 구조적 시너지  (0) 2026.02.20
보스턴다이내믹스 기업분석 완전 가이드 (총 9편) | 7편 BD의 수익 공식: 로봇 판매에서 플랫폼 사업으로  (0) 2026.02.20
'Tech' 카테고리의 다른 글
  • 피지컬 AI 연구개발 완전 가이드 (총 9편) | 2편 VLA 파운데이션 모델: 로봇의 두뇌가 진화하고 있다
  • 피지컬 AI 연구개발 완전 가이드 (총 9편) | 1편 피지컬 AI란 무엇인가 — 로봇이 세상을 이해하는 방법
  • 보스턴다이내믹스 기업분석 완전 가이드 (총 9편) | 9편 2026-2028 전망: BD의 확실한 축과 옵션 가치
  • 보스턴다이내믹스 기업분석 완전 가이드 (총 9편) | 8편 현대차그룹 x BD: 단순 인수가 아닌 구조적 시너지
트렌드픽(Trend-Pick)
트렌드픽(Trend-Pick)
지금 뜨는 상품, 급상승 키워드 기반 트렌드 정보를 빠르게 정리합니다.
  • 트렌드픽(Trend-Pick)
    트렌드픽(Trend-Pick)
    트렌드픽(Trend-Pick)
  • 전체
    오늘
    어제
    • 트렌드픽 (538)
      • AI (144)
      • Tech (167)
      • Economy (70)
      • Global (72)
      • Culture (85)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

    • 블로그 면책조항 안내입니다
    • 블로그 개인정보처리방침 안내입니다
    • 블로그 소개합니다
  • 인기 글

  • 태그

    기술
    Anthropic
    BTS
    Claude
    아르테미스2
    비트코인
    BTS 광화문
    글로벌 트렌드
    기업분석
    제품
    AI 기술
    AI 인프라
    sec
    클라우드 인프라
    Claude Mythos
    랜덤박스
    조직
    chatGPT
    우주 데이터센터
    API
  • 최근 댓글

  • 최근 글

  • 반응형
  • hELLO· Designed By정상우.v4.10.6
트렌드픽(Trend-Pick)
피지컬 AI 연구개발 완전 가이드 소개
상단으로

티스토리툴바