Research Library
로봇·AI를 움직이는 핵심 논문
휴머노이드·VLA·매니퓰레이션 — 지금의 로봇 혁명을 만든 논문 15편을 검증된 arXiv 링크와 함께 큐레이션했습니다. 전부 실존 논문입니다.
🧠 VLA 파운데이션 모델6편
하나의 모델로 보고·이해하고·행동한다 — 로봇 지능의 새 표준
GR00T N1: An Open Foundation Model for Generalist Humanoid Robots
2025-03NVIDIA · arXiv:2503.14734
듀얼 시스템(비전-언어 해석 + 확산 트랜스포머 실시간 모터 제어) 구조의 오픈 휴머노이드 파운데이션 모델. 실로봇 궤적·인간 영상·합성 데이터 혼합 학습, 모델·데이터 공개.
왜 중요한가 — 휴머노이드 범용 제어의 사실상 기준점. Fourier GR-1, 1X 등 실제 휴머노이드에서 양손 조작을 시연 — 로봇 DB의 휴머노이드 항목과 직결.
π0: A Vision-Language-Action Flow Model for General Robot Control
2024-10Physical Intelligence · arXiv:2410.24164
플로우 매칭 기반 액션 생성으로 고주파 연속 제어를 실현한 범용 VLA. 빨래 개기·테이블 정리 등 장시간 실세계 과제를 단일 모델로 수행.
왜 중요한가 — '하나의 모델로 여러 로봇을' 흐름을 연 상업 연구소의 대표작 — 로봇 파운데이션 모델 스타트업 생태계 이해의 출발점.
OpenVLA: An Open-Source Vision-Language-Action Model
2024-06Stanford 외 공동연구 · arXiv:2406.09246
7B 파라미터 오픈소스 VLA. Open X-Embodiment 데이터로 학습해 공개된 체크포인트로 누구나 파인튜닝 가능.
왜 중요한가 — 개인·소규모 팀도 로봇 파운데이션 모델을 직접 실험할 수 있게 만든 오픈소스 전환점 — 아카데미 학습 로드맵과 연결.
RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control
2023-07Google DeepMind · arXiv:2307.15818
웹 스케일 비전-언어 지식을 로봇 제어로 전이한 최초 대규모 시연. 'VLA'라는 용어를 정착시킨 논문.
왜 중요한가 — 지금의 휴머노이드·VLA 붐이 어디서 시작됐는지 보여주는 역사적 기점.
Open X-Embodiment: Robotic Learning Datasets and RT-X Models
2023-10글로벌 21개+ 기관 컨소시엄 · arXiv:2310.08864
22종 로봇·수십만 궤적을 통합한 사상 최대 규모 공개 로봇 학습 데이터셋. 크로스-엠보디먼트 학습이 단일 로봇 학습을 능가함을 입증.
왜 중요한가 — '로봇계의 ImageNet' — 이후 모든 로봇 파운데이션 모델의 공통 학습 기반.
A Pragmatic VLA Foundation Model
2026-01arXiv · arXiv:2601.18692
실배치 관점에서 VLA 파운데이션 모델의 실용 설계를 다룬 2026년 최신 연구.
왜 중요한가 — 연구실 데모를 넘어 '현장에서 쓰이는 VLA'로 가는 2026년 최전선 흐름.
🦾 매니퓰레이션·학습5편
로봇이 손을 쓰는 법을 배우는 방식의 진화
Diffusion Policy: Visuomotor Policy Learning via Action Diffusion
2023-03Columbia · TRI · arXiv:2303.04137
확산 모델로 로봇 행동 분포를 생성해 다중 모드 행동을 안정적으로 학습. 이후 수많은 매니퓰레이션 연구의 표준 정책 아키텍처가 됨.
왜 중요한가 — GR00T N1의 System 1을 비롯해 현대 로봇 제어의 '액션 생성' 표준을 만든 논문.
Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation
2024-01Stanford · arXiv:2401.02117
저비용(약 $32K) 이동형 양손 원격조작 시스템 + 모방학습으로 요리·청소 등 가사 과제를 시연해 화제가 된 연구.
왜 중요한가 — '가정용 로봇'이 현실적으로 가능함을 대중에게 각인시킨 논문 — 컨슈머 로봇 카테고리의 기대치를 만들었다.
Universal Manipulation Interface: In-The-Wild Robot Teaching Without In-The-Wild Robots
2024-02Stanford · Columbia · arXiv:2402.10329
휴대용 그리퍼 장치로 로봇 없이도 야외·현장 시연 데이터를 수집, 그대로 로봇 정책으로 전이하는 인터페이스.
왜 중요한가 — 로봇 데이터 수집 비용을 극적으로 낮춘 접근 — 데이터가 병목인 로봇 산업의 판도를 바꾸는 아이디어.
Eureka: Human-Level Reward Design via Coding Large Language Models
2023-10NVIDIA · arXiv:2310.12931
LLM이 강화학습 보상 함수를 스스로 코딩·진화시켜 펜 돌리기 같은 초정밀 기술을 학습. 인간 전문가 설계 보상을 능가.
왜 중요한가 — 'AI가 AI를 가르친다'를 실증 — LLM과 로봇 학습의 결합이 만드는 가속도를 보여준다.
Revisiting Embodied Chain-of-Thought for Generalizable Robot Manipulation
2026-06arXiv · arXiv:2606.03784
체인-오브-소트(단계적 추론)를 로봇 조작에 적용할 때의 일반화 효과를 재검증한 2026년 연구.
왜 중요한가 — LLM식 '생각하는 로봇'이 실제 조작 성능으로 이어지는가 — 지금 가장 뜨거운 질문의 최신 답.
🤖 휴머노이드3편
인간형 로봇 전신 제어·인간 데이터 전이의 최전선
HumanPlus: Humanoid Shadowing and Imitation from Humans
2024-06Stanford · arXiv:2406.10454
인간 동작을 실시간 섀도잉하고 인간 영상 데이터로 휴머노이드 전신 기술을 학습하는 풀스택 시스템.
왜 중요한가 — 인간 데이터 → 휴머노이드 기술 전이의 대표 사례 — Unitree 계열 휴머노이드 실험의 단골 기반.
HEX: Humanoid-Aligned Experts for Cross-Embodiment Whole-Body Manipulation
2026-04arXiv · arXiv:2604.07993
서로 다른 로봇 몸체 간 전신 조작 기술을 전이하는 전문가 정렬(expert alignment) 접근의 2026년 연구.
왜 중요한가 — 한 휴머노이드에서 배운 기술을 다른 기종으로 — 로봇 구매자에게 '모델 간 호환성'이 생기는 미래.
Embodied AI Agents: Modeling the World
2025-06Meta AI · arXiv:2506.22355
가상·웨어러블·로봇 형태의 체화 AI 에이전트가 세계 모델을 통해 인간과 협력하는 방향을 제시한 포지션 논문.
왜 중요한가 — 로봇·AI에이전트·메타버스가 하나의 '체화 AI' 흐름으로 합쳐지는 그림 — 우리 플랫폼의 인간×AI 협력 비전과 맞닿아 있다.
📚 서베이·프레임워크1편
산업 도입 관점에서 흐름을 정리한 지도
논문 속 로봇을 실제로 살펴보세요
GR00T이 구동하는 휴머노이드, Mobile ALOHA가 연 가정용 로봇 — 로봇 데이터베이스에서 스펙·가격·리뷰를 확인할 수 있습니다.