Skip to main content

Research Library

로봇·AI를 움직이는 핵심 논문

휴머노이드·VLA·매니퓰레이션 — 지금의 로봇 혁명을 만든 논문 15편을 검증된 arXiv 링크와 함께 큐레이션했습니다. 전부 실존 논문입니다.

🧠 VLA 파운데이션 모델6

하나의 모델로 보고·이해하고·행동한다 — 로봇 지능의 새 표준

GR00T N1: An Open Foundation Model for Generalist Humanoid Robots

2025-03

NVIDIA · arXiv:2503.14734

듀얼 시스템(비전-언어 해석 + 확산 트랜스포머 실시간 모터 제어) 구조의 오픈 휴머노이드 파운데이션 모델. 실로봇 궤적·인간 영상·합성 데이터 혼합 학습, 모델·데이터 공개.

왜 중요한가 — 휴머노이드 범용 제어의 사실상 기준점. Fourier GR-1, 1X 등 실제 휴머노이드에서 양손 조작을 시연 — 로봇 DB의 휴머노이드 항목과 직결.

HumanoidVLAOpen SourceNVIDIA

π0: A Vision-Language-Action Flow Model for General Robot Control

2024-10

Physical Intelligence · arXiv:2410.24164

플로우 매칭 기반 액션 생성으로 고주파 연속 제어를 실현한 범용 VLA. 빨래 개기·테이블 정리 등 장시간 실세계 과제를 단일 모델로 수행.

왜 중요한가 — '하나의 모델로 여러 로봇을' 흐름을 연 상업 연구소의 대표작 — 로봇 파운데이션 모델 스타트업 생태계 이해의 출발점.

VLAFlow MatchingGeneral Robot Control

OpenVLA: An Open-Source Vision-Language-Action Model

2024-06

Stanford 외 공동연구 · arXiv:2406.09246

7B 파라미터 오픈소스 VLA. Open X-Embodiment 데이터로 학습해 공개된 체크포인트로 누구나 파인튜닝 가능.

왜 중요한가 — 개인·소규모 팀도 로봇 파운데이션 모델을 직접 실험할 수 있게 만든 오픈소스 전환점 — 아카데미 학습 로드맵과 연결.

VLAOpen Source7B

RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control

2023-07

Google DeepMind · arXiv:2307.15818

웹 스케일 비전-언어 지식을 로봇 제어로 전이한 최초 대규모 시연. 'VLA'라는 용어를 정착시킨 논문.

왜 중요한가 — 지금의 휴머노이드·VLA 붐이 어디서 시작됐는지 보여주는 역사적 기점.

VLAGoogle DeepMindFoundational

Open X-Embodiment: Robotic Learning Datasets and RT-X Models

2023-10

글로벌 21개+ 기관 컨소시엄 · arXiv:2310.08864

22종 로봇·수십만 궤적을 통합한 사상 최대 규모 공개 로봇 학습 데이터셋. 크로스-엠보디먼트 학습이 단일 로봇 학습을 능가함을 입증.

왜 중요한가 — '로봇계의 ImageNet' — 이후 모든 로봇 파운데이션 모델의 공통 학습 기반.

DatasetCross-EmbodimentOpen Source

A Pragmatic VLA Foundation Model

2026-01

arXiv · arXiv:2601.18692

실배치 관점에서 VLA 파운데이션 모델의 실용 설계를 다룬 2026년 최신 연구.

왜 중요한가 — 연구실 데모를 넘어 '현장에서 쓰이는 VLA'로 가는 2026년 최전선 흐름.

VLA2026Deployment

🦾 매니퓰레이션·학습5

로봇이 손을 쓰는 법을 배우는 방식의 진화

Diffusion Policy: Visuomotor Policy Learning via Action Diffusion

2023-03

Columbia · TRI · arXiv:2303.04137

확산 모델로 로봇 행동 분포를 생성해 다중 모드 행동을 안정적으로 학습. 이후 수많은 매니퓰레이션 연구의 표준 정책 아키텍처가 됨.

왜 중요한가 — GR00T N1의 System 1을 비롯해 현대 로봇 제어의 '액션 생성' 표준을 만든 논문.

DiffusionManipulationPolicy Learning

Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation

2024-01

Stanford · arXiv:2401.02117

저비용(약 $32K) 이동형 양손 원격조작 시스템 + 모방학습으로 요리·청소 등 가사 과제를 시연해 화제가 된 연구.

왜 중요한가 — '가정용 로봇'이 현실적으로 가능함을 대중에게 각인시킨 논문 — 컨슈머 로봇 카테고리의 기대치를 만들었다.

TeleoperationImitation LearningHome Robot

Universal Manipulation Interface: In-The-Wild Robot Teaching Without In-The-Wild Robots

2024-02

Stanford · Columbia · arXiv:2402.10329

휴대용 그리퍼 장치로 로봇 없이도 야외·현장 시연 데이터를 수집, 그대로 로봇 정책으로 전이하는 인터페이스.

왜 중요한가 — 로봇 데이터 수집 비용을 극적으로 낮춘 접근 — 데이터가 병목인 로봇 산업의 판도를 바꾸는 아이디어.

Data CollectionManipulation

Eureka: Human-Level Reward Design via Coding Large Language Models

2023-10

NVIDIA · arXiv:2310.12931

LLM이 강화학습 보상 함수를 스스로 코딩·진화시켜 펜 돌리기 같은 초정밀 기술을 학습. 인간 전문가 설계 보상을 능가.

왜 중요한가 — 'AI가 AI를 가르친다'를 실증 — LLM과 로봇 학습의 결합이 만드는 가속도를 보여준다.

LLMReinforcement LearningReward Design

Revisiting Embodied Chain-of-Thought for Generalizable Robot Manipulation

2026-06

arXiv · arXiv:2606.03784

체인-오브-소트(단계적 추론)를 로봇 조작에 적용할 때의 일반화 효과를 재검증한 2026년 연구.

왜 중요한가 — LLM식 '생각하는 로봇'이 실제 조작 성능으로 이어지는가 — 지금 가장 뜨거운 질문의 최신 답.

Chain-of-Thought2026Generalization

🤖 휴머노이드3

인간형 로봇 전신 제어·인간 데이터 전이의 최전선

📚 서베이·프레임워크1

산업 도입 관점에서 흐름을 정리한 지도

논문 속 로봇을 실제로 살펴보세요

GR00T이 구동하는 휴머노이드, Mobile ALOHA가 연 가정용 로봇 — 로봇 데이터베이스에서 스펙·가격·리뷰를 확인할 수 있습니다.