To the Next Clever Move

Motion Planning · VLA · World Model — 자율주행 연구 노트

To the Next Clever Move

RT-X 2

[논문 리뷰] Open X-Embodiment: Robotic Learning Datasets and RT-X Models

로봇 학습에서도 Foundation Model을 위한 공통 데이터셋이 가능할까?본 포스팅은 Open X-Embodiment: Robotic Learning Datasets and RT-X Models 논문을 읽고 정리한 글입니다.RT-1과 RT-2를 읽고 나면 자연스럽게 다음 질문이 생깁니다.RT-1/RT-2는 강력하지만, 특정 로봇과 특정 데이터 분포에 너무 의존하는 것은 아닐까?여러 기관, 여러 로봇, 여러 task에서 수집한 데이터를 하나로 모으면 더 general한 robot policy를 만들 수 있을까?Open X-Embodiment는 이 질문에 답하려는 논문입니다.RT-1이 하나의 robot fleet에서 수집한 대규모 real-world data로 multi-task robot policy..

[공부 로드맵] RT-1/RT-2 이후 VLA 연구 흐름 정리

Robotics VLA에서 Autonomous Driving VLA까지RT-1과 RT-2를 읽고 나니, 자연스럽게 다음 질문이 생겼다.RT-1/RT-2 이후 VLA 연구는 어떤 방향으로 발전했을까?그리고 이 흐름이 자율주행 분야에도 연결되고 있을까? RT-1은 대규모 real-world robot demonstration을 기반으로, 이미지와 자연어 명령을 입력받아 robot action을 출력하는 language-conditioned robot policy를 제안했다. RT-2는 여기서 한 단계 더 나아가, Vision-Language Model, VLM을 실제 robot action까지 출력하는 Vision-Language-Action, VLA 모델로 확장했다.내가 이해한 RT-1/RT-2의 핵심 흐..

공부 로드맵 2026.05.25