Papers·1개월 전

SEAOTTER: 센서 내장 오토인코더 + JPEG 변환으로 클라우드 로보틱스 압축 효율 7배 향상

UT Austin 팀이 클라우드 로보틱스를 위한 압축 프레임워크 SEAOTTER를 제안했습니다. 센서 단에서 학습된 잠재 표현을 JPEG로 일회 변환(One-Time Transcode)해, 200:1 압축률에서 AVIF 대비 인코딩 7배, 디코딩 3.5배 빠르고 ImageNet top-1 정확도 +8%를 달성했습니다. 핵심은 학습 가능한 JPEG 색상 및 양자화 변환으로, 기존 JPEG 인프라와 호환되면서도 인식 성능 저하를 막습니다. 단, 사전 훈련된 인코더가 고정되어 있어 태스크 변경 시 재학습이 필요할 수 있습니다.

UT Austin 팀이 센서 내장 오토인코더와 JPEG 변환을 결합해 클라우드 로보틱스의 대역폭-전력 제약을 해결하는 SEAOTTER를 공개했습니다.

핵심 결론

압축률 — 200:1에서 AVIF 대비 인코딩 7배, 디코딩 3.5배 빠르며 ImageNet top-1 정확도 +8%.
호환성 — JPEG 표준 인프라와 완전 호환되어 기존 파이프라인에 통합이 용이합니다.

방법

아키텍처 — 센서 단에서 경량 오토인코더로 잠재 표현 생성 후, 클라우드에서 학습 가능한 JPEG 색상·양자화 변환을 통해 표준 JPEG 파일로 일회 변환합니다.
인식 유지 — 순수 JPEG 변환 시 성능 저하를 막기 위해 변환 파라미터를 학습 가능하게 설계해, 전역·밀집·비전-언어 인식 태스크에서 정확도를 유지합니다.
사전 훈련된 인코더는 고정(frozen) 상태로, 일반 목적 및 태스크 인지 변환 파이프라인을 각각 학습합니다.

한계·조건

고정 인코더 — 인코더가 고정되어 있어 새로운 태스크나 센서에 적응하려면 변환 파이프라인 재학습이 필요합니다.
비교 기준 — AVIF 대비 성능 우위를 보였지만, 최신 학습 기반 코덱(예: HiFiC)과의 직접 비교는 없습니다.
코드 — GitHub에 공개되어 재현 가능합니다.

편집자 한 줄

JPEG 생태계를 포기하지 않으면서도 학습 기반 압축의 이점을 취한 실용적인 접근입니다. 클라우드 로보틱스 외에도 엣지-클라우드 협업 시나리오에 폭넓게 적용될 여지가 있습니다.

#compression
#robotics
#autoencoder
#jpeg
#cloud-robotics

Dan Jacobellis

원문 보기 →

SEAOTTER: 센서 내장 오토인코더 + JPEG 변환으로 클라우드 로보틱스 압축 효율 7배 향상

핵심 결론

방법

한계·조건

Comments