[리뷰] SMPL: A Skinned Multi-Person Linear Model

2025. 1. 15. 19:08

1. 문제 배경 및 기존 방식의 한계

1.1 3D 인체 모델링의 필요성

컴퓨터 비전과 컴퓨터 그래픽스 분야에서는 3D 사람 모델이 매우 중요한 역할을 함.
- 예: 애니메이션, 동작 분석(Motion Capture), 가상 피팅(Virtual Try-On), AR/VR 등.
목표: 실제 사람들의 **다양한 체형(Shape)**과 다양한 자세(Pose) 변화를 하나의 통합 모델로 표현하고자 함.

1.2 기존 모델의 문제점

SCAPE(Anguelov et al. 2005) 등 과거 모델은 사람 표면 변형을 표현할 수 있지만,
- 구현 복잡도와 계산 비용이 큼.
- Pose 변화, Shape 변화가 비선형적으로 뒤섞여서 처리하기 번거로움.
Blend Shape 기반 모델들도 존재하지만, 정확한 체형·자세 분리를 효율적으로 구현하기가 쉽지 않음.

2. SMPL의 핵심 개념

SMPL(Skinned Multi-Person Linear model)은 **Linear Blend Skinning(LBS)**을 기반으로,

(1) Shape 파라미터 β\beta: 사람마다 다른 체형(Height, Body proportions 등)을 표현
(2) Pose 파라미터 θ\theta: 관절 회전(각도)으로 인한 신체 표면 변형을 표현
이 두 가지를 선형(linear) 형태로 융합하여, 다양한 사람의 자세 + 체형을 하나의 일관된 메시(Mesh)로 재현.

2.1 모델 정의

SMPL은 **단일 메쉬(Topology가 고정된 약 6890개 버텍스)**를 사용:

Template Mesh T\mathbf{T}
- 기준자세(예: A-포즈나 T-포즈)에 있는 중립형(중성 자세)의 사람 메쉬.
- 버텍스 개수 N=6890N = 6890이며, 삼각형 패치(면) 연결 구조는 고정.
Shape Blend Shapes
- 체형 파라미터 β\beta (보통 10~20차원 사용)에 따라 메쉬가 변형되는 선형 모델.
- Tshape(β) = T + ∑i=1∣β∣βi Si \mathbf{T}_{\text{shape}}(\beta) \;=\; \mathbf{T} \;+\; \sum_{i=1}^{|\beta|} \beta_i \,\mathbf{S}_i 여기서 Si\mathbf{S}_i는 Shape Blend Shape(각 체형 주성분)에 해당하는 (3N)(3N)-차원 벡터.
Pose Blend Shapes
- Pose 파라미터 θ\theta (보통 3*(Joint수) = 72차원 등)를 통해 관절 회전에 의한 세부적인 근육·체표 변형을 선형 보정.
- Δpose(θ) = ∑j=1KBj Rj(θ) \Delta_{\text{pose}}(\theta) \;=\; \sum_{j=1}^{K} B_j \,R_j(\theta)
  - KK: 관절 개수.
  - BjB_j: 관절 jj에 대응하는 Pose Blend Shape.
  - Rj(θ)R_j(\theta): 관절 jj 회전에 따른 어떤 사전 정의된 함수(회전 행렬에서 유도되는 특징 벡터 등).
- 이를 통해, 팔을 굽힐 때 특정 근육 부위가 튀어나오는 등 미세한 Pose 기반 변형을 단순화된 선형 결합으로 모델링.
Linear Blend Skinning (LBS)
- 각 버텍스를 여러 관절에 가중치(Skinning weight)로 매핑하고, 관절 회전에 따라 해당 버텍스가 선형적으로 따라가도록 함.
- 최종적으로 vi\mathbf{v}_i번째 버텍스는 vi(β,θ)=∑j=1Kwij Gj(θ)(Tshape(β)i+Δpose(θ)i) \mathbf{v}_i(\beta, \theta) = \sum_{j=1}^{K} w_{ij} \,G_j(\theta) \left(\mathbf{T}_{\text{shape}}(\beta)_i + \Delta_{\text{pose}}(\theta)_i\right)
  - wijw_{ij}: 버텍스 ii가 관절 jj에 할당되는 스키닝 가중치(모두 합하면 1).
  - Gj(θ)G_j(\theta): 관절 jj의 전역 변환(회전 + 위치) 행렬.

결과적으로 SMPL은,

SMPL(β,θ) = LBS ⁣(T,β,θ,S,B,W)\text{SMPL}(\beta, \theta) \;=\; \text{LBS}\!\bigl(\mathbf{T}, \beta, \theta, \mathbf{S}, \mathbf{B}, \mathbf{W}\bigr)

형태로 사람이 취할 수 있는 다양 형태/자세를 선형 블렌딩으로 표현한다.

3. 학습 데이터와 파라미터 추정 과정

3.1 데이터 확보

주로 3D 스캐너(예: CAESAR 데이터 등)로부터 수백~수천 명 이상의 전신 스캔을 취득.
각 스캔은 다른 사람, 다른 자세를 포함.

3.2 Template 정렬(Non-rigid Registration)

모든 스캔 데이터를 **동일한 위상(topology)**의 템플릿 메쉬와 정합(Registration)해야 함.
- 보통 non-rigid ICP(Iterative Closest Point)나 특수 소프트웨어(Fitting pipeline) 사용.
- 스캔 마다 표면 점 위치가 다르지만, 궁극적으로 동일한 N=6890N=6890 버텍스 인덱스에 맵핑되도록 함.

3.3 Shape Blend Shapes 추출

각기 다른 사람들(다른 체형)을 중립 자세로 노멀라이즈한 뒤, 평균 모델 T\mathbf{T}에서 편차를 PCA 등으로 분해해 Shape Basis(Si\mathbf{S}_i)를 학습.
예: S1\mathbf{S}_1은 “키가 커지는” 주성분, S2\mathbf{S}_2는 “몸통이 두꺼워지는” 주성분 등.

3.4 Pose Blend Shapes 추출

서로 다른 자세를 취한 데이터에서, 단순 LBS만으로 보정되지 않는 추가 표면 변형을 관절 회전에 대한 “블렌드 셰이프”로 학습.
관절 θ\theta 별로 잔차(Residual)를 모아 선형회귀나 주성분 분석으로 Bj\mathbf{B}_j를 구함.

3.5 Skinning Weights(W\mathbf{W})

버텍스-관절 간 가중치는 일반적으로 거리 기반 초기화 후, 최적화/학습을 통해 세부 조정.
합이 1이 되도록 정규화.

4. 모델의 장점과 특성

통합적(Shape + Pose) 파라메트릭 모델
- β\beta는 체형, θ\theta는 자세로 구분되어 직관적.
- 비선형 복잡도를 줄이고, 선형 결합 구조로 계산 간소화.
학습 및 렌더링 효율
- LBS(Linear Blend Skinning) 메커니즘을 따르므로, 그래픽 엔진 등과 쉽게 통합 가능.
- 기존 SCAPE 모델보다 파이프라인 간단, 계산량도 적은 편.
다양한 응용
- 컴퓨터 비전: 2D 이미지에서 θ,β\theta, \beta를 추정해 3D 재구성.
- 그래픽스: 게임·영화에서 간단히 모션 캡처 데이터(θ\theta) + 개별 사용자 체형(β\beta) 적용.
표준화된 메쉬(Topology)
- 모든 사람·모든 자세에 대해 동일한 버텍스 인덱스를 공유해, 픽셀 단위 대응이나 Texure 매핑 등이 용이.

5. 실험 및 성능 평가

5.1 SCAPE 등 비교

SMPL은 SCAPE 대비
- 학습 과정: SCAPE의 비선형 Deformation Model 대비, SMPL은 Linearity를 강하게 활용 → 학습 안정성, 구현 단순성 향상.
- 재현력: 논문에서 다양한 체형·자세 샘플링 결과, SMPL이 유사하거나 더 나은 품질을 달성.

5.2 Quantitative Metrics

논문에서는 3D 스캔에 대한 재구성 에러(RMSE of vertex positions), 관절 회전 예측 에러 등을 보고.
SMPL이 많은 케이스에서 낮은 재구성 에러를 나타냄.

6. 한계 및 후속 연구 방향

극단적인 체형: 예를 들어, 임산부, 몸이 매우 뚱뚱하거나 매우 마른 경우, PCA 기반 Shape Basis가 잘 커버하지 못할 수 있음(추가 주성분 필요).
근육 수축/이완 표현: Pose Blend Shapes가 선형 결합이긴 하나, 실제 인체의 근육/지방 움직임을 완전히 재현하기엔 제한.
Face/Hand/Foot 세분화: SMPL 기본 모델은 얼굴/손가락/발가락의 디테일이 낮음. 후속 연구(SMPL-X, SMPL+H 등)에서 세분화 모델을 제안.
동적 변화(Soft-tissue Dynamics): 달릴 때 살이 흔들리는 등 동적 물리 효과는 SMPL이 직접적으로 모델링하지 않음(추가 물리 시뮬레이션 필요).

7. 결론 및 의의

SMPL은 “인체의 Shape(체형)과 Pose(자세)를 분리하여 선형적으로 표현”하는 강력하면서도 간단한 3D 파라메트릭 모델이다.

영상 처리·AI 관점에서, 2D 관찰(예: 이미지, 비디오)로부터 β\beta와 θ\theta를 역추정(Inverse Rendering)하면, 사람의 3D 구조를 효율적으로 복원 가능.
그래픽스 관점에서도, Linear Blend Skinning 구조가 GPU에서 쉽게 렌더링·애니메이션 가능하다는 실용적 장점.

SMPL은 이후 확장 모델들(SMPL-X, STAR, VPoser 등)의 기반을 마련했고, 오늘날의 3D Human Modeling 연구에서 사실상의 표준(De-facto standard) 역할을 하고 있다.

예) DensePose, HMR(Human Mesh Recovery), VIBE, SPIN 등과 결합해 2D 영상에서 직접 β,θ\beta, \theta를 예측하는 시도가 활발함.

참고 문헌

저작자표시 비영리 동일조건

'소프트웨어 > 머신러닝' 카테고리의 다른 글

지도학습 (0)	2022.01.03
머신러닝이란 무엇인가? (0)	2022.01.03
[ML.NET] Error: DllNotFoundException: DLL 'tensorflow'을(를) 로드할 수 없습니다. 지정된 모듈을 찾을 수 없습니다. (예외가 발생한 HRESULT: 0x8007007E) (0)	2021.06.13
[ML.NET] Error: 'ModelOperationsCatalog'에는 'LoadTensorFlowModel'에 대한 정의가 포함되어 있지 않고, 'ModelOperationsCatalog' 형식의 첫 번째 인수를 허용하는 액세스 가능한 확장 메서드 'LoadTensorFlowModel' 이(가).. (0)	2021.06.13
[ML.NET] Error : 'TransformsCatalog'에는 'LoadImages'에 대한 정의가 포함되어 있지 않고, 'TransformsCatalog' 형식의 첫번째 인스를 허용하는 액세스 가능한 확장 메서드 'LoadImages'이(가) 없습니다. using 지시.. (0)	2021.06.13

토마스의 기술 정리함