Low | Notion

단계	일반적인 ML 아키텍처	최적화 저지연 아키텍처	개선 효과
Data In	Kafka (JSON) : 50ms	Kafka (Protobuf) : 5ms	10배 ↑
전처리	Pandas (CPU) : 100ms	Ray Data (Vectorized) : 10ms	10배 ↑
데이터 이동	Socket/Disk Copy : 50ms	**Shared Memory (Zero-copy) : <1ms
-POSIX Shared Memory > Apache Arrow Plasma**	압도적
추론	Vanilla PyTorch : 200ms	TensorRT(NVDIA) / ONNX, CoreML : 20ms	10배 ↑
총합 (E2E)	~400ms (눈에 보임)	<40ms (실시간 체감)	10배 빠른 반응