Why This Paper?1편에 이어서 GFlowNet Foundations에 대한 내용을 정리하도록 한다.GFlowNets: Learning a Flow지금까지 나타낸 정의들을 이용하여 GFlowNet 훈련 방법을 확장해보고자 한다. 몇 가지 새로운 훈련 기법을 탐구한다. 1. 시간 스탬프 도입을 통한 순환 구조 허용일반적으로 GFlowNet의 상태 공간은 DAG로 구성되지만 순환이 포함된 상태 공간도 고려할 수 있다. 이를 위해 확장된 상태 공간 S′=SxN을 도입한다. 시간 스탬프 t를 포함하여 여러 번 방문해도 각 방문이 서로 구분되게 만든다. 2. 확률적인 보상기존에는 보상이 결정론적이라고 가정했지만 확률적인 보상도 고려할 수 있다. 즉, 상태 s에서 보상 $..