'AI\ML\DL' 카테고리의 글 목록

torch.log_softmax

AI\ML\DL/Pytorch 2024. 3. 11. 14:07

torch.log_softmax 함수는 softmax 함수에 log를 취한 것과 같다. softmax와 Log 두 연산을 따로 수행하는 것보다 log_softmax를 통해 한번에 수행하는 것이 더 빠르고 수치적으로 안정적이라고 한다. 위 코드를 보면 랜덤으로 생성한 3x5 텐서 x에 softmax를 취하고 log를 취한 결과나, log_softmax를 취한 결과나 동일하다는 것을 알 수 있다. 정리하면 log_softmax는 다중분류 문제에서 logit에 softmax 취한 다음 0과 1사이의 확률로 변환하는 함수이다.

분산 및 병렬 학습

AI\ML\DL/Pytorch 2023. 12. 13. 15:27

분산 학습(Distributed training)은 학습 워크로드를 여러 작업자 노드에 분산시켜 훈련 속도와 모델 정확도를 크게 향상시키는 모델 학습 패러다임이다. PyTorch에서 분산 학습을 수행할 수 있는 몇 가지 방법이 있으며 각 방법은 사용 용도별로 장점을 가진다. DistributedDataParallel (DDP) Fully Shared Data Parallel (FSDP) Remote Procedure Call (RPC) distributed traininng Custom Extensions 비분산 학습은 단일 GPU에서 모델을 학습시킨다. 학습 과정은 다음과 같다. 1. DataLoader로부터 입력 배치를 받는다. 2. Forward pass를 통해 loss 계산 3. Backward ..

Stochastic differential equation(SDE)

AI\ML\DL/Deep learning theory 2023. 12. 5. 14:52

확률미분방정식 (Stochastic differential equation) SDE는 일반 미분 방정식과 편미분 방정식 사이의 connection을 제공한다. 일반 미분 방정식(ODE)과 유사하나, 확률적 요소를 추가하여 더 복잡한 시스템을 모델링하는 데 사용된다. 1) ODE 일반미분방정식은 변수의 변화를 시간에 대해 설명하는 방정식이다. $$ \frac{dx}{dt}=f(x,t)$$ ODE는 동일한 초기변수와 매개변수 하에 해가 항상 동일하여 deterministic하다. randomness 를 고려하지 않기 때문이다. 2) SDE 반면 확률미분방정식은 ODE에 확률성 또는 노이즈를 통합하여 불확실성을 가진 시스템을 모델링한다. $$ dx=f(x,t)dt+g(x,t)\cdot dB(t)$$ 이때 $B..

torch.cumprod() w.r.t. diffusion noise scheduling

AI\ML\DL/Pytorch 2023. 12. 3. 19:25

[cumprod: cumulative product 함수] torch.cumprod 함수는 PyTorch 에서 제공하는 함수로, 텐서의 누적 곱을 요소별로(element-wise) 계산해준다. 사용법은 다음과 같다. import torch tensor = torch.tensor([1, 2, 3, 4]) cumprod_result = torch.cumprod(tensor, dim=0) print(cumprod_result) tensor([ 1, 2, 6, 24]) 예를 들어, 'torch.tensor([1,2,3,4])' 텐서에 대해 torch.cumprod 함수를 dim=0 (첫번째 차원)으로 적용하면, 이 함수는 각 요소의 누적곱을 계산하여 [1,2,6,24] 를 반환한다. 1 1x2=2 1x2x3=6..

ABOUT ME

𝄢 𝄢

티스토리툴바