Q1.webp
Sakura_chan

Q1.webp

Kizspy | Question: 1
(Choose 1 answer)
FJOVERFLOW.COM
Which algorithm is commonly used for off-policy learning in reinforcement learning?
A. Q-learning
B. SARSA
C. Deep Q-Network (DQN)
D. Policy Gradient

Thông tin

Category
REL301m
Thêm bởi
Sakura_chan
Ngày thêm
Lượt xem
587
Lượt bình luận
1
Rating
0.00 star(s) 0 đánh giá

Share this media

Back
Bên trên Bottom