Q8.webp
Sakura_chan

Q8.webp

Kizspy Question: 8
(Choose 1 answer)
FJOVERFLOW.COM
What is the primary objective of Random Tabular Q-planning in reinforcement learning?
A. To find the shortest path in a graph
B. To estimate the value function for a policy
C. To optimize the policy for better future rewards
D. To model the environment dynamics

Thông tin

Category
REL301m
Thêm bởi
Sakura_chan
Ngày thêm
Lượt xem
775
Lượt bình luận
2
Rating
0.00 star(s) 0 đánh giá

Share this media

Back
Bên trên Bottom