Q18.webp
Sakura_chan

Q18.webp

Kizspy | Question: 18
(Choose 1 answer)
What is the main objective of the Q-learning algorithm?
A. To minimize the state-action pair values
B. To maximize the total reward over time
C. To minimize the exploration rate
D. To maximize the number of actions taken

Thông tin

Category
REL301m
Thêm bởi
Sakura_chan
Ngày thêm
Lượt xem
572
Lượt bình luận
2
Rating
0.00 star(s) 0 đánh giá

Share this media

Back
Bên trên Bottom