Q30.webp
Sakura_chan

Q30.webp

Kizspy | Question: 30
(Choose 1 answer)
Which of the following methods combines linear function approximation with policy improvement?
A. Policy Gradient Methods
B. Value Iteration
C. Actor-Critic Methods
D. Tabular Q-Learning

Thông tin

Category
REL301m
Thêm bởi
Sakura_chan
Ngày thêm
Lượt xem
484
Lượt bình luận
1
Rating
0.00 star(s) 0 đánh giá

Share this media

Back
Bên trên Bottom