Q24.webp
Sakura_chan

Q24.webp

Kizspy | Question: 24
(Choose 1 answer)
Which of the following methods is NOT typically used to learn the parameters of a Gaussian policy?
A. Maximum likelihood estimation
B. Policy gradient methods
C. Q-Learning
D. Actor-Critic methods

Thông tin

Category
REL301m
Thêm bởi
Sakura_chan
Ngày thêm
Lượt xem
556
Lượt bình luận
2
Rating
0.00 star(s) 0 đánh giá

Share this media

Back
Bên trên Bottom