Nâng cao hiệu quả điều khiển robot, sử dụng học tăng cường kết hợp học sâu

Bài viết Nâng cao hiệu quả điều khiển robot, sử dụng học tăng cường kết hợp học sâu đề xuất mô hình học tăng cường sâu mới dựa trên sự cải tiến thuật giải Deep Q Learning truyền thống bằng cách kết hợp các kỹ thuật: Fixed_Q Target, Double Deep Q, Prioritized Experience Replay, với mô hình mạng VGG16, ứng dụng điều khiển robot xếp hàng hóa với không gian trạng thái tự thiết kế sử dụng Unity MLAgents.