Tel: 024.7300.7989 - Phone: 1800.6947 (Thời gian hỗ trợ từ 7h đến 22h)

Giỏ hàng của tôi

Câu hỏi số 860885:
Vận dụng

Đáp án đúng là: A

Quảng cáo

Câu hỏi:860885
Phương pháp giải

Ngữ cảnh đang giải thích về phương pháp huấn luyện có cấu trúc (structured training plan) với phần thưởng (rewarded) cho các hành động đúng.

Giải chi tiết

Cần một câu tiếp nối ý nghĩa, giải thích tác dụng/mục đích của việc tặng thưởng.

A. Hệ thống củng cố tích cực này khuyến khích robot lặp lại các hành vi mong muốn một cách nhất quán.

→ Hoàn toàn phù hợp với ngữ cảnh 'rewarded' và dẫn đến kết quả “learn to hit shuttlecocks”

B. Do đó, robot đã nhanh chóng hiểu được mọi quy tắc của trò chơi mà không gặp bất kỳ khó khăn nào.

→ Sai vì việc học hỏi cần hàng ngàn lần thử nghiệm.

C. Cách tiếp cận như vậy chứng tỏ rằng robot chỉ có thể học thông qua tương tác trực tiếp với con người.

→ Sai vì robot đang học qua huấn luyện ảo

D. Robot có thể thực hiện các hành động phức tạp mà không cần bất kỳ đào tạo hoặc hướng dẫn nào thêm.

→ Sai vì robot cần hàng nghìn lần mô phỏng.

Đáp án cần chọn là: A

Group 2K8 ôn Thi ĐGNL & ĐGTD Miễn Phí

>>  2K8 Chú ý! Lộ Trình Sun 2026 - 3IN1 - 1 lộ trình ôn 3 kì thi (Luyện thi 26+ TN THPT, 90+ ĐGNL HN, 900+ ĐGNL HCM, 70+ ĐGTD - Click xem ngay) tại Tuyensinh247.com.Đầy đủ theo 3 đầu sách, Thầy Cô giáo giỏi, luyện thi theo 3 giai đoạn: Nền tảng lớp 12, Luyện thi chuyên sâu, Luyện đề đủ dạng đáp ứng mọi kì thi.

Hỗ trợ - Hướng dẫn

  • 024.7300.7989
  • 1800.6947 free

(Thời gian hỗ trợ từ 7h đến 22h)
Email: lienhe@tuyensinh247.com