Dựa vào thông tin dưới đây để trả lời các câu từ 21 đến 25Trong những năm gần gây, các
Dựa vào thông tin dưới đây để trả lời các câu từ 21 đến 25
Trong những năm gần gây, các kỹ thuật học sâu đã đạt được những tiến bộ đáng chú ý trong nhiều tác vụ xử lý ngôn ngữ và hình ảnh. Những tiến bộ này bao gồm việc nhận dạng tiếng nói bằng hình ảnh (VSR) – một tác vụ đòi hỏi phải xác định được nội dung của lời nói chỉ bằng cách phân tích chuyển động môi.
Mới đây, các nhà nghiên cứu tại Đại học Hoàng gia Luân Đôn đã phát triển một mô hình có thể thực hiện nhiệm vụ VSR với nhiều ngôn ngữ khác nhau. Trong bài báo mới được công bố trên tạp chí Nature Machine Intelligence, các tác giả đã cho thấy mô hình mới vượt trội hơn so với một số mô hình trước đây (dù các mô hình trước được huấn luyện trên những bộ dữ liệu lớn hơn nhiều).
Trong các đánh giá ban đầu, mô hình mới của nhóm hoạt động rất tốt, vượt trội so với các mô hình VSR khác vốn được huấn luyện trên những tập dữ liệu lớn hơn rất nhiều. Tuy nhiên, đúng như dự đoán, mô hình này hoạt động kém hiệu quả hơn so với các mô hình nhận dạng tiếng nói tiếng Anh, chủ yếu là do các tập dữ liệu sẵn có để huấn luyện ít hơn so với dữ liệu tiếng Anh.
Ma và các đồng nghiệp của ông đã chỉ ra rằng, việc thiết kế cẩn trọng các mô hình học sâu có thể giúp cho mô hình này đạt được hiệu quả cao nhất trong các tác vụ VSR, thay vì chỉ đơn giản là sử dụng các phiên bản mô hình lớn hơn hoặc thu thập nhiều dữ liệu huấn luyện hơn. Điều này có thể dẫn đến sự thay đổi trong hướng nghiên cứu để cải thiện các mô hình VSR tương lai.
“Một trong những lĩnh vực nghiên cứu chính mà tôi quan tâm là cách kết hợp các mô hình VSR với tính năng nhận dạng giọng nói (chỉ dựa trên âm thanh) hiện nay”, Ma nói thêm. “Tôi đặc biệt quan tâm đến việc làm thế nào để mô hình có thể hiểu chúng nên dựa vào mô hình nào tùy thuộc vào điều kiện tiếng ồn. Nói cách khác, trong môi trường ồn ào, mô hình nghe – nhìn nên dựa nhiều hơn vào thông tin hình ảnh. Ngược lại, khi vùng miệng của người nói bị che khuất thì mô hình này cần phụ thuộc nhiều hơn vào âm thanh. Tuy nhiên, các mô hình hiện nay về cơ bản là bị ‘đóng băng’ sau khi được huấn luyện và không thể thích ứng với những thay đổi trong môi trường như vậy”.
(Mỹ Hạnh lược dịch - Tạp chí Tia sáng, 13/12/2022)
Trả lời cho các câu 1, 2, 3, 4, 5 dưới đây:
Công nghệ VSR là gì?
Đáp án đúng là: A
Xác định định nghĩa được nêu trong đoạn đầu văn bản.
Đáp án cần chọn là: A
Lý do chính khiến mô hình mới hoạt động kém hiệu quả hơn đối với tiếng Anh là gì?
Đáp án đúng là: B
Tìm lý do được nêu trong phần mô tả hạn chế của mô hình mới.
Đáp án cần chọn là: B
Theo Ma, thách thức nào cần được giải quyết để cải thiện mô hình VSR trong môi trường thực tế?
Đáp án đúng là: B
Xác định mục tiêu mà Ma nhấn mạnh trong phần phát biểu của ông.
Đáp án cần chọn là: B
Điểm nổi bật của mô hình mới trong nghiên cứu VSR là gì?
Đáp án đúng là: A
Xác định ưu điểm nổi bật của mô hình được nêu trong văn bản.
Đáp án cần chọn là: A
Chủ đề chính của văn bản là gì?
Đáp án đúng là: B
Tóm tắt nội dung chính của văn bản.
Đáp án cần chọn là: B
Quảng cáo
>> 2K8 Chú ý! Lộ Trình Sun 2026 - 3IN1 - 1 lộ trình ôn 3 kì thi (Luyện thi 26+ TN THPT, 90+ ĐGNL HN, 900+ ĐGNL HCM, 70+ ĐGTD - Click xem ngay) tại Tuyensinh247.com.Đầy đủ theo 3 đầu sách, Thầy Cô giáo giỏi, luyện thi theo 3 giai đoạn: Nền tảng lớp 12, Luyện thi chuyên sâu, Luyện đề đủ dạng đáp ứng mọi kì thi.
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Hỗ trợ - Hướng dẫn
-
024.7300.7989
-
1800.6947
(Thời gian hỗ trợ từ 7h đến 22h)
Email: lienhe@tuyensinh247.com












