CƠ CHẾ HOẠT ĐỘNG CỦA MÔ HÌNH NGÔN NGỮ LỚN (LLMs) (1) Các mô hình
CƠ CHẾ HOẠT ĐỘNG CỦA MÔ HÌNH NGÔN NGỮ LỚN (LLMs)
(1) Các mô hình ngôn ngữ lớn (Large Language Models - LLMs) như GPT-4 hay Claude hoạt động dựa trên kiến trúc mạng nơ-ron có tên là Transformer. Đơn vị cơ bản mà các mô hình này xử lý không phải là từ (word) mà là Token. Token có thể là một từ, một phần của từ hoặc một ký tự. Ví dụ, từ "apple" là một token, nhưng "smartphones" có thể bị tách thành hai token "smart" và "phones". Khả năng "hiểu" ngữ cảnh của mô hình đến từ cơ chế sự chú ý (Attention Mechanism), cho phép nó đánh trọng số quan trọng cho các từ khác nhau trong câu để dự đoán từ tiếp theo hợp lý nhất.
(2) Quá trình huấn luyện LLMs diễn ra qua hai giai đoạn chính. Giai đoạn 1 là Tiền huấn luyện (Pre-training): mô hình được "đọc" một lượng dữ liệu khổng lồ (hàng nghìn tỷ token) từ internet để học quy luật ngôn ngữ và kiến thức tổng quát. Giai đoạn 2 là tinh chỉnh (Fine-tuning), trong đó quan trọng nhất là phương pháp RLHF (Reinforcement Learning from Human Feedback). Tại đây, con người đánh giá các câu trả lời của AI để dạy nó cách phản hồi an toàn, hữu ích và đúng trọng tâm hơn.
(3) Mặc dù rất mạnh mẽ, LLMs vẫn tồn tại những hạn chế cố hữu. Phổ biến nhất là hiện tượng ảo giác (Hallucination), khi AI tự tin đưa ra những thông tin hoàn toàn sai lệch hoặc bịa đặt nhưng nghe rất thuyết phục. Nguyên nhân là do bản chất của LLM là mô hình xác suất: nó chỉ dự đoán chuỗi ký tự tiếp theo có khả năng xuất hiện cao nhất chứ không thực sự "biết" sự thật hay kiểm chứng được tính đúng sai của dữ liệu.
(Nguồn: Tổng hợp và biên soạn dựa trên bài viết chuyên sâu từ Tạp chí Tia Sáng và VnExpress Số hóa.)
Trả lời cho các câu 1, 2, 3, 4, 5 dưới đây:
Ghép các thuật ngữ cơ bản với định nghĩa tương ứng.
Đáp án đúng là: 1-c; 2-a; 3-b
Định vị từ khóa trong đoạn (1) để tìm định nghĩa của từng thuật ngữ.
Đáp án cần chọn là: 1-c; 2-a; 3-b
Ghép các giai đoạn huấn luyện với mục tiêu/đặc điểm chính.
Đáp án đúng là: 1-b; 2-c; 3-a
Định vị và phân loại thông tin từ đoạn (1) và (2).
Đáp án cần chọn là: 1-b; 2-c; 3-a
Hãy ghép các thành phần/giai đoạn với chức năng/đặc điểm tương ứng.
Đáp án đúng là: 1-c; 2-a; 3-b; 4-d
Định vị thông tin và đọc hiểu chức năng.
Đáp án cần chọn là: 1-c; 2-a; 3-b; 4-d
Hãy ghép các tình huống/ví dụ thực tế với khái niệm kỹ thuật giải thích cho tình huống đó
Đáp án đúng là: 1-b; 2-a; 3-d; 4-c
Vận dụng kiến thức vào ví dụ cụ thể.
Đáp án cần chọn là: 1-b; 2-a; 3-d; 4-c
Ghép các đặc điểm kỹ thuật cốt lõi của LLM với hệ quả thực tế/hạn chế tương ứng.
Đáp án đúng là: 1-b; 2-a; 3-d; 4-c
Phân tích quan hệ nhân - quả dựa trên bản chất kỹ thuật.
Đáp án cần chọn là: 1-b; 2-a; 3-d; 4-c
Quảng cáo
>> 2K8 Chú ý! Lộ Trình Sun 2026 - 3IN1 - 1 lộ trình ôn 3 kì thi (Luyện thi 26+ TN THPT, 90+ ĐGNL HN, 900+ ĐGNL HCM, 70+ ĐGTD - Click xem ngay) tại Tuyensinh247.com.Đầy đủ theo 3 đầu sách, Thầy Cô giáo giỏi, luyện thi theo 3 giai đoạn: Nền tảng lớp 12, Luyện thi chuyên sâu, Luyện đề đủ dạng đáp ứng mọi kì thi.
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Hỗ trợ - Hướng dẫn
-
024.7300.7989
-
1800.6947
(Thời gian hỗ trợ từ 7h đến 22h)
Email: lienhe@tuyensinh247.com












