Dưới đây là phân tích chi tiết về cấu trúc prompt bạn cung cấp, được trình bày theo yêu cầu:
1. Phân tích Cấu trúc Prompt
Prompt này được thiết kế để thu thập thông tin từ người dùng và sử dụng nó để đưa ra một phân loại nguy cơ tim mạch. Cấu trúc của prompt bao gồm:
- Phần mô tả tác vụ: “Dựa trên dữ liệu bệnh nhân: ” – Đây là phần chỉ dẫn cho mô hình biết công việc cần làm là dựa vào dữ liệu được cung cấp.
- Các biến số (Parameters) cần điền:
[TUỔI]
: Tuổi của bệnh nhân.[GIỚI_TÍNH]
: Giới tính của bệnh nhân (ví dụ: Nam, Nữ).[CHOLESTEROL_TOÀN_PHẦN]
: Giá trị cholesterol toàn phần (mg/dL hoặc mmol/L).[CHOLESTEROL_HDL]
: Giá trị cholesterol HDL (mg/dL hoặc mmol/L).[ĐỊA_TÂM_THU]
: Huyết áp tâm thu (mmHg).[ĐIỀU_TRỊ_TĂNG_HUYẾT_ÁP]
: Thông tin xem bệnh nhân có đang điều trị tăng huyết áp hay không (ví dụ: Có, Không).[HÚT_THUỐC]
: Thông tin xem bệnh nhân có hút thuốc lá hay không (ví dụ: Có, Không).[ĐÁI_THÁO_ĐƯỜNG]
: Thông tin xem bệnh nhân có mắc đái tháo đường hay không (ví dụ: Có, Không).
- Kết quả mong muốn: “Phân loại nguy cơ tim mạch 10 năm của bệnh nhân này theo thang điểm Framingham (Thấp, Trung bình, Cao kèm theo tỷ lệ nguy cơ %).” – Phần này mô tả chính xác loại đầu ra mà người dùng mong đợi, bao gồm cả hạng mục phân loại (Thấp, Trung bình, Cao) và con số phần trăm nguy cơ.
Việc sử dụng các dấu ngoặc vuông `[]` cho các biến số làm cho prompt trở nên rõ ràng và dễ dàng cho việc điền dữ liệu, cũng như cho mô hình phân tích. Đây là một mẫu prompt hiệu quả cho các tác vụ yêu cầu nhập liệu theo khuôn mẫu.
2. Ý nghĩa & Cách hoạt động
Về mặt kỹ thuật, prompt này hoạt động như sau:
- Đầu vào (Input): Mô hình ngôn ngữ lớn (LLM) nhận vào một chuỗi văn bản bao gồm các trường thông tin cụ thể về bệnh nhân, được định danh bằng các thẻ như
[TUỔI]
,[GIỚI_TÍNH]
, v.v. Người dùng hoặc một hệ thống khác sẽ điền các giá trị thực tế cho những thẻ này. - Xử lý ngữ cảnh (Contextual Processing): LLM sẽ diễn giải toàn bộ chuỗi văn bản như một yêu cầu. “Dựa trên dữ liệu bệnh nhân” chỉ định rằng các thông tin theo sau là cơ sở để thực hiện yêu cầu.
- Nhiệm vụ phân loại (Classification Task): Yêu cầu “Phân loại nguy cơ tim mạch 10 năm của bệnh nhân này theo thang điểm Framingham” là cốt lõi. LLM được kỳ vọng sẽ truy cập kiến thức, hoặc mô phỏng một quy trình tính toán dựa trên các quy tắc của thang điểm Framingham, để đưa ra dự đoán.
- Thang điểm Framingham (Framingham Risk Score): Đây là một mô hình dự báo được sử dụng phổ biến để ước tính nguy cơ mắc các biến cố tim mạch (như đau tim, đột quỵ) trong vòng 10 năm tới. Nó dựa trên các yếu tố nguy cơ như tuổi, giới tính, cholesterol, huyết áp, hút thuốc, v.v. LLM có thể đã được huấn luyện với dữ liệu liên quan đến thang điểm này hoặc có khả năng thực hiện các phép tính logic dựa trên các quy tắc mà người tạo prompt giả định nó biết.
- Đầu ra (Output): Kết quả mong muốn là một sự kết hợp của:
- Phân loại định tính: Thấp, Trung bình, hoặc Cao.
- Phân loại định lượng: Tỷ lệ nguy cơ dưới dạng phần trăm (ví dụ: 5%, 15%, 25%).
Về cơ bản, prompt này yêu cầu LLM đóng vai trò như một công cụ tính toán và diễn giải y tế đơn giản, áp dụng một thuật toán hoặc quy tắc đã biết (thang điểm Framingham) lên dữ liệu bệnh nhân được cung cấp.
3. Ví dụ Minh họa
Dưới đây là hai ví dụ minh họa cách prompt này có thể được sử dụng để tạo ra các yêu cầu thực tế cho mô hình:
Ví dụ 1: Bệnh nhân nam, nguy cơ thấp
Prompt đã điền:
Dựa trên dữ liệu bệnh nhân: Tuổi: 45, Giới tính: Nam, Cholesterol toàn phần: 180, Cholesterol HDL: 60, Huyết áp tâm thu: 120, Đang điều trị tăng huyết áp: Không, Hút thuốc lá: Không, Đái tháo đường: Không. Phân loại nguy cơ tim mạch 10 năm của bệnh nhân này theo thang điểm Framingham (Thấp, Trung bình, Cao kèm theo tỷ lệ nguy cơ %).
Ví dụ 2: Bệnh nhân nữ, nguy cơ cao
Prompt đã điền:
Dựa trên dữ liệu bệnh nhân: Tuổi: 65, Giới tính: Nữ, Cholesterol toàn phần: 250, Cholesterol HDL: 40, Huyết áp tâm thu: 145, Đang điều trị tăng huyết áp: Có, Hút thuốc lá: Có, Đái tháo đường: Có. Phân loại nguy cơ tim mạch 10 năm của bệnh nhân này theo thang điểm Framingham (Thấp, Trung bình, Cao kèm theo tỷ lệ nguy cơ %).
👉 Tóm lại
Prompt này là một mẫu rất tốt cho việc thu thập dữ liệu có cấu trúc và yêu cầu mô hình xử lý dựa trên một quy tắc hoặc mô hình cụ thể (trong trường hợp này là thang điểm Framingham). Cấu trúc rõ ràng với các biến được định danh giúp người dùng dễ dàng điền thông tin và đảm bảo mô hình nhận được dữ liệu cần thiết. Kết quả mong muốn cũng được định nghĩa chi tiết, cho phép LLM tạo ra phản hồi chính xác và đầy đủ theo yêu cầu. Đây là một ví dụ hiệu quả về cách định dạng prompt để đạt được kết quả mong muốn trong các ứng dụng AI y tế hoặc phân tích dữ liệu.