Prompt: Loại bỏ các bản ghi trùng lặp – Phân tích dữ liệu bất động sản – AI Real Estate

820
Chia sẻ
2k
Lượt xem
Mục lục

Tuyệt vời! Dưới đây là phân tích chi tiết prompt template bạn cung cấp, theo đúng cấu trúc yêu cầu và sử dụng định dạng HTML bằng tiếng Việt:

1. Phân tích Cấu trúc Prompt

Prompt template này được thiết kế để thực hiện một nhiệm vụ cụ thể là làm sạch dữ liệu bất động sản bằng cách xác định và loại bỏ các bản ghi trùng lặp. Cấu trúc của nó khá rõ ràng và bao gồm các phần tử sau:

  • Hành động chính: “Phân tích tập dữ liệu bất động sản” – Chỉ định nhiệm vụ tổng thể.
  • Đối tượng: “[TÊN_TẬP_DỮ_LIỆU]” – Một biến placeholder sẽ được thay thế bằng tên thực tế của tập dữ liệu cần xử lý (ví dụ: “du_lieu_nha_pho_hcm.csv”, “bat_dong_san_danang.json”).
  • Nhiệm vụ con 1: “Tìm và loại bỏ tất cả các bản ghi bị trùng lặp” – Mô tả rõ ràng hành động cần thực hiện để làm sạch dữ liệu.
  • Tiêu chí để xác định trùng lặp: “dựa trên các cột [DANH_SÁCH_CỘT_XÁC_ĐỊNH_TRÙNG_LẶP]” – Một biến placeholder khác, yêu cầu người dùng cung cấp danh sách các tên cột sẽ được sử dụng để so sánh và xác định bản ghi trùng lặp. Điều này rất quan trọng vì một bản ghi có thể trùng lặp trên một số cột nhưng không trùng lặp trên các cột khác.
  • Yêu cầu báo cáo: “Báo cáo số lượng bản ghi trùng lặp đã được loại bỏ.” – Xác định đầu ra mong muốn, là một con số thống kê về kết quả của quá trình loại bỏ.

2. Ý nghĩa & Cách hoạt động

Về mặt kỹ thuật, khi bạn sử dụng template này trong một hệ thống xử lý ngôn ngữ tự nhiên có khả năng thực thi mã code hoặc tương tác với các công cụ phân tích dữ liệu, nó sẽ hoạt động như sau:

  • Phân tích cú pháp: Hệ thống sẽ nhận diện các biến trong ngoặc vuông ([TÊN_TẬP_DỮ_LIỆU][DANH_SÁCH_CỘT_XÁC_ĐỊNH_TRÙNG_LẶP]) và chờ đợi giá trị thay thế.
  • Xác định hành động: Nắm bắt các động từ và danh từ để hiểu yêu cầu: “phân tích”, “tìm”, “loại bỏ”, “báo cáo”, “bản ghi trùng lặp”, “tập dữ liệu”.
  • Thực thi logic xử lý dữ liệu:
    • Nó sẽ tải tập dữ liệu được chỉ định bởi [TÊN_TẬP_DỮ_LIỆU].
    • Sử dụng các cột được liệt kê trong [DANH_SÁCH_CỘT_XÁC_ĐỊNH_TRÙNG_LẶP] làm khóa để xác định các hàng (bản ghi) hoàn toàn giống nhau.
    • Thực hiện một thao tác loại bỏ các bản ghi trùng lặp. Thông thường, quy trình này sẽ giữ lại một bản ghi duy nhất cho mỗi nhóm bản ghi trùng lặp (ví dụ: giữ lại bản ghi đầu tiên hoặc cuối cùng gặp phải).
    • Đếm số lượng bản ghi đã bị loại bỏ.
  • Tạo phản hồi: Trả về thông tin về số lượng bản ghi trùng lặp đã loại bỏ, có thể kết hợp với một tóm tắt ngắn gọn về quá trình hoặc tập dữ liệu đã được làm sạch.

3. Ví dụ Minh họa

Dưới đây là hai ví dụ về cách bạn có thể điền thông tin vào template để tạo ra các câu lệnh cụ thể:

Ví dụ 1: Với dữ liệu CSV và các cột chính

Prompt Template:

Phân tích tập dữ liệu bất động sản [TÊN_TẬP_DỮ_LIỆU]. Tìm và loại bỏ tất cả các bản ghi bị trùng lặp dựa trên các cột [DANH_SÁCH_CỘT_XÁC_ĐỊNH_TRÙNG_LẶP]. Báo cáo số lượng bản ghi trùng lặp đã được loại bỏ.

Dữ liệu điền vào:

  • [TÊN_TẬP_DỮ_LIỆU] = "du_lieu_can_ban_ha_noi.csv"
  • [DANH_SÁCH_CỘT_XÁC_ĐỊNH_TRÙNG_LẶP] = "DiaChi, DienTich, SoPhongNgu"

Prompt cuối cùng được tạo ra:

Phân tích tập dữ liệu bất động sản "du_lieu_can_ban_ha_noi.csv". Tìm và loại bỏ tất cả các bản ghi bị trùng lặp dựa trên các cột "DiaChi, DienTich, SoPhongNgu". Báo cáo số lượng bản ghi trùng lặp đã được loại bỏ.

Ví dụ 2: Với dữ liệu JSON và các cột xác định duy nhất

Prompt Template:

Phân tích tập dữ liệu bất động sản [TÊN_TẬP_DỮ_LIỆU]. Tìm và loại bỏ tất cả các bản ghi bị trùng lặp dựa trên các cột [DANH_SÁCH_CỘT_XÁC_ĐỊNH_TRÙNG_LẶP]. Báo cáo số lượng bản ghi trùng lặp đã được loại bỏ.

Dữ liệu điền vào:

  • [TÊN_TẬP_DỮ_LIỆU] = "bot_sang_nhat.json"
  • [DANH_SÁCH_CỘT_XÁC_ĐỊNH_TRÙNG_LẶP] = "ma_can_ho,ngay_dang"

Prompt cuối cùng được tạo ra:

Phân tích tập dữ liệu bất động sản "bot_sang_nhat.json". Tìm và loại bỏ tất cả các bản ghi bị trùng lặp dựa trên các cột "ma_can_ho,ngay_dang". Báo cáo số lượng bản ghi trùng lặp đã được loại bỏ.

👉 Tóm lại

Prompt template “Phân tích tập dữ liệu bất động sản [TÊN_TẬP_DỮ_LIỆU]. Tìm và loại bỏ tất cả các bản ghi bị trùng lặp dựa trên các cột [DANH_SÁCH_CỘT_XÁC_ĐỊNH_TRÙNG_LẶP]. Báo cáo số lượng bản ghi trùng lặp đã được loại bỏ.” là một chỉ lệnh hiệu quả cho việc xử lý dữ liệu, cho phép người dùng tùy chỉnh tập dữ liệu và tiêu chí xác định trùng lặp. Cấu trúc rõ ràng, bao gồm cả hành động chính, đối tượng và yêu cầu đầu ra, giúp hệ thống hiểu rõ và thực thi nhiệm vụ làm sạch dữ liệu một cách chính xác. Việc sử dụng các placeholder [TÊN_TẬP_DỮ_LIỆU][DANH_SÁCH_CỘT_XÁC_ĐỊNH_TRÙNG_LẶP] làm cho template này trở nên linh hoạt và dễ tái sử dụng cho nhiều tình huống khác nhau trong việc quản lý và tiền xử lý dữ liệu bất động sản.

Rate this prompt
Thống kê
1.189 lượt xem
Nội dung Prompt
AI Prompt

AI Prompt

AIPrompt.vn là nền tảng chia sẻ và khám phá prompt AI toàn diện, nơi bạn có thể tìm kiếm, học hỏi và ứng dụng các mẫu prompt chất lượng cao cho nhiều lĩnh vực như sáng tạo nội dung, thiết kế hình ảnh, dựng video, marketing, seeding mạng xã hội, và hơn thế nữa. Website được xây dựng nhằm giúp mọi người – từ người mới bắt đầu đến chuyên gia – có công cụ tối ưu để khai thác sức mạnh AI hiệu quả, nhanh chóng và chuyên nghiệp.

AI News | Bài viết

Follow Us

Recommended

Instagram

    Please install/update and activate JNews Instagram plugin.

Trending

Welcome Back!

Login to your account below

Create New Account!

Fill the forms bellow to register

Retrieve your password

Please enter your username or email address to reset your password.