Tham lam

Trang này sẽ giới thiệu ngắn gọn về thuật toán tham lam (greedy algorithm).

Dẫn nhập

Thuật toán tham lam (tiếng Anh: greedy algorithm) là cách mô phỏng quá trình ra quyết định của một "người tham lam" trên máy tính. Người này luôn chọn phương án tốt nhất theo một tiêu chí nào đó ở mỗi bước, chỉ nhìn vào lợi ích trước mắt mà không quan tâm đến ảnh hưởng về sau.

Dễ thấy, không phải lúc nào tham lam cũng cho đáp án tối ưu, nên khi dùng cần đảm bảo có thể chứng minh được tính đúng đắn của thuật toán.

Giải thích

Phạm vi áp dụng

Thuật toán tham lam đặc biệt hiệu quả với các bài toán có tính chất tối ưu con (optimal substructure). Nghĩa là bài toán có thể chia nhỏ thành các bài toán con, và đáp án tối ưu của bài toán con có thể xây dựng thành đáp án tối ưu của bài toán gốc.¹

Chứng minh

Có hai cách chứng minh đúng đắn cho thuật toán tham lam: phản chứng và quy nạp. Thông thường, một bài chỉ cần một trong hai cách.

Phản chứng: Nếu hoán đổi hai phần tử bất kỳ (hoặc hai phần tử kề nhau) mà đáp án không tốt hơn, thì có thể kết luận phương án hiện tại là tối ưu.
Quy nạp: Tìm đáp án tối ưu cho trường hợp biên (ví dụ \(n=1\)), sau đó chứng minh với mọi \(n\), đáp án tối ưu \(F_{n+1}\) có thể xây dựng từ \(F_n\).

Các điểm cần lưu ý

Các dạng bài thường gặp

Với các bài dưới mức khó nâng cao, hai dạng tham lam phổ biến nhất là:

"Sắp xếp XXX theo một thứ tự nào đó, rồi chọn theo thứ tự (ví dụ từ nhỏ đến lớn)."
"Mỗi lần lấy phần tử lớn nhất/nhỏ nhất trong XXX, rồi cập nhật XXX." (đôi khi có thể tối ưu bằng cách dùng hàng đợi ưu tiên)

Khác biệt là một dạng là offline (xử lý trước rồi chọn), một dạng là online (xử lý và chọn đồng thời).

Dạng sắp xếp

Thường gặp khi đầu vào là mảng có một hoặc hai trọng số, giải bằng cách sắp xếp rồi duyệt mô phỏng để tìm giá trị tối ưu.

Dạng "hối hận"

Ý tưởng là luôn nhận mọi lựa chọn, sau đó so sánh: nếu lựa chọn hiện tại không còn tối ưu thì "hối hận", loại bỏ nó; nếu vẫn tối ưu thì giữ lại. Lặp lại quá trình này.

Phân biệt

So với quy hoạch động

Khác biệt giữa tham lam và quy hoạch động là: tham lam chọn phương án tốt nhất cho từng bài toán con mà không quay lại; quy hoạch động lưu lại kết quả các bài toán con và có thể quay lại để chọn phương án tốt hơn.

Phân tích ví dụ

Ví dụ về phương pháp hoán đổi cặp kề

NOIP 2012 Trò chơi của nhà vua

Nhân dịp quốc khánh nước H, nhà vua mời \(n\) đại thần chơi một trò chơi. Mỗi đại thần ghi một số lên tay trái và tay phải, nhà vua cũng ghi hai số lên hai tay. Sau đó, \(n\) đại thần xếp thành hàng, nhà vua đứng đầu hàng. Mỗi đại thần nhận được số vàng bằng tích các số trên tay trái của tất cả người đứng trước chia cho số trên tay phải của mình, làm tròn xuống.

Nhà vua muốn tối thiểu hóa số vàng lớn nhất mà một đại thần nhận được, hãy giúp ông sắp xếp lại thứ tự các đại thần (nhà vua luôn đứng đầu).

Hướng dẫn giải

Gọi số trên tay trái/phải của đại thần thứ \(i\) sau khi sắp xếp là \(a_i, b_i\). Dùng phương pháp hoán đổi cặp kề để tìm chiến lược tham lam.

Gọi \(s\) là tích các \(a_i\) của những người đứng trước đại thần \(i\), khi đó đại thần \(i\) nhận được \(\dfrac{s}{b_i}\) vàng, đại thần \(i+1\) nhận được \(\dfrac{s \cdot a_i}{b_{i+1}}\).

Nếu đổi chỗ \(i\) và \(i+1\), đại thần \(i\) nhận \(\dfrac{s}{b_{i+1}}\), đại thần \(i+1\) nhận \(\dfrac{s \cdot a_{i+1}}{b_i}\).

Đổi chỗ là tốt hơn khi

\[ \max \left(\dfrac{s} {b_i}, \dfrac{s \cdot a_i} {b_{i+1}}\right) < \max \left(\dfrac{s} {b_{i+1}}, \dfrac{s \cdot a_{i+1}} {b_i}\right) \]

Rút gọn \(s\):

\[ \max \left(\dfrac{1} {b_i}, \dfrac{a_i} {b_{i+1}}\right) < \max \left(\dfrac{1} {b_{i+1}}, \dfrac{a_{i+1}} {b_i}\right) \]

Đưa về dạng nguyên:

\[ \max (b_{i+1}, a_i\cdot b_i) < \max (b_i, a_{i+1}\cdot b_{i+1}) \]

Khi cài đặt, lưu hai số vào struct và nạp chồng toán tử:

struct uv {
  int a, b;

  bool operator<(const uv &x) const {
    return max(x.b, a * b) < max(b, x.a * x.b);
  }
};

Ví dụ về phương pháp "hối hận"

「USACO09OPEN」Lập lịch công việc Work Scheduling

John có \(10^9\) đơn vị thời gian, mỗi thời điểm có thể chọn một trong \(N\) công việc (\(1 \leq N \leq 10^5\)). Công việc \(i\) có hạn chót \(D_i(1 \leq D_i \leq 10^9)\), hoàn thành được \(P_i( 1\leq P_i\leq 10^9 )\) tiền. Hỏi John có thể kiếm tối đa bao nhiêu tiền.

Hướng dẫn giải

Giả sử làm tất cả công việc, sắp xếp các công việc theo hạn chót rồi đưa vào hàng đợi;
Khi xét công việc thứ i, nếu hạn chót hợp lệ thì so với phần tử nhỏ nhất trong hàng đợi, nếu công việc hiện tại có lợi hơn thì "hối hận", thay thế phần tử nhỏ nhất. Dùng hàng đợi ưu tiên (heap nhỏ) để duy trì phần tử nhỏ nhất.
Nếu a[i].d<=q.size(), hiểu là trong \([0, a[i].d]\) chỉ làm được \(a[i].d\) việc, nếu đã có \(q.size()>=a[i].d\) thì phải thay thế nếu có việc tốt hơn.

Code tham khảo

C++Python

#include <algorithm>
#include <cmath>
#include <cstring>
#include <iostream>
#include <queue>
using namespace std;

struct f {
  long long d;
  long long p;
} a[100005];

bool cmp(f A, f B) { return A.d < B.d; }

// 小根堆维护最小值
priority_queue<long long, vector<long long>, greater<long long>> q;

int main() {
  long long n, i;
  cin >> n;
  for (i = 1; i <= n; i++) {
    cin >> a[i].d >> a[i].p;
  }
  sort(a + 1, a + n + 1, cmp);
  long long ans = 0;
  for (i = 1; i <= n; i++) {
    if (a[i].d <= (int)q.size()) {  // 超过截止时间
      if (q.top() < a[i].p) {       // 后悔
        ans += a[i].p - q.top();
        q.pop();
        q.push(a[i].p);
      }
    } else {  // 直接加入队列
      ans += a[i].p;
      q.push(a[i].p);
    }
  }
  cout << ans << endl;
  return 0;
}

from collections import defaultdict
from heapq import heappush, heappop

a = defaultdict(list)
for _ in range(int(input())):
    d, p = map(int, input().split())
    a[d].append(p)  # 存放对应时间的收益

ans = 0  # 记录总收益
q = []  # 小根堆维护最小值
l = sorted(a.keys(), reverse=True)
for i, j in zip(l, l[1:] + [0]):
    for k in a.pop(i):
        heappush(q, ~k)
    for _ in range(i - j):
        if q:  # 从堆中取出收益最多的工作
            ans += ~heappop(q)
        else:  # 堆为空时退出循环
            break
print(ans)

Phân tích độ phức tạp

Bộ nhớ: dùng mảng \(a\) và heap tối đa \(n\) phần tử, \(O(n)\).
Thời gian: std::sort \(O(n\log n)\), duy trì heap \(O(n\log n)\), tổng \(O(n\log n)\).

Bài tập

Tài liệu tham khảo & chú thích

Thuật toán tham lam - Wikipedia tiếng Trung ↩

Last updated on this page:, Update history
Found an error? Want to help improve? Edit this page on GitHub!
Contributors to this page:OI-wiki
All content on this page is provided under the terms of the CC BY-SA 4.0 and SATA license, additional terms may apply