Bin packing | Extious’ Notes

这是一个在计算机科学和运筹学中非常经典和重要的问题。我会从以下几个方面来为你拆解：

核心概念： 什么是装箱问题？

问题的“难”点： 为什么它是一个著名难题？（计算复杂性）

实际应用： 它在现实世界中有什么用？

主要变种： 一维、二维、三维等。

常见求解策略： 如何解决这个问题？（近似算法）

简单示例： 通过一个例子来演示不同算法。

1. 核心概念：什么是装箱问题？

想象一下，你有一堆大小不一的物品，和一堆容量完全相同的箱子。你的目标是：用最少的箱子，把所有物品都装进去。

这就是装箱问题的核心思想。

正式定义：

物品（Items）： 一组 n 个物品，每个物品 i 都有一个尺寸（或重量） w_i。

箱子（Bins）： 数量不限的相同箱子，每个箱子的容量都是 C。

约束条件： 放入任何一个箱子里的所有物品的总尺寸不能超过该箱子的容量 C。

目标（Objective）： 最小化使用的箱子数量 k。

举个例子：

物品尺寸： [4, 8, 1, 4, 2, 1]

箱子容量： C = 10

一个可行的解：

箱子1: [8, 2] (总尺寸10)
箱子2: [4, 4, 1, 1] (总尺寸10)
结果： 使用了 2 个箱子。这是最优解。

另一个可行的解：

箱子1: [4, 1, 1] (总尺寸6)
箱子2: [8] (总尺寸8)
箱子3: [4, 2] (总尺寸6)
结果： 使用了 3 个箱子。这是一个可行但非最优的解。

2. 问题的“难”点：计算复杂性

装箱问题属于 NP困难 (NP-hard) 问题。

这意味着什么？简单来说：

没有已知的“快速”算法： 对于任何规模的输入，我们都无法保证在多项式时间（可以理解为“合理的时间”）内找到绝对最优的解。

组合爆炸： 随着物品数量的增加，可能的装箱组合方式会呈指数级增长。比如，有30个物品，想通过“暴力破解”（Brute Force）尝试所有可能性，其计算量已经超出了当今最强大的计算机的能力范围。

因此，在实际应用中，我们几乎从不追求找到绝对的“数学最优解”，而是寻找一个足够好的“近似解”。

3. 实际应用

装箱问题看似简单，但其模型可以应用于各行各业，解决资源优化问题：

物流运输： 如何将不同体积的货物装入最少的集装箱或卡车中，以节省运输成本。这是最直观的应用。

云计算与数据中心：

虚拟机分配： 如何将需要不同计算资源（CPU、内存）的虚拟机（物品）部署到最少的物理服务器（箱子）上，以提高服务器利用率，节约能源。
任务调度： 将计算任务（物品）分配给处理器（箱子）。

生产制造（切割问题）：

下料问题 (Cutting Stock Problem)： 从标准的钢管、木板或布料卷（箱子）上，切割出客户需要的不同长度或尺寸的部件（物品），目标是最小化原材料的浪费。这本质上也是一种装箱问题。

媒体存储： 将大小不一的视频、音频文件（物品）存入容量固定的DVD或硬盘（箱子）中。

金融投资： 将不同风险和规模的资产（物品）分配到不同的投资组合（箱子）中。

4. 主要变种

装箱问题根据物品的维度可以分为几类：

一维 (1D) 装箱问题： 最经典的版本，物品只有一个维度，如重量或长度。我们上面讨论的都是这个版本。

二维 (2D) 装箱问题： 物品是矩形（有长和宽），箱子也是一个更大的矩形。目标是将所有小矩形放入最少的大矩形中。例如，广告排版、在玻璃板上切割窗户。

三维 (3D) 装箱问题： 物品是长方体（有长宽高），箱子是集装箱。这是现实中物流打包最真实的样子。

其他变种：

在线 (Online) vs. 离线 (Offline)：

离线： 你提前知道所有物品的信息。
在线： 物品一个接一个地到来，你必须在不知道后续物品信息的情况下，立即决定将当前物品放入哪个箱子。在线问题更具挑战性。

可变尺寸箱子 (Variable-sized Bin Packing)： 提供多种不同容量和成本的箱子，目标是最小化总成本。

5. 常见求解策略（启发式/近似算法）

由于找到最优解太难，我们通常使用一些简单、快速的启发式算法 (Heuristics)。这些算法不能保证找到最优解，但通常能给出相当不错的结果。

以下是最常见的几种一维装箱算法：

a. 首次适应算法 (First Fit, FF)

规则： 依次处理每个物品，将其放入第一个能放得下的箱子中。如果没有箱子能放下，就新开一个箱子。

优点： 非常简单，速度快。 缺点： 可能会因为前期不佳的决策导致后面浪费空间。

b. 最佳适应算法 (Best Fit, BF)

规则： 依次处理每个物品，将其放入能放得下它的、并且剩余空间最小的箱子中。这样可以使得箱子被“塞得更满”。如果没有箱子能放下，就新开一个。

优点： 试图填满箱子，避免留下无法利用的小碎片空间。 缺点： 需要遍历所有已打开的箱子来找到“最佳”位置，比FF稍慢。

c. 最差适应算法 (Worst Fit, WF)

规则： 依次处理每个物品，将其放入能放得下它的、并且剩余空间最大的箱子中。如果没有箱子能放下，就新开一个。

优点： 试图保留大的剩余空间，以便后续能装下较大的物品。 缺点： 容易导致所有箱子都半满，浪费大量箱子。通常效果最差。

d. 首次适应递减算法 (First Fit Decreasing, FFD)

规则： 这是FF算法的改进版。

先将所有物品按尺寸从大到小排序。

然后按照这个顺序，使用首次适应 (FF) 算法进行装箱。

优点： 这是最著名且效果最好的简单启发式算法之一。先把大件物品安排好，小件物品就更容易塞进剩余的零碎空间。它给出的解通常非常接近最优解。

e. 最佳适应递减算法 (Best Fit Decreasing, BFD)

规则： BFD是BF算法的改进版，与FFD类似。

先将所有物品按尺寸从大到小排序。

然后按照这个顺序，使用最佳适应 (BF) 算法进行装箱。

优点： 效果和FFD相当，在很多情况下都能给出非常好的解。

6. 简单示例

我们用文章开头的例子来直观对比一下几种算法。

物品（未排序）： [4, 8, 1, 4, 2, 1]

箱子容量： C = 10

使用首次适应 (FF) 算法：

物品 4 -> 开新箱子1: [4]

物品 8 -> 箱子1放不下 -> 开新箱子2: [8]

物品 1 -> 箱子1能放下: [4, 1]

物品 4 -> 箱子1能放下: [4, 1, 4] (总9)

物品 2 -> 箱子1、2都放不下 -> 开新箱子3: [2]

物品 1 -> 箱子1放不下，箱子2能放下: [8, 1]

结果：3个箱子

箱子1: [4, 1, 4] (9/10)

箱子2: [8, 1] (9/10)

箱子3: [2] (2/10)

使用首次适应递减 (FFD) 算法：

先排序： [8, 4, 4, 2, 1, 1]

物品 8 -> 开新箱子1: [8]

物品 4 -> 箱子1放不下 -> 开新箱子2: [4]

物品 4 -> 箱子1放不下，箱子2能放下: [4, 4]

物品 2 -> 箱子1能放下: [8, 2]

物品 1 -> 箱子1放不下，箱子2能放下: [4, 4, 1]

物品 1 -> 箱子1放不下，箱子2能放下: [4, 4, 1, 1]

结果：2个箱子 (找到了最优解！)

箱子1: [8, 2] (10/10)

箱子2: [4, 4, 1, 1] (10/10)

这个例子清晰地展示了，仅仅通过“先排序”这一个简单的步骤，FFD算法就能得到比普通FF算法好得多的结果。

总结

装箱问题是一个典型的组合优化问题，核心在于用有限的资源（箱子）去满足一系列需求（装载物品），并使资源消耗最小化。由于其NP困难的特性，现实中我们广泛使用像FFD这样的高效启发式算法来快速找到高质量的近似解，这在物流、云计算和制造业等领域具有巨大的经济价值。

代码示例

以下是首次适应 (FF) 和首次适应递减 (FFD) 算法的 Python 实现示例：