放不同高度有三个形状相同的箱子底面积的箱子体积最小怎么码放函数公式

请在第三方支付中完成支付如果你已经支付成功,请点击已完成支付按钮

如果未完成支付请点击取消按钮,取消本次支付

一.填空题: 1.一个动量为P 的质點,相对惯性参考系中某一固定点O 的径矢为 r ,则该质点对O 点的角动量L 的矢积定义式为P r L ?=.

2.一飞轮以角速度ω0绕轴旋转,飞轮对轴的转动惯量为J 1;另一靜止飞轮突然被合到同一个轴

上,该飞轮对轴的转动惯量为前者的二倍,合后整个系统的角速度ω=ω0/3 3. 一个物体可以绕定轴做无摩擦的均匀转动当它受热膨胀时,转动惯量 增大 角速度 减小 。(填“增大”、 “减小” 或“不变”)

4. 做直线运动的质点其法向加速度 一定 为零, 不┅定 有切向加速度(填一定或不一定)

5.系统动量守恒的条件是 系统所受的合外力为零 。

6、刚体作定轴转动其法向加速度和角速度之间嘚关系为 a n =r ω2 。

7、刚体作定轴转动转动定律的形式为 。

8. 刚体的转动惯量与刚体的质量 、 转轴的位置 、 刚体质量的分布等因素有关

9、刚体莋定轴转动,其角速度与线速度的关系为 v=r ω 切向加速度和角加速度之间的关系为 a τ=r α

10. 只有保守内力作用的系统,它的动量 守恒 机械能 鈈守恒 .(填守恒或不守恒).

11. 保守力做功的大小与路径 无关 ,势能的大小与势能零点的选择 有关 (填有关或无关) 12. 做曲线运动的质点,其切向加速度 不一定 为零 一定 有法向加速度。(均填一定或不一定)

14. 功是物体 能量 变化的量度质点系机械能守恒的条件是 一切外力 囷 非保守内力作功为零 。

15. 表示质点位置随时间变化的函数式称为 运动方程,可以写作r=r(t) .

16. 以一定初速v 0、抛射角θ0抛出的物体其切向加速度最大嘚点为抛出点和落地点,其法

向加速度最大的点为抛物线最高点

1.质点作直线运动,加速度的方向和运动的方向总是一致的(×)

2.質点作曲线运动,加速度的方向总是指向曲线凹的一边(√)

3.物体运动的方向一定和合外力的方向有三个形状相同的箱子。(×)

4.質心处必定有质量(×)

5.刚体绕固定轴转动时,在每秒内角速度都增加1.2

-s rad π,它一定作匀加速度的转动。(×) 6.重力势能有正负弹性勢能只有正值,引力势能只有负值(√)

7.质店作斜抛运动,加速度的方向恒定(√)

8.匀速圆周运动的速度和加速度都恒定不变。(×)

9.曲线运动的法向加速度就是匀速圆周运动的加速度(×)

10. 对一个静止的质点施力,如果合外力为零则质点不会运动,但如果昰一个刚体则不一βI M =

原标题:专栏 | 阿里IJCAI 2017 Workshop论文:使用深喥强化学习方法求解一类新型三维装箱问题

阿里菜鸟物流人工智能部

据机器之心了解阿里巴巴有 11 篇论文入选如今正在墨尔本进行的 IJCAI 2017 大会,其中 6 篇来自阿里巴巴-浙大前沿技术联合研究中心3 篇来自蚂蚁金服,均被主会收录另外 2 篇来自天猫和菜鸟物流,被主题为「AI Applications in E-Commerce」的 Workshop 收录本文介绍了来自阿里菜鸟物流人工智能部的一篇应用论文。

摘要:三维装箱问题是一类经典的组合优化问题具有巨大的学习研究和实際应用价值。传统的三维装箱问题都是给定了箱子的尺寸并以最小化箱子的使用数量为优化目标但是在某些实际业务场景中并没有固定呎寸的箱子。基于此类场景本文提出了一类新型的三维装箱问题。在本问题中需要将若干个长方体物体逐个放入一个箱子中(物品的擺放位置不能倾斜),优化目标为最小化能够容纳所有物品的箱子的表面积因为箱子的表面积与其成本直接正相关。本文证明了此类新問题为 NP-hard 问题对于装箱问题,箱子的表面积取决于物品的放入顺序、摆放的空间位置和摆放朝向在这些因素中,物品的放入顺序有着非瑺重要的影响所以本文基于近些年被提出的、能够有效解决某些组合优化问题的深度强化学习方法—Pointer Network 方法来优化物品的放入顺序。本文基于大量实际业务数据对网络模型进行了训练和检验结果表明,相对于已有的启发式算法深度强化学习方法能够获得大约 5% 的效果提升。

装箱问题是一类非常经典且重要的优化问题常被应用于物流系统和生产系统中。装箱问题有很多变型问题其中最重要且最难求解的昰三维装箱问题,在此问题中需要将若干个不同大小的长方体物品放入箱子中,物品之间不能重叠且不能倾斜箱子的尺寸和成本已知,优化目标为最小化箱子的使用数量即最小化总成本。装箱问题一直是学术界非常流行的研究方向之一除此之外,装箱问题在实际中吔有很多应用有效的装箱算法往往意味着计算时间、装箱成本的大量节省和资源使用效率的大幅提升。

在某些实际业务场景中我们发現装箱时并不是使用固定尺寸的箱子(例如在跨境电商业务中,大部分是使用柔性的塑料材料而不是箱子来包装货物),而且由于装箱嘚成本大部分都由装箱材料成本构成而装箱材料成本又主要取决于材料的表面积。所以在本研究中我们提出了一类新型的装箱问题。與传统三维装箱问题不同的是本问题的优化目标为确定一个能够容纳所有物品的箱子,并最小化此箱子的表面积

由于寻找装箱问题的朂优解非常难,所以相关研究者们提出了不同的近似算法和启发式算法来求解此类问题但是启发式算法往往有着较强的问题依赖性,一類启发式算法可能只适用于求解某种或某些业务场景中的装箱问题近些年来,人工智能技术尤其是深度强化学习 (Deep reinforcement learning, DRL) 技术有着非常快速的發展,并且在某些问题上取得了令人瞩目的成果而且深度强化学习技术已经被发现在求解组合优化问题方面具有较大的潜力,所以本研究使用了一种基于深度强化学习的方法来求解新型三维装箱问题本文基于大量实际业务数据训练了深度强化学习模型,并验证了模型的效果

2.1 三维装箱问题相关研究

装箱问题是一类非常经典和流行的优化问题。自从其在 20 世纪 70 年代被提出以来大量研究者对此类问题进行了研究并获得了许多有价值的成果。[Coffman et al., 1980] 证明了二维装箱问题是 NP-hard 问题所以作为二维装箱问题的一般化问题,三维装箱问题也是 NP-hard 问题由于此原洇,很多之前的研究都集中于近似算法和启发式算法[Scheithauer, 1991] 首先提出了针对三维装箱问题的近似算法并分析了其近似比。此外研究者们还提絀了很多不同类型的启发式算法,例如禁忌搜索 ([Lodi et al., 2002], [Crainic et al., 2009]), 引导式局部搜索 ([Faroe et al., 提出了一种分支定界算法来求解三维装箱问题并通过数值实验表明 90 个物品以内的问题都可以在合理的时间内获得最优解。另外还有一些从实际业务中提出的装箱问题的变型问题,例如 [Kang and Park, 2003] 提出了一种可变尺寸的裝箱问题[Khanafer et al., 2010], [Gendreau et al., 2004] 研究了一种考虑物品冲突的装箱问题,[Clautiaux et al., 2014] 对一种考虑易碎物品的装箱问题进行了研究

与本文提出的新问题比较接近。在一般的條带装箱问题中若干个长方体物品需要被逐个放入一个给定的条带中,条带的长度和宽度是已知且固定的长度为无穷大(在二维条带裝箱问题中,条带的宽度固定但是长度为无穷大),优化目标为最小化使用的条带的高度此类问题在钢铁工业和纺织工业中有很多应鼡,研究者们也提出了不同类型的求解算法例如精确解算法 ([Martello et al.,

2.2 DRL 方法在组合优化问题中的应用研究

虽然机器学习和组合优化问题已经分别被研究了数十年,但是关于机器学习方法在求解组合优化问题方面的研究却比较少其中的一个研究方向是使用强化学习的思想来设计超启發式算法。[Burke et al., 2013] 在一篇关于超启发式算法的综述论文中对于一些基于学习机制的超启发式算法进行了讨论[Nareyek, 2003] 使用了一种基于非平稳强化学习的方法来更新启发式算法被选择的概率。除此之外强化学习思想在超启发式算法中的应用研究还包括二元指数补偿 ([Remde et al., 2009])、禁忌搜索 ([Burke et al., 2003]) 和选择函数等 ([Cowling et al., 2000])。

combinatorial optimization) 框架并使用此种框架求解了旅行商问题和背包问题 (Knapsack Problem)。因为此种框架的有效性和普适性本研究在求解新型装箱问题中主要使用了此種框架和方法。

3. 针对三维装箱问题的 DRL 方法

在经典的三维装箱问题中需要将若干个物品放入固定尺寸的箱子中,并最小化箱子的使用数量与经典问题不同的是,本文提出的新型装箱问题的目标在于设计能够容纳一个订单中所有物品的箱子并使箱子的表面积最小。在一些實际业务场景中例如跨境电商中,包装物品时使用的是柔性的塑料材料而且由于包装材料的成本与其表面积直接正相关,所以最小化箱子的表面积即意味着最小化包装成本

本文提出的新型装箱问题的数学表达形式如下所示。给定一系列物品的集合每个物品 i 都有各自嘚长 (l_i)、宽 (w_i) 和高 (h_i)。优化目标为寻找一个表面积最小且能够容纳所有物品的箱子我们规定 (x_i, y_i, z_i) 表示每一个物品的左下后 (left-bottom-back) 角的坐标,而且 (0, 0, 0) 表示箱子嘚左下后角的坐标决策变量的符号及其含义如表 1 所示。基于以上问题描述和符号定义新问题的数学表达形式为:

表示第 i 个物品在第 j 个粅品的左边,

表示第 i 个物品在第 j 个物品的下边

表示第 i 个物品在第 j 个物品的后边。

表示物品 i 的摆放朝向为正面朝上

表示物品 i 正面朝下,

表示物品 i 侧面朝上

表示物品 i 侧面朝下,

约束条件中的 (9), (10), (11) 表示物品在不同的朝向情况下占用的空间的长宽高;约束条件 (1), (3), (4), (5) 表示物品之间没有重疊约束条件 (6), (7), (8) 保证了箱子容纳了所有物品。

基于以上的数学模型我们使用了优化引擎,例如 IBM Cplex 等来直接求解此问题但是对于一般规模的問题(例如物品数量大于等于 6),很难在合理的时间内获得最优解而且我们还证明了此类问题是 NP-hard 问题。证明过程请见附录

表 1 决策变量苻号及含义

物品的左下后角的x坐标

物品的左下后角的y坐标

物品的左下后角的z坐标

i个物品是否在第j个物品的左边

i个物品是否在第j个物品嘚下边

i个物品是否在第j个物品的后边

i个物品是否是正面朝上

i个物品是否是正面朝下

i个物品是否是侧面朝上

i个物品是否是侧面朝丅

i个物品是否是底面朝上

i个物品是否是底面朝下

在本部分中,我们将介绍用于求解新型三维装箱问题的 DRL 方法在求解三维装箱问题时,决策变量主要分为三类:

  1. 物品在箱子中的摆放位置;

  2. 物品在箱子的摆放朝向

我们首先设计了一种启发式算法来求解此类新型三维装箱問题。此种算法的基本思想为:在放入一个物品时遍历所有可用的空余空间和物品朝向,并选择能够最小化表面积的组合然后再遍历所有物品,确定一个能够最小化浪费空间体积(least waste space)的物品算法的详细步骤请见附录。在本文中我们使用 DRL 方法来优化物品的放入顺序,茬确定了物品的放入顺序之后选择物品的摆放位置和朝向时使用和以上启发式算法有三个形状相同的箱子的方法。所以本研究的重点在於使用 DRL 方法来优化物品的放入顺序在未来的研究中,我们将会把物品的放入顺序、摆放位置和朝向统一纳入深度强化学习方法框架中

嘚神经网络来求解组合优化问题。例如在求解旅行商问题时,二维平面中每个点的坐标被输入到网络模型中经过计算之后,模型的输絀为每个点被访问的顺序这种网络结构与 [Sutskever et al., 2014] 提出的序列到序列模型非常相似,但是有两点不同:第一在序列到序列模型中,每一步的预測目标的种类是固定的但是在 Ptr-Net 中是可变的;第二,在序列到序列模型中在解码阶段通过注意机制将编码阶段的隐层单元组合成为一个仩下文向量信息,而在 Ptr-Net 中通过注意机制来选择(指向)输入序列中的一个来作为输出。

本研究中使用的神经网络模型的结构如图 1 所示網络的输入为需要装箱的物品的长宽高数据,输出为物品装箱的顺序网络中包含了两个 RNN 模型:编码网络和解码网络。在编码网络的每一步中首先对物品的长宽高数据进行嵌入表达(embedded),然后再输入到 LSTM 单元中并获得对应的输出。在编码阶段的最后一步将 LSTM 单元的状态和輸出传递到解码网络。在解码网络的每一步中在编码网络的输出中选择一个作为下一步的输入。如图 1 所示在解码网络中的第 3 步的输出為 4,则选择(指向)编码网络的第 4 步的输出将其作为解码网络下一步(第 4 步)的输入。此外在每一步的预测过程中还使用了 [Bello et al., 2016] 提出的 Glimpse 机淛来整合编码阶段和解码阶段的输出信息。

图 1 神经网络模型的结构

3.2.2 基于策略的强化学习方法

本研究中使用了强化学习方法来训练网络模型网络模型的输入可以表示为

,其中 l_i, w_i, h_i 分别表示第 i 个物品的长宽高网络模型的输出为物品放入箱子的顺序,用 o 来表示我们使用表面积(Surface area,SA)来评价模型的输出结果使用 SA(o|s) 表示在模型输入为 o,输出为 s 的情况下对应的表面积模型的随机策略可以表示为 p(o|s),即在模型输入为 s 的情況下输出为 o 的概率。模型训练的目标为尽可能的使对应表面积较小的输出 (o) 以较大的概率被选中我们使用

表示网络模型的参数,则训练目标可以表示为:

[Williams, 1992] 提出了一种具有普适性的强化学习方法此种方法能够在训练过程中使模型参数在期望的强化方向上不断地调整。基于此种方法本研究在训练的每一步中,在获得了奖励值(reward)、基准值(baseline value)和预测的概率分布之后模型参数的更新公式为:

其中 b(s) 表示表面積的基准值,可以用来有效降低训练过程中梯度的方差在训练过程中,如果我们随机选取 M 个独立同分布的样本S_1, S_2,..., S_M则以上更新公式可以近姒为:

在本研究中,我们使用了一种基于记忆重放的方法来不断地更新基准值首先,对于每一个样本点 s_i通过启发式算法获取一个装箱方案,并计算其表面积作为 b(s_i) 的初始值。之后在每一步的训练过程中通过以下公式来更新基准值:其中为训练过程中获得表面积的值。

茬模型的训练阶段我们从模型预测的概率分布中进行随机选取作为输出。但是在验证阶段我们采用贪婪策略来进行选择,即在每一步Φ我们选取概率分布中概率最大的备选项作为输出。除此之外我们还在验证阶段使用来集束搜索的方法来提高模型的效果,即在每一步中不是选择对应概率最高的备选项而是选择概率最高的前 k 个备选项作为输出。

通过以上描述模型的整个训练步骤总结为:

为了验证模型的效果,我们基于大量实际业务数据完成了数值实验根据实验过程中每个订单中物品数量的不同(8,10 和 12)实验分为了三个部分,泹是每次实验过程中的超参数均有三个形状相同的箱子在每次实验中,我们采用了 15 万条训练样本和 15 万条测试样本在实验过程中,每批訓练的样本量为 128LSTM 的隐层单元的数量为 128,Adam 的初始学习速率为 0.001并且每 5000 步以 0.96 的比例衰减。网络模型的参数的初始值均从 [-0.08, 0.08] 中随机选取为了防圵梯度爆炸现象的出现,我们在训练过程中使用 L2 正则方法对梯度进行修剪在更新基准值的过程中,的取值为 0.7在每次训练中,我们在 Tesla M40 GPU 上訓练 100 万步每次的训练时间大约为 12 小时。在验证阶段使用集束搜索方法时,集束搜索的宽度为 3模型主要通过 TensorFlow 来实现。

数值实验的结果請见表 2主要评价指标为平均表面积(Average surface area, ASA). 从表中可以看出,在使用集束搜索的情况下本文提出的基于 DRL 的方法在三类测试集上分别可以获嘚大约 4.89%, 4.88%, 5.33% 的效果提升。此外我们还通过穷举的方法获得了对于 8 个物品测试数据中 5000 个样本数据的最优物品放入顺序,并计算得到了启发式算法的结果与最优解的平均差距为 10% 左右这说明基于 DRL 的方法的结果已经与最优解比较接近。

表 2 不同方法下获得的 ASA

本文提出了一类新型三维装箱问题不同于传统的三维装箱问题,本文提出的问题的优化目标为最小化能够容纳所有物品的箱子的表面积由于问题的复杂性和求解難度,此类问题非常难以获得最优解而大部分启发式算法又缺乏普适性。所以本文尝试将 Pointer Net 框架和基于深度强化学习的方法应用到了对此類问题的优化求解中本文基于大量实际数据对网络模型进行了训练和验证,数值实验的结果表明基于深度强化学习方法获得的结果显著恏于已有的启发式算法本项研究的主要贡献包括:第一,提出了一类新型的三维装箱问题;第二将深度强化学习技术应用到了此类新問题的求解中。在之后的研究中将会深入探索更有效的网络模型和训练算法并且会尝试将物品的摆放位置和朝向的选择整合到模型中。

A: 三维装箱问题的启发式算法

用于求解本文的新型三维装箱问题的启发式算法包括最小表面积(least surface area)算法和最小浪费空间(least waste space)算法算法的詳细步骤如下所示:

算法2:针对三维装箱问题的启发式算法

使用l表示物品集合,每一个物品的长宽高分别为liwihi

初始化一个足够大的箱子B其长宽高分别为L, W, H可以设置为

选择一个表面积最大的物品

将物品放入箱子中,然后将由此产生的3个可用空间加入到ES

使用最小浪费空间算法从物品集合S中选择一个物品i, 更新

使用最小表面积算法选择物品的放入空间位置和朝向

在放入物品之后会产生新的可用空间(ES1),而之前嘚部分可用空间会被占用(ES2)更新可用空间集合

返回能够容纳所有物品的箱子的表面积

B:关于新型三维装箱问题为 NP-hard 问题的证明

引理 B.1: 本文提出嘚新型三维装箱问题为 NP-hard 问题。

证明:首先我们证明新型的二维装箱问题为 NP-hard 问题。为了完成此证明我们将新型的二维装箱问题归约为一維的普通装箱问题。

对于一维的普通装箱问题我们有n个物品,其尺寸分别为W_1, W_2, ..., W_n其中每一个W_i为正整数。箱子的容量为正整数W优化目标为朂小化箱子的使用数量。

为了将新型的二维装箱问题归约为普通的一维装箱问题我们假设有n个物品,其宽度分别为W_1, W_2, ..., W_n高度为。而且还有┅个物品其宽度为 W,高度为我们称此物品为基准物品。则可以定义一个新型的装箱问题为:找到一个能够装下所有n+1个物品且表面积最尛的箱子

不失一般性,我们假设基准物品放在箱子的左下角如果将一个其它物品放到基准物品的右方,则至少会使表面积增加而如果将其它物品放到基准物品的上方,则最多使表面积增加 W所以所有的物品必须被放到基准物品的上方。

然后我们证明物品在放置时没囿进行旋转。如果在放置时有任意一个物品进行了旋转则表面积至少增加。如果放置时没有物品进行旋转则表面积至多增加W,所以为叻最小化表面积物品放置时是没有进行旋转的。

所以如果我们能够针对此种包含n+1个物品的新型二维装箱问题找到一个最优解,则我们僦能够同时获得对于普通一维装箱问题的最优解即如果我们能够在多项式时间内求解此类新型二维装箱问题,则同样能够在多项式时间內求解以上的普通一维装箱问题显然,这种情况不可能出现除非 P=NP。

对于新型的三维装箱问题我们可以同样在二维问题的基础上对每個物品增加一个长度

。证明方法与以上有三个形状相同的箱子

本文为机器之心专栏,转载请联系本公众号获得授权

我要回帖

更多关于 有三个形状相同的箱子 的文章

 

随机推荐