文档帮助中心文档
一个点相对于有界区域的外部惩罚值
p = exteriorPenalty (x, xmin xmax、方法)
例子
p= exteriorPenalty (x,xmin,xmax,方法)使用指定的方法计算非负(外)罚向量p的点x关于被包围的区域xmin和xmax.p有相同的尺寸x.
p= exteriorPenalty (x,xmin,xmax,方法)
p
x
xmin
xmax
方法
全部折叠
这个例子展示了如何使用exteriorPenalty函数计算给定点相对于有界区域的外部惩罚。
exteriorPenalty
计算该点的罚分值0.1在间隔内[-2,2),使用一步方法。
0.1
-2
2
一步
exteriorPenalty (0.1, 2, 2,“步骤”)
ans = 0
计算该点的罚分值4间隔外[-2,2),使用一步方法。
4
exteriorPenalty(4、2、2、“步骤”)
ans = 1
计算该点的罚分值4间隔外[-2,2),使用二次方法。
二次
exteriorPenalty(4、2、2、“二次”)
ans = 4
计算该分的罚分值[-2,0,4]相对于由间隔定义的方框[0,1], [-1,1), (-2,2]沿x、y和z维度,分别使用二次方法。
0
1
-1
外部惩罚([-2 0 4],[0 -1 -2],[1 1 2],“二次”)
ans =3×14 0 4
可视化一个区间的惩罚值
创建一个由1001个等距点组成的向量,分布在-之间5和5.
5
x = 5:0.01:5;
方法计算向量中所有点的惩罚值二次方法。
p = exteriorPenalty (x, 2, 2,“二次”);
绘制点并添加网格、标签和标题。
情节(x, p)网格包含(“位置”);ylabel (“刑罚价值”);标题(“一段时间内的惩罚值”);
计算外部惩罚的点,指定为数值标量、向量或矩阵。
例子:[-0.1, 1.3]
[-0.1, 1.3]
下界的x,指定为数字标量、向量或矩阵。中的所有元素使用相同的最小值x,指定xmin作为一个标量。
例子:-2
上界为x,指定为数字标量、向量或矩阵。中的所有元素使用相同的最大值x,指定xmax作为一个标量。
例子:10 [5]
10 [5]
“步骤”
“二次”
用来计算惩罚的函数,指定为“步骤”或“二次”.您还可以使用字符串来代替字符向量。
例子:“二次”
惩罚值,作为非负元素的向量返回。对于这两种方法中的任何一种,每个元素p我如果对应的是零x我是否在由xmin我和xmax我反之为正。惩罚函数通常用于在违反约束时生成负奖励,例如generateRewardFunction.
p我
x我
xmin我
xmax我
generateRewardFunction
hyperbolicPenalty
barrierPenalty
您有这个示例的修改版本。您想打开这个示例与您的编辑吗?
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。万博1manbetx
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
与当地办事处联系