主要内容

hyperbolicPenalty

双曲惩罚值对一个有界区域

自从R2021b

    描述

    例子

    p= hyperbolicPenalty (x,xmin,xmax)计算了非负(夸张)点球向量p的点x对该地区有界xminxmaxp一样的尺寸吗x。这个语法使用的默认值10.1λτ分别双曲函数的参数。

    例子

    p= hyperbolicPenalty (___,λ,τ)指定的λτ双曲函数的参数。如果λ是一个空矩阵使用其默认值。同样,如果τ是一个空矩阵或省略,默认值代替。

    例子

    全部折叠

    这个例子展示了如何使用hyperbolicPenalty函数计算双曲处罚对于一个给定的点对一个有界区域。

    计算的惩罚值点0.1在区间[2,2),使用默认值λτ参数。

    hyperbolicPenalty (0.1, 2, 2)
    ans = 0.0050

    计算的惩罚值点4在区间[2,2]。

    hyperbolicPenalty (4、2、2)
    ans = 4.0033

    计算的惩罚值点0.1在区间[2,2),用λ参数的5

    hyperbolicPenalty (0.1, 2, 2, 5)
    ans = 0.0010

    计算的惩罚值点4在区间[2,2),用λ参数的5

    hyperbolicPenalty (4、2、2、5)
    ans = 20.0007

    计算的惩罚值点4在区间[2,2),用τ参数的0.5

    hyperbolicPenalty (4、2、2、5、0.5)
    ans = 20.0167

    计算的惩罚值点(2,0,4]关于框定义的间隔(0,1]、[1,1),(2,2沿着x, y, z的维度,分别使用的默认值λ和一个τ参数的0

    hyperbolicPenalty ([2 0 4], [0 1 2], [1 1 2], 1, 0)
    ans =3×14 0 4

    可视化惩罚一个区间的值

    1001年创建一个向量-之间的等距点分布55

    x = 5:0.01:5;

    计算惩罚所有的点的向量,使用默认值λτ参数。

    p = hyperbolicPenalty (x, 2, 2);

    情节点和添加网格,标签和标题。

    情节(x, p)网格包含(“位置”);ylabel (“刑罚价值”);标题(“惩罚值在一个间隔”);

    图包含一个坐标轴对象。坐标轴对象与标题惩罚值在一个时间间隔,包含点位置,ylabel惩罚值包含一个对象类型的线。

    输入参数

    全部折叠

    计算点的惩罚,指定为一个数字标量、向量或矩阵。

    例子:(0.5;1.6)

    下界的x,指定为一个数字标量、向量或矩阵。使用相同的所有元素的最小值x指定xmin作为一个标量。

    例子:1

    上界为x,指定为一个数字标量、向量或矩阵。使用相同的所有元素的最大值x指定xmax作为一个标量。

    例子:2

    λ双曲函数的参数,指定为一个标量。

    例子:3

    τ双曲函数的参数,指定为一个标量。

    例子:0.3

    输出参数

    全部折叠

    惩罚值,作为非负元素的向量返回。每个元素p取决于的位置x指定的时间间隔xminxmax。双曲罚函数返回值:

    p ( x ) = λ ( x x 最小值 ) + λ 2 ( x x 最小值 ) 2 + τ 2 λ ( x 马克斯 x ) + λ 2 ( x 马克斯 x ) 2 + τ 2

    在这里,λ的论点是λ,τ的论点是τ。请注意,对于积极的价值观τ返回的刑罚的价值总是正的,因为等式的右边第二项的大小总是大于第一,和第四项的大小总是大于第三。如果τ为零,那么返回的点球是零定义的区间范围内,线性增长x在这个区间。如果x是多维的,那么每个维度上的独立计算应用。惩罚函数通常用于生成负奖励约束违反时,如在generateRewardFunction

    扩展功能

    C / c++代码生成
    生成C和c++代码使用MATLAB®编码器™。

    版本历史

    介绍了R2021b