fscchi2
语法
描述
排名(预测)使用特性卡方测试。表idx
= fscchi2 (资源描述
,ResponseVarName
)资源描述
包含预测变量和响应变量,ResponseVarName
响应变量的名称吗资源描述
。函数返回idx
,其中包含预测要求的指标预测的重要性,意义idx (1)
的指数是最重要的预测因子。您可以使用idx
选择的重要预测因子分类问题。
例子
在矩阵秩预测
排名预测在一个数字矩阵和创建一个酒吧图预测重要的分数。
加载示例数据。
负载电离层
电离层
包含预测变量(X
)和一个响应变量(Y
)。
排名预测使用卡方测试。
[idx,分数]= fscchi2 (X, Y);
中的值分数
的负面日志吗p值。如果一个p值小于每股收益(0)
值,那么相应的分数正
。创建一个酒吧阴谋之前,确定分数
包括正
值。
找到(isinf(分数)
ans = 1 x0空两行向量
分数
不包括正
值。如果分数
包括正
值,你可以换正
通过大型数字号码之前创建一个酒吧图可视化的目的。有关详细信息,请参见排名预测表。
创建一个酒吧的情节预测重要性分数。
栏(分数(idx))包含(“预测排名”)ylabel (“预测重要性分数”)
选择五大最重要的预测因子。找到这些预测的列X
。
idx (1:5)
ans =1×55 7 3 8 6
第五列X
是最重要的预测Y
。
排名预测表
排名预测表中并创建一个酒吧图预测重要的分数。
如果你的表和数据fscchi2
行列表中的变量的子集,然后只使用函数索引变量子集。因此,一个良好的实践是将你不想等级的预测表的结束。移动响应变量和观测权向量。然后,输出参数的指标符合表的索引。
加载census1994数据集。
负载census1994
表adultdata
在census1994
包含统计数据来自美国人口普查局预测一个人是否使每年超过50000美元。显示表的前三行。
头(adultdata, 3)
年龄workClass fnlwgt教育education_num marital_status种族职业关系性capital_gain capital_loss hours_per_week native_country工资___ ___________ __________ _____ _________________ _____________ _________________ _________________除了___ _____ _____ _____ _______ _______ * * * 39 State-gov 77516单身汉13未婚Adm-clerical家族的白人男性2174 0 40美国< = 50 k 50 Self-emp-not-inc 83311单身汉13 Married-civ-spouse Exec-managerial丈夫13美国白人男性0 0 < = 50 k 38私人2.1565 e + 05 HS-grad 9离婚Handlers-cleaners家族的白人男性40 0 0美国< = 50 k
表中adultdata
,第三列fnlwgt
样品的重量,最后一列吗工资
是响应变量。移动fnlwgt
左边的工资
通过使用movevars
函数。
adultdata = movevars (adultdata,“fnlwgt”,“之前”,“工资”);头(adultdata, 3)
种族性别年龄workClass教育education_num marital_status职业关系capital_gain capital_loss hours_per_week native_country fnlwgt工资___ ___________ _____ _________________ _____________ _________________ _________________ _____ _____ _______,_______ __________ ______是_____________ * * * 39 State-gov单身汉13未婚Adm-clerical家族的白人男性2174 0 77516美国< = 50 k 50 Self-emp-not-inc单身汉13 Married-civ-spouse Exec-managerial丈夫白人男性0 0 83311年美国13日< = 50 k 38私人HS-grad 9离婚Handlers-cleaners家族的白人男性40 0 0美国2.1565 e + 05 < = 50 k
等级的预测adultdata
。指定的列工资
作为响应变量,并指定列fnlwgt
观察权重。
[idx,分数]= fscchi2 (adultdata,“工资”,“重量”,“fnlwgt”);
中的值分数
的负面日志吗p值。如果一个p值小于每股收益(0)
值,那么相应的分数正
。创建一个酒吧阴谋之前,确定分数
包括正
值。
idxInf =找到(isinf(分数))
idxInf =1×81 3 4 5 6 7 10 12
分数
包括八个正
值。
创建一个酒吧图预测重要的分数。使用预测的名称x设在标记标签。
图酒吧(分数(idx))包含(“预测排名”)ylabel (“预测重要性分数”)xticklabels (strrep (adultdata.Properties.VariableNames (idx),“_”,“\ _”)xtickangle (45)
的酒吧
函数不绘制任何酒吧正
值。为正
相同的价值观,情节酒吧,作为最大的长度有限的分数。
持有在酒吧(分数(idx(长度(idxInf) + 1) *(长度(idxInf), 1))传说(“有限的分数”,“正分数”)举行从
条形图显示有限的分数和正分数使用不同的颜色。
输入参数
资源描述
- - - - - -样本数据
表
样本数据,指定为一个表。多列变量和细胞数组以外的细胞阵列的特征向量是不允许的。
每一行的资源描述
对应于一个观察,每一列对应一个预测变量。可选地,资源描述
响应变量可以包含额外的列和观察权重。
响应变量可以是一个直言,字符,或字符串数组,逻辑或数值向量,或单元阵列的特征向量。如果响应变量是一个字符数组,每个元素的响应变量必须对应一行的数组。
如果
资源描述
包含响应变量,你想使用所有剩余的变量资源描述
作为预测因子,然后通过使用指定的响应变量ResponseVarName
。如果资源描述
还包含观察权重,那么您可以指定使用的重量权重
。如果
资源描述
包含响应变量,和你想使用剩余的变量的一个子集资源描述
作为预测因子,然后由使用指定变量的子集公式
。如果
资源描述
不包含响应变量,然后指定一个响应变量通过使用Y
。响应变量和资源描述
必须有相同数量的行。
如果fscchi2
使用变量的子集资源描述
预测,那么函数索引预测仅使用子集。中的值“CategoricalPredictors”
名称-值对参数和输出参数idx
不计数函数的预测没有排名。
fscchi2
认为南
,”
(空字符向量),”“
(空字符串),<失踪>
,<定义>
值资源描述
一个反应变量缺失值。fscchi2
不使用观测与失踪的响应变量的值。
数据类型:表
ResponseVarName
- - - - - -响应变量名
特征向量包含变量名称或字符串标量资源描述
公式
- - - - - -说明模型的响应变量和预测变量的子集
特征向量|字符串标量
响应变量的解释模型和预测变量的一个子集,指定为一个特征向量或字符串标量形式“Y ~ x1 + x2 + x3”
。在这种形式,Y
代表的响应变量,x1
,x2
,x3
代表了预测变量。
指定变量的子集资源描述
为预测因子,使用一个公式。如果您指定一个公式fscchi2
没有等级变量吗资源描述
不出现在公式
。
公式中的变量名必须两变量名资源描述
(Tbl.Properties.VariableNames
MATLAB)和有效®标识符。您可以验证变量名资源描述
通过使用isvarname
函数。如果变量名是无效的,那么您可以将其转换使用matlab.lang.makeValidName
函数。
数据类型:字符
|字符串
Y
- - - - - -反应变量
数值向量|分类向量|逻辑向量|字符数组|字符串数组|单元阵列的特征向量
响应变量、指定为一个数字分类,或逻辑向量,字符或字符串数组或单元阵列的特征向量。每一行的Y
代表的标签对应的行X
。
fscchi2
认为南
,”
(空字符向量),”“
(空字符串),<失踪>
,<定义>
值Y
缺失值。fscchi2
不使用和缺失值的观察吗Y
。
数据类型:单
|双
|分类
|逻辑
|字符
|字符串
|细胞
X
- - - - - -预测数据
数字矩阵
预测数据,指定为一个数字矩阵。每一行的X
对应于一个观察,每一列对应一个预测变量。
数据类型:单
|双
名称-值参数
指定可选的双参数作为Name1 = Value1,…,以=家
,在那里的名字
参数名称和吗价值
相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。
R2021a之前,用逗号来分隔每一个名称和值,并附上的名字
在报价。
例子:“UseMissing”“NumBins”, 20日,真的
集箱的数量是20,并指定使用缺失值的预测排名。
CategoricalPredictors
- - - - - -列表的分类预测
向量的正整数|逻辑向量|字符矩阵|字符串数组|单元阵列的特征向量|“所有”
分类预测列表,该表中指定的值。
价值 | 描述 |
---|---|
向量的正整数 | 向量中的每个条目是一个索引值表明相应的预测分类。索引值介于1和 如果 |
逻辑向量 | 一个 |
字符矩阵 | 矩阵的每一行是一个预测变量的名字。名称必须匹配的名称资源描述 。垫的名字与额外的空格字符矩阵的每一行有相同的长度。 |
字符串数组或单元阵列的特征向量 | 数组中的每个元素是一个预测变量的名字。名称必须匹配的名称资源描述 。 |
“所有” |
所有预测都直言。 |
默认情况下,如果预测数据表(资源描述
),fscchi2
假设变量是直言如果它是一个逻辑向量,无序分类向量,字符数组,字符串数组或单元阵列特征向量。如果预测数据是一个矩阵(X
),fscchi2
假设所有的预测都是连续的。识别任何其他预测分类预测,通过使用指定它们CategoricalPredictors
名称-值参数。
例子:“CategoricalPredictors”、“所有”
例子:CategoricalPredictors = 5 6 8 [1]
数据类型:单
|双
|逻辑
|字符
|字符串
|细胞
一会
- - - - - -类的名字用于排名
分类数组|字符数组|字符串数组|逻辑向量|数值向量|单元阵列的特征向量
类的名称用于排名,指定为逗号分隔组成的“类名”
和分类、字符或字符串数组,一个逻辑或数值向量,或单元阵列的特征向量。一会
必须具有相同的数据类型Y
或响应变量资源描述
。
如果一会
每个元素是一个字符数组,那么必须对应一个数组的行。
使用“类名”
:
指定的顺序
之前
维对应于类订单。选择一个子集类排名。例如,假设所有不同的类名称的集合
Y
是{' a ', ' b ', ' c '}
。从类等级预测使用的观察“一个”
和“c”
只是,指定“类名”,{' a ', ' c '}
。
的默认值“类名”
所有不同的类名称的集合在吗Y
或响应变量资源描述
。默认的“类名”
价值的数学要求如果响应变量顺序。否则,默认值按字母顺序排序。
例子:“类名”,{' b ', ' g '}
数据类型:分类
|字符
|字符串
|逻辑
|单
|双
|细胞
NumBins
- - - - - -装箱的箱子数量连续的预测因子
10(默认)|正整数标量
装箱的箱子数量连续预测,指定为逗号分隔组成的“NumBins”
和一个正整数标量。
例子:“NumBins”, 50岁
数据类型:单
|双
之前
- - - - - -先验概率
“经验”
(默认)|“统一”
|向量的标量值|结构
UseMissing
- - - - - -指标在预测是否使用或丢弃缺失值
假
(默认)|真正的
指标在预测是否使用或丢弃缺失值,指定为逗号分隔组成的“UseMissing”
,要么真正的
使用或假
抛弃缺失值的预测排名。
fscchi2
认为南
,”
(空字符向量),”“
(空字符串),<失踪>
,<定义>
值缺失值。
如果您指定“UseMissing”,真的
,然后fscchi2
使用缺失值排名。分类变量,fscchi2
把缺失的值作为一个额外的类别。连续变量,fscchi2
的地方南
装箱的值在一个单独的本。
如果您指定“UseMissing”,假的
,然后fscchi2
不使用缺失值排名。因为fscchi2
计算重要性分数分别为每个预测,该函数不丢弃整个行值时行部分失踪。为每一个变量,fscchi2
使用所有的值没有失踪。
例子:“UseMissing”,真的
数据类型:逻辑
输出参数
算法
版本历史
介绍了R2020a
Apri esempio
如果dispone di una versione modificata di questo esempio。Desideri aprire questo esempio con le modifiche星期二吗?
第一MATLAB
海脂肪clic苏联合国collegamento切corrisponde questo第一MATLAB:
Esegui il第一inserendolo所以nella隙缝di第一MATLAB。我浏览器web非supportano万博1manbetx comandi MATLAB。
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。