KMeans大数据利用预处理和稀疏化,Matlab实现。它有三个主要特点:
(1)它有很好的代码:在某些情况下,它的准确性和速度是Matlab的K-means的100倍。它还结合了最新的研究,例如使用k - means++进行初始化(注意:Matlab的R2015 K-Means现在也使用k - means++)。代码有很好的文档记录,并且在可能的情况下符合Matlab的K-means函数的约定。
(2)可选地,您可以启用前置条件和样本特性,这是一种新的方法,当数据集非常大和处理速度很慢时,允许高效处理。
(3)对于只有几TB大小的数据集,你可以使用从磁盘读取选项,这样整个矩阵就不会一次加载到RAM中。
安装方便;“setup_kmeans运行。M’,如果需要,它将为您安装mex文件,并设置适当的路径。
引用作为
斯蒂芬·贝克尔(2022年)。Sparsified k - meansGitHub (https://github.com/stephenbeckr/SparsifiedKMeans)。检索.
MATLAB版本兼容性
使用R2013a创建
与任何版本兼容
平台的兼容性
窗户 macOS Linux标签
私人
要查看或报告此GitHub插件中的问题,请访问GitHub库.
要查看或报告此GitHub插件中的问题,请访问GitHub库.