机器学习

发布时间：2016-09-24 01:00:13

将Mahout on Spark 中的机器学习算法和MLlib中支持的算法统计如下：主要针对MLlib进行总结分类与回归分类和回归是监督式学习;监督式学习是指使用有标签的数据（LabeledPoint）进行训练，得到模型后，使用测试数据预测结果。其中标签数据是指已知结果的特征数据 ...

将Mahout on Spark 中的机器学习算法和MLlib中支持的算法统计如下：

主要针对MLlib进行总结

分类与回归

分类和回归是监督式学习;

监督式学习是指使用有标签的数据（LabeledPoint）进行训练，得到模型后，使用测试数据预测结果。其中标签数据是指已知结果的特征数据。

分类和回归的区别：预测结果的变量类型

　　分类预测出来的变量是离散的（比如对邮件的分类，垃圾邮件和非垃圾邮件），对于二元分类的标签是0和1，对于多元分类标签范围是0~C-1,C表示类别数目；

　　回归预测出来的变量是连续的（比如根据年龄和体重预测身高）

线性回归

　　线性回归是回归中最常用的方法之一，是指用特征的线性组合来预测输出值。

　　线性回归算法可以使用的类有:

　　　　LinearRegressionWithSGD

海外公司注册、海外银行开户、跨境平台代入驻、VAT、EPR等知识和在线办理：https://www.xlkjsw.com

原标题：机器学习

关键词：

*特别声明：以上内容来自于网络收集，著作权属原作者所有，如有侵权，请联系我们： admin#shaoqun.com （#换成@）。