你的位置:首页 > 数据库

[数据库]导论 coursera by Andrew Ng


机器学习

  1. 赋予计算机在没有明确编程的情况下仍然具有学习的能力。(1959.Arthur Samuel)
  2. 对于某个任务 T 和表现的衡量 P,当计算机程序在该任务 T 的表现上,经过 P 的衡量,随着经验 E 而增长, 我们便称计算机程序能够通过经验 E 来学习该任务。 ( computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.) (1998. Tom Mitchell)

监督学习(supervised learning)


    回归(regression)

 

    分类(classification)

    

非监督学习(unsupervised learning)

聚类(clustering)


tip:
  1. 对于分类,输入的数据(训练数据)是带有标签的(label)和特征的(feature),学习的过程就是从这些标签中找到特征(feature)和label的关系(mapping)。再当有特征而没有标签的数据进入时,可以根据已有关系给他贴标签(label);
  2. 对于非监督式的学习就是训练的数据是没有标签的。聚类的效果远不如分类,因为没有标签,但是生活中大量的标签需要太多的资源;
  3. 半监督学习,训练的数据一部分是有标签的,一部分是没有标签的,而没有标签的部分常常远大于有标签的部分。通过部分标签的局部特征,以及所有包括大量的没标签数据的整体分布,来求得分类结果。