作者:小啊小二饼(iconfont)

🌑

Spaghetti.ink

Appreciation, Modesty, Persistence


ML-Introduction

什么是机器学习?

Tom Mitchell:”Learn experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.”

针对某一个任务,通过一些过往的经历和表现来提升我们的在该任务上的表现。
(与人类的认知过程相似,这也是为什么我们人类要通过学习历史来改善或者避免一些任务)

E.g. : 下棋
Experience:与其他棋手下棋的经历
Task:下棋的任务
Performance:下棋的表现(下次和其他人下棋输赢的概率)


机器学习的算法:

  • Supervised learning 监督学习
  • Unsupervised learning 无监督学习
  • Reinforcement learning 强化学习
  • Recommender systems 推荐算法

Supervised learning:

有具有标签(正确结果)的训练样本

  • Regression 回归问题
  • Classification 分类问题

Unsupervised learning:

没有标签的样本

  • Clustering 聚类问题
  • Non-clustering 非聚类问题

模型表示

  • $x^{(i)}$ 表示输入的变量,通常叫做特征 $feature$
  • $y^{(i)}$ 表示输出的变量,通常叫做目标 $target$
  • $(x^i,y^i)$ 表示一个训练样本
  • 训练样本的集合 $\{(x^i,y^i);i=1,…,n\}$ 叫做训练集
  • $X$ 表示输入变量的空间而 $Y$ 表示输出变量的空间
  • $hypothesis$ (预测)可以看作一种函数
    其中上标”(i)”表示的是训练集的索引(index)

以监督学习为例

机器学习的目标是要学习得到一个预测函数hypothesis function,通过输入X到该函数获得一个预测结果hypothesis(预测值),使得所有的预测值尽可能的与我们的预期值(label)y相同。

Regression problem 回归问题

我们要得到的预测值是一个连续型的值(continuous)
e.g. 预测一个地区的房价等

Classification problem 分类问题

我们要得到的预测值是一个离散型的值(discrete)
e.g. 预测一个产品是否合格 或者 学生是否会被目标学校录取等

本文由 Frank采用 署名 4.0 国际 (CC BY 4.0)许可

— 2021年4月20日

本文总阅读量

Machine Learning
Next posts ML-Cost Function

本站总访问量