🌑

💡

Spaghetti.ink

Home Tags About Me Email

Appreciation, Modesty, Persistence

ML-Introduction

什么是机器学习？

Tom Mitchell:”Learn experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.”

针对某一个任务，通过一些过往的经历和表现来提升我们的在该任务上的表现。
（与人类的认知过程相似，这也是为什么我们人类要通过学习历史来改善或者避免一些任务）

E.g. : 下棋
Experience：与其他棋手下棋的经历
Task:下棋的任务
Performance：下棋的表现（下次和其他人下棋输赢的概率）

机器学习的算法：

Supervised learning 监督学习
Unsupervised learning 无监督学习
Reinforcement learning 强化学习
Recommender systems 推荐算法

Supervised learning:

有具有标签（正确结果）的训练样本

Regression 回归问题
Classification 分类问题

Unsupervised learning:

没有标签的样本

Clustering 聚类问题
Non-clustering 非聚类问题

模型表示

$x^{(i)}$ 表示输入的变量，通常叫做特征 $feature$
$y^{(i)}$ 表示输出的变量，通常叫做目标 $target$
$(x^i,y^i)$ 表示一个训练样本
训练样本的集合 $\{(x^i,y^i);i=1,…,n\}$ 叫做训练集
$X$ 表示输入变量的空间而 $Y$ 表示输出变量的空间
$hypothesis$ （预测）可以看作一种函数
其中上标”(i)”表示的是训练集的索引（index）

以监督学习为例

机器学习的目标是要学习得到一个预测函数hypothesis function，通过输入X到该函数获得一个预测结果hypothesis（预测值），使得所有的预测值尽可能的与我们的预期值（label）y相同。

Regression problem 回归问题

我们要得到的预测值是一个连续型的值（continuous）
e.g. 预测一个地区的房价等

Classification problem 分类问题

我们要得到的预测值是一个离散型的值（discrete）
e.g. 预测一个产品是否合格或者学生是否会被目标学校录取等

本文由 Frank采用署名 4.0 国际 (CC BY 4.0)许可

Machine Learning — 2021年4月20日

本文总阅读量次

Machine Learning

Next posts ML-Cost Function

View / Make Comments

Made with ❤ and at Hangzhou.

本站总访问量次