博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
关于学习machine learning的一些基本知识点
阅读量:7052 次
发布时间:2019-06-28

本文共 1008 字,大约阅读时间需要 3 分钟。

一、使用机器学习方法的几个基本出发点

1、待解决的问题涉及的数据中,存在一些潜在可学习的pattern。

2、待解决的问题通过一般的编程范式不容易处理。

3、有一定量的数据用于机器学习建模。

二、机器学习与人工智能的简要关系

机器学习是可用于实现人工智能的一种方法。

三、统计学与机器学习的简要关系

统计学是实现机器学习的一种工具(方法)。

四、机器学习常用的几种分类方式

1、learning with different output space

  【classification】,【regression】,【structured】

2、learning with different data label

  【supervised】,【unsupervised】,【semi-supervised】,【reinforcement】

3、learning with different protocol

  【batch】,【online】,【active】

4、learning with different input space

  【concret】,【raw】,【abstract】

五、机器学习的部分基础理论

霍夫丁不等式(Hoeffding’s inequality),在概率论中,该不等式给出了随机变量的和与其期望值偏差的概率上限。

使用实例:

 

六、其他

VC 维理论

PAC

七、噪声与差误(Noise and Error)

八、产生overfitting的几种原因

1、数据量太少

2、随机噪声太大

3、确定性的噪声太大

4、模型复杂度过高

 八、Regularization

 

九、Validation(Model selection problem)

 

十、机器学习中涉及的三个原理

1、Occam's Razor(奥卡姆剃刀原理)

选择模型的原则:

 

2、Sampling Bias(抽样偏差)

如果抽样得到的数据分布存在偏差,那么模型学到的知识也是错误的。训练(包括验证集)和测试所用的数据需要尽可能来自同一个数据分布,iid

3、Visual Data Snooping(可视化数据探测)

 

如何减缓在使用机器学习中人为进行"数据探测",而导致模型发生overfitting等问题:

转载于:https://www.cnblogs.com/xieb1994/p/9873749.html

你可能感兴趣的文章
自己实现几个基本函数
查看>>
谨防沦为DLL后门木马及其变种的肉鸡
查看>>
C#构造函数的重载
查看>>
Silverlight4.0教程之轻松操作剪切板
查看>>
GIF, JPEG和PNG
查看>>
线控的原理
查看>>
Android : Must Override a Superclass Method
查看>>
24款最好的jQuery日期时间选择器插件
查看>>
记2016腾讯 TST 校招面试经历,电面、笔试写代码、技术面、hr面,共5轮
查看>>
我是一个线程(转)
查看>>
ORACLE 11G用于有效期
查看>>
linux 环境变量
查看>>
MS access 数据定时导入MS SQL Server
查看>>
php 生成8位数唯一的激活码
查看>>
微信公众平台完整开发教程【转】
查看>>
初学JDBC,最简单示例
查看>>
strftime 日期时间格式化
查看>>
exe4j的使用
查看>>
Java单链表、双端链表、有序链表实现
查看>>
hadoop配置
查看>>