博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
机器学习ML策略
阅读量:4588 次
发布时间:2019-06-09

本文共 946 字,大约阅读时间需要 3 分钟。

1、为什么是ML策略

例如:识别cat分类器的识别率是90%,怎么进一步提高识别率呢?

想法:

(1)收集更多数据

(2)收集更多的多样性训练样本

(3)使用梯度下降训练更长时间

(4)尝试Adam代替梯度下降

(5)尝试更大的网络

(6)尝试更小的网络

(7)尝试dropout

(8)尝试L2正则化

(9)修改网络架构(激励函数,隐含层单元数目)

 

2、正交化

正交化(正交性)是一种系统设计属性,它可以确保修改算法的一个指令或者组成部分将不会对系统的其他组成部分产生或者传播副作用。使得核查算法变得容易,减少测试和开发算法的时间。

 

一个好的机器学习算法按算法流程需要满足(正交化):

(1)在训练集中表现好(接近人类)。如果不好,可换大型网络或者更换优化算法

(2)在验证集中表现好。如果不好,可尝试正则化或者使用大一点规模的训练集

(3)在测试集中表现好。如果不好,可尝试大一点的验证集

(4)在真实世界中表现好。如果不好,测试集不正确或者代价函数有问题

 

3、单一数字评估指标

混淆矩阵:

True Positive(TP):正类预测为正类

True Negtive(TN):负类预测为负类

False Positive(FP):负类预测为正类(误报)

False Negative(FN):正类预测为负类(漏报)

 

 

 

  Positive Negative
True TP TN
False FP FN

 

精确率(precision):针对预测结果而言的,它表示的是预测为正的样本中有多少是对的

                                                               P = TP/(TP+FP)

准确率(accuracy):ACC = (TP+TN)/(TP+TN+FP+FN)

召回率(recall):针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确的

                                                              R = TP/(TP+FN)

F1值:2/F1 = 1/P +1/R      --->       F1 = 2TP/(2TP+FP+FN)

 

在信息检索领域,精确率和召回率又被称为查准率查全率

查准率检索出的相关信息量 / 检索出的信息总量
查全率检索出的相关信息量 / 系统中的相关信息总量

 

 

 

 

 

转载于:https://www.cnblogs.com/crazybird123/p/7496966.html

你可能感兴趣的文章
MySQL sql语句获取当前日期|时间|时间戳
查看>>
微信支付官方SDK V3 .NET版的坑
查看>>
Python(一)list tuple dict set
查看>>
什么是死锁,简述死锁发生的四个必要条件,如何避免与预防死锁
查看>>
hdu4651(广义五边形数 & 分割函数1)
查看>>
python iter,迭代器&dict,字典详解
查看>>
python笔记1
查看>>
C语言:自定义一个查找字串的功能函数,类似于<string.h>中的strstr()
查看>>
数据库联系 创建表格:重点
查看>>
Regist
查看>>
设置磁盘配额(第二版)
查看>>
C++ 获取字符串中的所有汉字
查看>>
js 滚动到指定位置(带step 速度)
查看>>
项目初尝试——α迭代感想
查看>>
dgraph实现基本操作
查看>>
[Arduino] 基于Xbee Pro和网络技术的智能公交系统设计
查看>>
My97DatePicker日历控件配置
查看>>
HDU 3586-Information Disturbing(树形dp)
查看>>
《超越CSS:web设计精髓》的读后感
查看>>
团队项目第一阶段冲刺站立会议09
查看>>