余一隅


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

  • 留言

  • 搜索

好书推荐-《蛤蟆先生去看心理医生》

发表于 2021-10-23 | 分类于 生活 , 创作 , 读后感 |
字数统计: 2.3k 字 | 阅读时长 ≈ 7 分钟
推荐语《蛤蟆先生去看心理医生》的作者罗伯特是一位心理医生,借用《柳林风声》的蛤蟆作为本书的主角,为我们介绍了心理咨询的过程,没看过《柳林风声》的也不影响本书的阅读。 本书的故事情节很简单,蛤蟆先生陷入了抑郁中,在朋友们的建议下他去寻求心理咨询师的帮助,通过一次次的面谈咨询,在咨询师的引导下, ...
阅读全文 »

pandas-dataframe增删改查

发表于 2020-09-13 | 分类于 python , pandas , Dataframe |
字数统计: 702 字 | 阅读时长 ≈ 3 分钟
[toc] dataframe处理一、创建 从文件读取 dict转为dataframe 123df=pd.DataFrame(dict)或者:df=pd.DataFrame.from_dict(dict) 二、增加添加内容 添加列:insert 1234df["newcolumn"]=serie ...
阅读全文 »

神经网络学习笔记

发表于 2020-04-08 | 分类于 技术 , 机器学习 , 算法 |
字数统计: 1.2k 字 | 阅读时长 ≈ 4 分钟
神经网络一、基础概念1、生物神经网络:神经元每个神经元与其他神经元相连,当它“兴奋”时,会向其他神经元发送化学物质(好像叫神经递质),从而改变这些神经元内的电位,如果某个神经元的电位超过了某个“阈值”,就会被激活,即兴奋起来,向其他神经元发送化学物质。 2、人工神经网络M-P神经元模型神经元 ...
阅读全文 »

permutation:特征重要性-学习笔记

发表于 2020-04-07 | 分类于 技术 , 机器学习 , 模型可解释性 |
字数统计: 1.1k 字 | 阅读时长 ≈ 3 分钟
特征重要性:Permutation Importance方法简介一个最基本的问题大概会是什么特征对我模型预测的影响最大呢?我们有很多方法来衡量特征的重要性,这里呢,将会介绍一种方法:排列重要性。 工作原理排列重要性,一定是在model训练完成后,才可以计算的。简单来说,就是改变数据表格中某一列的数据 ...
阅读全文 »

模型常用评价指标-KS

发表于 2020-03-29 | 分类于 技术 , 机器学习 , 模型评价 |
字数统计: 523 字 | 阅读时长 ≈ 2 分钟
KS概述KS值可以衡量模型区分能力的模型,指标部分衡量的是好坏样本累计百分比的最大差值。 具体计算方法介绍 首先计算出每个样本被标记为1的概率predict_score,然后按照从大到小进行排序,其次每个样本有其真实的标签。 计算每个predict_score作为阈值下的fpr-tpr;或者将其分箱 ...
阅读全文 »

RFE与RFECV学习笔记

发表于 2020-03-29 | 分类于 技术 , 机器学习 , 特征选择 |
字数统计: 869 字 | 阅读时长 ≈ 3 分钟
RFE简单介绍 算法思想:wrapper的一种,递归特征删除法是不断训练模型,每次训练完毕删除掉n个重要性低的特征,然后对新的特征再次进行训练,又一次得到特征重要性,再次删除n个重要性低的特征,直到特征数满足自己的设定。 sklearn中的RFE函数调用时,根据基模型的“coef_ 属性 或者 fe ...
阅读全文 »

活着-《此生未完成》读后感

发表于 2020-03-23 | 分类于 生活 , 创作 , 读后感 |
字数统计: 5.1k 字 | 阅读时长 ≈ 17 分钟
   这段时间读了于娟的《此生未完成》,之所以想读这本书是由于作者也由于本书的内容。 于娟是复旦大学的一名大学老师,在工作一年,成为妈妈14个月后检查出来乳腺癌晚期,与癌症抗争2年多后去世。这本书的主要内容包含她在得癌症之后在微博上的抗癌博文、她写给孩子的文章、对小时候的回忆、在 ...
阅读全文 »

pipeline、featureunion、ColumnTransformer区别与结合

发表于 2020-03-14 | 分类于 技术 , 机器学习 , 数据集转换 |
字数统计: 529 字 | 阅读时长 ≈ 2 分钟
区别简单描述 pipeline用于对特征处理、数据转换、回归或分类等多个步骤进行串联,功能是实现多个estimator的串行处理。 featureunion用于对特征的处理,功能是实现多个transformer的并行处理,最终输出它们的结果的并集。每个transformer的输入都是全部的原始特征。 ...
阅读全文 »

ColumnTransformer学习笔记

发表于 2020-03-14 | 分类于 技术 , 机器学习 , 数据集转换 |
字数统计: 319 字 | 阅读时长 ≈ 1 分钟
简单介绍 可以一次性实现对不同的列使用不同的处理方法进行处理。 适合的场景是:不同的特征需要做不同的处理,比如连续变量和标称变量。功能 一次性对不同的列实现不同的处理。代码实例 以下代码主要实现了分别对“Time”列进行了缺失值填充处理,对V1、V2、V3进行了缺失值填充和标准化,其他列不做处理,最 ...
阅读全文 »

Featureunion学习笔记

发表于 2020-03-14 | 分类于 技术 , 机器学习 , 数据集转换 |
字数统计: 784 字 | 阅读时长 ≈ 3 分钟
简单介绍 简单理解:可以把若干转换器组合成一个新的转换器,这个新的转换器组合了它们的输出。大概可以这么理解,pipeline 对各个estimator进行了串行,而featureunion对多个转换器做了并行操作,输出是这些转换器的输出的合集。 具体实现:在训练阶段,每个转换器都在数据集上独立的训练 ...
阅读全文 »
12…5
会吹泡泡的鱼

会吹泡泡的鱼

保险、技术、生活

47 日志
34 分类
46 标签
© 2021 会吹泡泡的鱼 | Site words total count: 47.2k
由 Hexo 强力驱动
|
主题 — NexT.Pisces v5.1.4
总访问量次 | 总访客人 |
访问人数 人 总访问量 次