北京Sklearn
请询价
免费预约试听
限时领取试听名额
课程简介
课程亮点:
十一周sklearn课程,让菜菜带你认识sklearn,带你深入浅出地探索算法的神秘世界。我会为你解读sklearn中的主流算法,带你处理数据,调整参数,完善算法,调用结果。我会为你解析参数,助你理解算法原理,也会带你遍历案例,带你实战给你刷经验。十一周之后,人人都能够三行实现算法,实现少加班,多钻研,在数据行业乘风破浪的目标,为成为优秀的数据挖掘工程师打下坚实的基础~
学习目标:
使用数据科学领域切主流语言python及其建模库sklearn库座位课程核心工具,基于真实数据集和项目案例,集合python工具与机器学习算法完成整个案例实战
课程内容:
第1章: 菜菜的机器学习sklearn课程介绍
第2章: 决策树
2.1分类树
2.2回归树
2.3回归树案例:用回归树拟合正弦曲线
2.4案例:泰坦尼克号生存者预测
第3章: 随机森林
3.1集成算法概述
3.2随机森林分类器 、回归器
3.3案例:用随机森林填补缺失值
3.4机器学习中调参的基本思想
3.5案例:随机森林在乳腺癌数据上的调参
第4章: 数据预处理和特征工程
4.1数据预处理与特征工程
4.2数据预处理:无量纲化:数据归一化、缺失值、处理分类型数据、处理连续型数据
4.3特征选择过滤法:方差过滤 、卡方过滤、F检验和互信息法、嵌入法、包装法
第5章: 主成分分析PCA与奇异值分解SVD
5.1降维算法
5.2参数应用案例:高维数据的可视化
5.3属性应用案例:人脸识别中的components_应用
5.4接口应用案例:用人脸识别看PCA降维后的信息保存量
5.5接口应用案例:用PCA实现手写数字的噪音过滤
5.6总结:原理,流程,重要属性接口和参数
5.**CA实现784个特征的手写数字的降维
第6章: 逻辑回归与评分卡
6.1逻辑回归
6.******rn当中的逻辑回归
6.3二元逻辑回归的损失函数
6.4正则化:重要参数penalty & C
6.5逻辑回归的特征工程
6.6重要参数max_iter - 梯度下降求解逻辑回归的过程
6.7梯度的概念与解惑、步长的概念与解惑
6.8二元回归与多元回归:重要参数solver & multi_class
6.9样本不均衡与参数class_weight
6.1评分卡案例 - 评分卡与完整的模型开发流程
6.11评分卡 - 数据预处理- 重复值与缺失值、异常值
第7章: 聚类算法KMeans
7.1无监督学习概述,聚类vs分类
7.******rn当中的聚类算法
7.3簇内平方和,时间复杂度
7.*****ns - 重要参数n_clusters
7.5聚类算法的模型评估指标
7.6案例:轮廓系数找n_clusters
7.7案例:Kmeans做矢量量化
第8章: 支持向量机 (上)
8.**VM
8.2线性SVC的损失函数
8.3函数间隔与几何间隔
8.4拉格朗日对偶函数
8.5线性SVM可视化
8.6案例:如何选取核函数
8.7案例:在乳腺癌数据集上探索核函数的性质
第9章: 支持向量机 (下)
9.1简单复习支持向量机的基本原理
9.2参数C的深入理解:多个支持向量存在的理由
9.3二分类SVC中的样本不均衡问题:重要参数class_weight
9.**VC的模型评估指标
9.5混淆矩阵与准确率
9.6精确度Precision、召回率Recall与F1 measure
9.7对多数类样本的关怀:特异度Specificity与假正率FPR
9.******rn中的混淆矩阵
9.**OC曲线:Recall与假正率FPR的平衡
9.1案例:预测明天是否会下雨 - 案例背景
9.11案例:导库导数据,探索特征,jupyter中的快捷键
9.12案例:分集,优先处理标签
9.13案例:描述性统计,处理异常值
9.14案例:现实数据上的数据预处理
9.15案例:现实数据集上的数据预处理 - 处理连续型变量
9.16案例:建模与模型评估
9.17案例:模型调参:追求精确度与recall的平衡
第10章: 回归大家族:线性回归,岭回归,Lasso与多项式回归
10.1课时 182 : 线性回归大家族
10.2多元线性回归的基本原理和损失函数
10.3回归类模型的评估指标
10.4多重共线性:含义,数学,以及解决方案
10.5岭回归处理多重共线性
10*****so
10.7线性数据与非线性数据
10.8线性vs非线性模型
10.9离散化:帮助线性回归解决非线性问题
10.1多项式回归
第11章: 朴素贝叶斯
11.1概率论基础 - 贝叶斯理论等式
11.2瓢虫冬眠:理解条件概率
11.3贝叶斯的性质与后验估计
11.4汉堡称重:连续型变量的概率估计
11******rn中的朴素贝叶斯
11.6高斯朴素贝叶斯
11.7多项式朴素贝叶斯
11.8伯努利朴素贝叶斯
11.9补集朴素贝叶斯
11.1案例:贝叶斯做文本分类
第12章: XGBoost
评分
40课程数
319校区数
3
机构简介:数据分析师核心优势 CDA数据分析师系统培训立足于数据分析领域教育事业,覆盖了国内企业招聘数据分析师所要求的技能,进一步提升数据分析师的职业素养与能力水平,促进数据分析行业的高质量持续快速发展。数据分析师机构简介 经管之家于2003年成立与中国人民大学经济学院,致力于推动经济的进步,传播优秀教育资源,目前已经发展成为国内大型的经济、管理、金融、统计类的在线教育和咨询网站,也是国内*活跃和具影响力的经管类网络社区。 经管之家运营团队:北京国富如荷网络科技有限公司,成立于2006年6月,公司以经管之家为运营平台,经营业务包括培训业务、数据处理和分析服务和教辅产品等。经管之家"数据分析培训中心" 自2007年成立以来,致力于开展统计软件、数据分析和数据挖掘的培训与咨询服务,目前已有专家、讲师团队100多位,拥有自主版权的视频课程60多门,每年开设现场培训班100余场,建立了完备的数据分析培训课程体系,每年培训学员3000多人。服务过的企业包括中国电子商务中心、招商银行、中国人民银行、中国邮政储蓄、中国联通、中国汽车技术研究中心、南京梅钢等机构。 发展至今,经管之家"数据分析培训中心"已经成为具有影响力和知名度的数据分析培训机构,我们一直努力做到:将数据分析变成一门常识,让统计软件成为学术研究的好伙伴,企业经营的好军师。数据分析师学校优势 CDA优势如何? 2013年,经管之家创立"CDA数据分析师"品牌,致力于为社会各界数据分析爱好者提供*优质、*科学、*系统的数据分析教育。截止2015年已成功举办40期系统培训,培训学员达3千余名; 中国数据分析师俱乐部(CDA CLUB),已举办30期线下免费沙龙活动,累积会员2千余名;中国数据分析师行业峰会(CDA Summit),一年两次,参会人数达2千余名,在大数据领域影响力超前。"CDA数据分析师"队伍在业界不断壮大,对数据分析人才产业起到了巨大的推动作用。 优势一:师资与课程研发 CDA数据分析师系统培训,由经管之家根据CDA认证标准而设立的一套针对数据分析师技能的全面系统培训。培训师资目前来自学界、实务界相关领域的讲师、教授、专家、工程师以及企业资深分析师,名师荟萃,代表了国内数据分析培训的专业水平,可以更好地保证培训的学员既能学到扎实的数据分析理论知识,又能具备较强的利用软件解决实际问题的能力,保证学员能胜任各行业数据分析师工作的要求。CDA数据分析师培训注重结合实际,把具技术含量、具价值理念的课程传授给学员。课程还注重启发式教学,让学员在动手解决问题中去学习。 CDA数据分析师课程的大纲和内容,既由经管之家、CERTIFIED DATA ANALYST INSTITUTE(CDA协以及大数据、数据挖掘领域专家潜心开发和反复研究,又经过科学的调研确定,并且将不断地随着数据分析的市场需求和数据分析技术的发展而调整,课程内容始终关注市场、关注前沿。课程内容的设计更注重阶梯化、体系化的原则,每一个学员,不论学习和工作的背景如何,都能在该课程体系中很快找到适合自己的课程,并不断学习提高。 优势二:继续学习 所有CDA学员除了学习现场课程之外,还会得到全程视频录像及辅助学习视频课程(包括统计软件、数据挖掘、大数据等内容),此系列视频课程可以进行后期巩固学习和进修学习,可扎实现学技能、拓展课余知识、升华技术层级。CDA数据分析师培训体系除了CDA LEVEL认证培训以外,还推出了CDA就业脱产培训,使跨行、跨专业的学生、待业人员能够进行全面的脱产集训,并在培训后解决学员就业,拿到高薪工作。除此之外,CDA还为有基础的学员提供了更多元化更高级的行业专题培训,包括*前沿的PYTHON、SPARK等工具,电商、金融、游戏等各行业专题,以及量化投资、CRM营销、临床医学等细分领域。 优势三:在线学习 Pe******et(就学教育)为CDA数据分析师在线学习平台。视频可实现随时随地在线听课,10分钟一小节,可进行个性化、碎片化学习,更具针对性与便利性。CDA上课方式分为现场及远程两种方式,远程在线学习引进了*新设备与技术,与思科的合作解决了各地区学员的需求,实现了如同现场般的远程答疑及讨论氛围。 优势四:人才认证 参与CDA培训学员可以参加一年两次的"CDA数据分析师认证考试",并获得专业证书与持证人特权。CDA认证考试目前有"LEVEL 1业务数据分析师","LEVEL 2建模分析师","LEVEL 2大数据分析师",考试由经管之家主办,通过者获得经管之家CDA认证证书,并可到台湾申请由"中华资料采矿协会"颁发的"资料采矿分析师"证书,亦可获得由CDA协会认证的"CERTIFIED DATA ANALYST CERTIFICATION"。 优势五:CDA社群 经管之家有十二个社区,七百个版块,六百万会员。每日讨论的热点话题及资料以千计。学员在学后可以到"CDA数据分析师"版块进行交流、提问、下载资料等,形成数据分析专业聚集地,促进学员在圈子交流中高效发展。 除了在线平台,中国数据分析师俱乐部(CDA CLUB)汇聚了数据分析领域的各界兴趣爱好者,截止2015年已举办30期线下沙龙活动,会员累计2千余名,有高级会员与普通会员。在俱乐部中各会员可以通过共享资源方式获得相应积分,以积分兑换其他优质资源,形成了自发式的交流互动。 中国数据分析师行业峰会、大数据生态纵览峰会(CDA SUMMIT)。一年两次的行业峰会,汇聚了国内*的专家学者,发布前沿思想与技术,参会人员上千名,盛世浩大,影响超前,为数据人才和大数据行业的发展起到了极大的推动作用。发展历程:"2006年 开展数据统计、计量实战,学术研究等相关培训视频和现场班2007年 开展数据统计、数据分析相关培训班2011年 随着大数据热潮的来临,依托累计上万类共享资料,多年沉淀师资团队,论坛召集多位专家,研发CDA数据分析师体系2013年CDA数据分析师品牌成立,提供系统化的大数据、数据分析人才培养和认证2014年 CDA INSTITUTE 成立 ,并推出第一届全国CDA数据分析师认证考试2015年第一届中国数据分析师行业峰会(CDAS)在9月11日成功举办,参会人数逾3000人2016年 CDA汇聚海内外大数据、数据分析专家上千人,推出就业班、数据科学家训练营、企业内训、CDA俱乐部等多个项目2017年整合论坛与CDA数据分析师业内资源,形成数据分析领域生态圈,并进一步升级CDA企业内训体系,正式推出大数据实验室2018年北上广深等多个城市均有校区;拥有200多位专业师资;培养学员超过3万人,每年6月/12月全国28个城市举办CDA认证考试2019年已举办九届数据分析师认证考试,得到业界广泛认可,学员遍布各大知名企业。人工智能产品“好学AI”问世,引领DT时代新一波技术培训浪潮"数据分析师师资力量
更多点击获取距我最近校区
-
上地十街
北京市海淀区上地十街
电话咨询 -
高粱桥斜街59号
北京市海淀区高粱桥斜街59号
电话咨询 -
厂洼街校区
厂洼路丹龙大厦
电话咨询