北京Python机器学习算法工程师
请询价
免费预约试听
限时领取试听名额
课程简介
课程亮点:
科学的内容设置
七年数据科学教学积淀,内容体系全面,讲解深入浅出从基础内容到前沿知识、从理论基础到工具实践,算法全体系知识一站式解决!
前沿的教学模式
案例驱动式教学,告别枯燥乏味的学习体验,海量实战项目你的学习效率!CDA AI实验室在线编程环境和免费算力使用。算法竞赛项目结业,高能力可以被验证!
专业的讲师助教
高校专家、名企大咖合力精研课程体系,精英讲师、助教全力保障授课服务课程导学、行业解析、视频授课、一对一督学,四大团队全程伴你成长。
完善的就业服务
百家合作企业内部推荐,完善就业辅导体系提供全方位指导行业红利+合作企业+就业服务,三重保障助你新职业扬帆起航!
学习目标:
内容服务全面升级、转行就业一步到位,回归教育本质,真正让学员为学习结果买单
课程内容:
第1阶段
预备知识:数据科学的数据库基础
了解数据库在行业应用中的价值及其在数据分析中的地位,掌握数据库中数据存储、数据查询、数据处理技术,了解与工业场景中Python 操作数据库的逻辑和方法,并攻克BAT数据库重点笔试题。
第1章:数据的存储、读取及简单处理
(一)导学直播:数据库应用价值及其在数据分析中的地位
(二)操作数据库--数据的存储
(三)查询数据库中的数据--查询语句
(四)数据库高级操作--函数
(五)工业场景下数据库数据的提取与处理形式:Python连接数据库
(六)专题直播:BAT数据库面试题精讲
(七)阶段作业
第二阶段
数据分析工具熟练运用养成计划
了解Python在数据科学、人工智能领域的地位,3倍速高效掌握Python编程、Python数据处理与可视化核心技术,并理解可视化技术实现结果输出与内容美化的数据表达逻辑。
第二章:3倍速学习Python核心编程技术
(一)导学直播:Python数据分析工具的市场竞争力分析
(二)Python编程的破冰之旅
(三)掌握Python序列对象:字符串、列表、元组、字典
(四)建立python控制流语句知识模型:条件判断和循环的艺术
(五)实现Python的模块化程序设计:函数
(六)面向对象编程与类
(八)专题直播:使用Git和Github进行版本控制
(九)阶段作业
第三章:数据分析入门:使用Numpy+Matplotlib分析数据
(一)导学直播:巧用Python强大的第三方库功能,大幅度提升编程任务效率
(二)共享单车每季度平均骑行时间对比
(三)动手创建一个批量温度转换器
(四)共享单车各类用户的平均骑行时间趋势对比
(五)气温数据的描述性统计分析:大值、小值、平均值
(六)共享单车的用户类别分析:比例
(七)气温数据的可视化分析
(八)共享单车用类别分析的统计图形绘制
(九)功能强大的Numpy的高级操作
(十)阶段作业
第四章:Pandas从数据分析到可视化
(一)导学直播:数据表达逻辑--结果输出与内容美化
(二)比较咖啡店各类饮品的数量与热量
(三)PM*.5的数值展示及不同来源数值差异对比展示
(四)分析电子游戏在各国的营收情况并用堆叠图展示
(五)房屋价格影响因素探索与房价趋势的可视化展示
(六)神奇宝贝数据的变量关系探索与分析
(七)不同手机操作系统的流量使用情况分析
(八)统计不同专业的员工平均薪资
(九)股票行情分析及价格趋势的可视化展示
(十)幸福指数的等级分析
(十一)专题直播:python实现excel办公自动化
(十二)阶段作业
第三阶段
数据价值的挖掘及预测技术实战
掌握机器学习、深度学习的数学基础、机器学习理论及实现、深度学习理论及实现;掌握机器学习、深度学习在推荐系统、金融、量化等领域的工业应用实践及模型部署上线
第五章:数据价值挖掘及预测的数学基础知识
(一)导学直播:数学基础在机器学习中的重要性与必要性讲解
(二)构建机器学习的线性代数知识模型
(三)掌握机器学习算法原理推导中的微积知识
(四)掌握机器学习算法必知必会的统计学知识
(五)专题直播:Python实现统计分析的方法--statsmodel的介绍及使用
(六)阶段作业
第六章:掌握数据价值挖掘及预测的监督学习算法基础
(一)导学直播:机器学习入门与算法总览
(二)根据像素值对CIFAR10图像数据进行KNN算法分类
(三)动手实现基于决策树的收入分类与可视化
(四)使用线性回归模型实现Ames房价预测
(五)使用逻辑回归构建信用卡反欺诈预测模型
(六)使用朴素贝叶斯构建垃圾邮件分类器
(七)使用支持向量机对金融支付服务的欺诈行为进行预测
(八)通过boosting提升传统算法在海外电商企业用户细分项目中的效果
(九)使用XGBoost提升树对人类发展指数官方数据集进行回归预测
(十)监督学习综合应用实战:基于超参数优化的Gradient Boosting的销售预测
(十一)专题直播:机器学习的人才需求及技术应用现状分析
(十二)阶段作业
第七章:掌握数据价值挖掘及预测的无监督学习算法基础
(一)导学直播:实际工作中我们应该如何根据场景选择适合的机器学习算法模型
(二)使用KMeans进行旅游企业客户分群
(三)使用PCA进行基因序列异常检测实现癌症诊断
(四)基于潜在狄利克雷分配(LDA)的内容主题挖掘
(五)使用Apriori进行322万知乎用户的关注话题关联分析
(十二)阶段作业
第八章:使用深度学习完成你的第1个AI项目--人脸识别
(一)导学直播:深度学习的行业应用价值及技术发展趋势
(二)单层感知器与多层感知器在反欺诈预测上的表现对比
(三)使用神经网络进行手写数字图片识别
(四)快速上手构建一个人脸识别系统
(五)专题直播:深度学习主流框架介绍
(六)阶段作业
第九章 工业项目实战保障机器学习技术的落地实践
(一)导学直播:工业场景下的机器学习模型应用与模型部署
(二)推荐系统案例精讲
(三)金融风控案例精讲
(四)时间序列案例精讲
(五)算法模型的部署--在人工智能实验室 中部署我们的反欺诈预测模型
(六)专题直播:机器学习工程师职业成长路径
(七)阶段作业
第四阶段
分布式机器学习的工具基础与工业项目实战
看了解大数据工具运用的工业应用价值、大数据生态系统的重要组件、大数据架构搭建方法;掌握海量数据的存储与处理技术;了解Spark大数据处理工具及相关组件;了解分布式机器学习的工业应用价值,掌握Spark MLlib分布式机器学习实现的逻辑及其在金融、计算广告、推荐系统、量化投资等领域的应用。
第十章:海量数据存储和处理技术:Linux环境下Sp****.x+Python开发环境的
(一)导学直播:海量数据处理的市场需求分析及工具介绍
(二)导入本地虚拟机至virtualbox及启动系统和远程桌面连接
(二)大数据环境快速搭建:Hadoop伪分布式集群的搭建
(三)大数据环境快速搭建:Linux系统下安装PySpark模块并远程启动Anaconda
(四)使用结构化海量数据处理框架Spark SQL、Spark DataFrame进行航空数据分析
(五)专题直播:Spark DataFrame与Python DataFrame异同
(六)阶段作业
第十一章:千万级别数据的机器学习问题:机器学习的分布式计算实现
(一)分布式机器学习的工业价值及技术发展趋势介绍
(二)PySpark机器学习:Spark Mllib实现算法模型构建
(三)构建分类模型预测StumbleUpon给用户个性化推荐的网页是否长期受欢迎
(四)构建回归模型实现共享单车需求量预测
(五)分布式环境下的Avazu广告数据集性别标签预测
(六)基于Avazu广告数据的广告排名及CTR预估
(七)分布式环境下的Audioscrobbler音乐推荐系统开发
(八)基于分布式机器学习的实现个人贷款违约预测
(九)基于分布式机器学习的银行零售产品的交叉营销
(十)基于分布式XGBoost的量化投资项目实战--股票价格的预测
(十一)专题直播:运用Spark ML Pipeline组建简易文本分类案例需求分析
(十二)阶段作业
作业
第五阶段
结业项目竞赛
学员将组队参加DC平台、阿里天池竞赛,提交项目代码到平台,根据项目得分及排名情况进行优秀学员评选
第十二章:项目竞赛及竞赛案例详解
第六阶段
就业阶段
本阶段将为学员提供专业的简历指导和就业推荐服务,为学员的就业保驾护航。学员入职后持续提供为期1年的入职护航服务,入职不满意重新推荐
课程内容:
第1阶段
预备知识:数据科学的数据库基础
了解数据库在行业应用中的价值及其在数据分析中的地位,掌握数据库中数据存储、数据查询、数据处理技术,了解与工业场景中Python 操作数据库的逻辑和方法,并攻克BAT数据库重点笔试题。
第1章:数据的存储、读取及简单处理
(一)导学直播:数据库应用价值及其在数据分析中的地位
(二)操作数据库--数据的存储
(三)查询数据库中的数据--查询语句
(四)数据库高级操作--函数
(五)工业场景下数据库数据的提取与处理形式:Python连接数据库
(六)专题直播:BAT数据库面试题精讲
(七)阶段作业
第二阶段
数据分析工具熟练运用养成计划
了解Python在数据科学、人工智能领域的地位,3倍速高效掌握Python编程、Python数据处理与可视化核心技术,并理解可视化技术实现结果输出与内容美化的数据表达逻辑。
第二章:3倍速学习Python核心编程技术
(一)导学直播:Python数据分析工具的市场竞争力分析
(二)Python编程的破冰之旅
(三)掌握Python序列对象:字符串、列表、元组、字典
(四)建立python控制流语句知识模型:条件判断和循环的艺术
(五)实现Python的模块化程序设计:函数
(六)面向对象编程与类
(八)专题直播:使用Git和Github进行版本控制
(九)阶段作业
第三章:数据分析入门:使用Numpy+Matplotlib分析数据
(一)导学直播:巧用Python强大的第三方库功能,大幅度提升编程任务效率
(二)共享单车每季度平均骑行时间对比
(三)动手创建一个批量温度转换器
(四)共享单车各类用户的平均骑行时间趋势对比
(五)气温数据的描述性统计分析:大值、小值、平均值
(六)共享单车的用户类别分析:比例
(七)气温数据的可视化分析
(八)共享单车用类别分析的统计图形绘制
(九)功能强大的Numpy的高级操作
(十)阶段作业
第四章:Pandas从数据分析到可视化
(一)导学直播:数据表达逻辑--结果输出与内容美化
(二)比较咖啡店各类饮品的数量与热量
(三)PM*.5的数值展示及不同来源数值差异对比展示
(四)分析电子游戏在各国的营收情况并用堆叠图展示
(五)房屋价格影响因素探索与房价趋势的可视化展示
(六)神奇宝贝数据的变量关系探索与分析
(七)不同手机操作系统的流量使用情况分析
(八)统计不同专业的员工平均薪资
(九)股票行情分析及价格趋势的可视化展示
(十)幸福指数的等级分析
(十一)专题直播:python实现excel办公自动化
(十二)阶段作业
第三阶段
数据价值的挖掘及预测技术实战
掌握机器学习、深度学习的数学基础、机器学习理论及实现、深度学习理论及实现;掌握机器学习、深度学习在推荐系统、金融、量化等领域的工业应用实践及模型部署上线
第五章:数据价值挖掘及预测的数学基础知识
(一)导学直播:数学基础在机器学习中的重要性与必要性讲解
(二)构建机器学习的线性代数知识模型
(三)掌握机器学习算法原理推导中的微积知识
(四)掌握机器学习算法必知必会的统计学知识
(五)专题直播:Python实现统计分析的方法--statsmodel的介绍及使用
(六)阶段作业
第六章:掌握数据价值挖掘及预测的监督学习算法基础
(一)导学直播:机器学习入门与算法总览
(二)根据像素值对CIFAR10图像数据进行KNN算法分类
(三)动手实现基于决策树的收入分类与可视化
(四)使用线性回归模型实现Ames房价预测
(五)使用逻辑回归构建信用卡反欺诈预测模型
(六)使用朴素贝叶斯构建垃圾邮件分类器
(七)使用支持向量机对金融支付服务的欺诈行为进行预测
(八)通过boosting提升传统算法在海外电商企业用户细分项目中的效果
(九)使用XGBoost提升树对人类发展指数官方数据集进行回归预测
(十)监督学习综合应用实战:基于超参数优化的Gradient Boosting的销售预测
(十一)专题直播:机器学习的人才需求及技术应用现状分析
(十二)阶段作业
第七章:掌握数据价值挖掘及预测的无监督学习算法基础
(一)导学直播:实际工作中我们应该如何根据场景选择适合的机器学习算法模型
(二)使用KMeans进行旅游企业客户分群
(三)使用PCA进行基因序列异常检测实现癌症诊断
(四)基于潜在狄利克雷分配(LDA)的内容主题挖掘
(五)使用Apriori进行322万知乎用户的关注话题关联分析
(十二)阶段作业
第八章:使用深度学习完成你的第1个AI项目--人脸识别
(一)导学直播:深度学习的行业应用价值及技术发展趋势
(二)单层感知器与多层感知器在反欺诈预测上的表现对比
(三)使用神经网络进行手写数字图片识别
(四)快速上手构建一个人脸识别系统
(五)专题直播:深度学习主流框架介绍
(六)阶段作业
第九章 工业项目实战保障机器学习技术的落地实践
(一)导学直播:工业场景下的机器学习模型应用与模型部署
(二)推荐系统案例精讲
(三)金融风控案例精讲
(四)时间序列案例精讲
(五)算法模型的部署--在人工智能实验室 中部署我们的反欺诈预测模型
(六)专题直播:机器学习工程师职业成长路径
(七)阶段作业
第四阶段
分布式机器学习的工具基础与工业项目实战
看了解大数据工具运用的工业应用价值、大数据生态系统的重要组件、大数据架构搭建方法;掌握海量数据的存储与处理技术;了解Spark大数据处理工具及相关组件;了解分布式机器学习的工业应用价值,掌握Spark MLlib分布式机器学习实现的逻辑及其在金融、计算广告、推荐系统、量化投资等领域的应用。
第十章:海量数据存储和处理技术:Linux环境下Sp****.x+Python开发环境的
(一)导学直播:海量数据处理的市场需求分析及工具介绍
(二)导入本地虚拟机至virtualbox及启动系统和远程桌面连接
(二)大数据环境快速搭建:Hadoop伪分布式集群的搭建
(三)大数据环境快速搭建:Linux系统下安装PySpark模块并远程启动Anaconda
(四)使用结构化海量数据处理框架Spark SQL、Spark DataFrame进行航空数据分析
(五)专题直播:Spark DataFrame与Python DataFrame异同
(六)阶段作业
第十一章:千万级别数据的机器学习问题:机器学习的分布式计算实现
(一)分布式机器学习的工业价值及技术发展趋势介绍
(二)PySpark机器学习:Spark Mllib实现算法模型构建
(三)构建分类模型预测StumbleUpon给用户个性化推荐的网页是否长期受欢迎
(四)构建回归模型实现共享单车需求量预测
(五)分布式环境下的Avazu广告数据集性别标签预测
(六)基于Avazu广告数据的广告排名及CTR预估
(七)分布式环境下的Audioscrobbler音乐推荐系统开发
(八)基于分布式机器学习的实现个人贷款违约预测
(九)基于分布式机器学习的银行零售产品的交叉营销
(十)基于分布式XGBoost的量化投资项目实战--股票价格的预测
(十一)专题直播:运用Spark ML Pipeline组建简易文本分类案例需求分析
(十二)阶段作业
作业
第五阶段
结业项目竞赛
学员将组队参加DC平台、阿里天池竞赛,提交项目代码到平台,根据项目得分及排名情况进行优秀学员评选
第十二章:项目竞赛及竞赛案例详解
第六阶段
就业阶段
本阶段将为学员提供专业的简历指导和就业推荐服务,为学员的就业保驾护航。学员入职后持续提供为期1年的入职护航服务,入职不满意重新推荐
评分
40课程数
319校区数
3
机构简介:数据分析师核心优势 CDA数据分析师系统培训立足于数据分析领域教育事业,覆盖了国内企业招聘数据分析师所要求的技能,进一步提升数据分析师的职业素养与能力水平,促进数据分析行业的高质量持续快速发展。数据分析师机构简介 经管之家于2003年成立与中国人民大学经济学院,致力于推动经济的进步,传播优秀教育资源,目前已经发展成为国内大型的经济、管理、金融、统计类的在线教育和咨询网站,也是国内*活跃和具影响力的经管类网络社区。 经管之家运营团队:北京国富如荷网络科技有限公司,成立于2006年6月,公司以经管之家为运营平台,经营业务包括培训业务、数据处理和分析服务和教辅产品等。经管之家"数据分析培训中心" 自2007年成立以来,致力于开展统计软件、数据分析和数据挖掘的培训与咨询服务,目前已有专家、讲师团队100多位,拥有自主版权的视频课程60多门,每年开设现场培训班100余场,建立了完备的数据分析培训课程体系,每年培训学员3000多人。服务过的企业包括中国电子商务中心、招商银行、中国人民银行、中国邮政储蓄、中国联通、中国汽车技术研究中心、南京梅钢等机构。 发展至今,经管之家"数据分析培训中心"已经成为具有影响力和知名度的数据分析培训机构,我们一直努力做到:将数据分析变成一门常识,让统计软件成为学术研究的好伙伴,企业经营的好军师。数据分析师学校优势 CDA优势如何? 2013年,经管之家创立"CDA数据分析师"品牌,致力于为社会各界数据分析爱好者提供*优质、*科学、*系统的数据分析教育。截止2015年已成功举办40期系统培训,培训学员达3千余名; 中国数据分析师俱乐部(CDA CLUB),已举办30期线下免费沙龙活动,累积会员2千余名;中国数据分析师行业峰会(CDA Summit),一年两次,参会人数达2千余名,在大数据领域影响力超前。"CDA数据分析师"队伍在业界不断壮大,对数据分析人才产业起到了巨大的推动作用。 优势一:师资与课程研发 CDA数据分析师系统培训,由经管之家根据CDA认证标准而设立的一套针对数据分析师技能的全面系统培训。培训师资目前来自学界、实务界相关领域的讲师、教授、专家、工程师以及企业资深分析师,名师荟萃,代表了国内数据分析培训的专业水平,可以更好地保证培训的学员既能学到扎实的数据分析理论知识,又能具备较强的利用软件解决实际问题的能力,保证学员能胜任各行业数据分析师工作的要求。CDA数据分析师培训注重结合实际,把具技术含量、具价值理念的课程传授给学员。课程还注重启发式教学,让学员在动手解决问题中去学习。 CDA数据分析师课程的大纲和内容,既由经管之家、CERTIFIED DATA ANALYST INSTITUTE(CDA协以及大数据、数据挖掘领域专家潜心开发和反复研究,又经过科学的调研确定,并且将不断地随着数据分析的市场需求和数据分析技术的发展而调整,课程内容始终关注市场、关注前沿。课程内容的设计更注重阶梯化、体系化的原则,每一个学员,不论学习和工作的背景如何,都能在该课程体系中很快找到适合自己的课程,并不断学习提高。 优势二:继续学习 所有CDA学员除了学习现场课程之外,还会得到全程视频录像及辅助学习视频课程(包括统计软件、数据挖掘、大数据等内容),此系列视频课程可以进行后期巩固学习和进修学习,可扎实现学技能、拓展课余知识、升华技术层级。CDA数据分析师培训体系除了CDA LEVEL认证培训以外,还推出了CDA就业脱产培训,使跨行、跨专业的学生、待业人员能够进行全面的脱产集训,并在培训后解决学员就业,拿到高薪工作。除此之外,CDA还为有基础的学员提供了更多元化更高级的行业专题培训,包括*前沿的PYTHON、SPARK等工具,电商、金融、游戏等各行业专题,以及量化投资、CRM营销、临床医学等细分领域。 优势三:在线学习 Pe******et(就学教育)为CDA数据分析师在线学习平台。视频可实现随时随地在线听课,10分钟一小节,可进行个性化、碎片化学习,更具针对性与便利性。CDA上课方式分为现场及远程两种方式,远程在线学习引进了*新设备与技术,与思科的合作解决了各地区学员的需求,实现了如同现场般的远程答疑及讨论氛围。 优势四:人才认证 参与CDA培训学员可以参加一年两次的"CDA数据分析师认证考试",并获得专业证书与持证人特权。CDA认证考试目前有"LEVEL 1业务数据分析师","LEVEL 2建模分析师","LEVEL 2大数据分析师",考试由经管之家主办,通过者获得经管之家CDA认证证书,并可到台湾申请由"中华资料采矿协会"颁发的"资料采矿分析师"证书,亦可获得由CDA协会认证的"CERTIFIED DATA ANALYST CERTIFICATION"。 优势五:CDA社群 经管之家有十二个社区,七百个版块,六百万会员。每日讨论的热点话题及资料以千计。学员在学后可以到"CDA数据分析师"版块进行交流、提问、下载资料等,形成数据分析专业聚集地,促进学员在圈子交流中高效发展。 除了在线平台,中国数据分析师俱乐部(CDA CLUB)汇聚了数据分析领域的各界兴趣爱好者,截止2015年已举办30期线下沙龙活动,会员累计2千余名,有高级会员与普通会员。在俱乐部中各会员可以通过共享资源方式获得相应积分,以积分兑换其他优质资源,形成了自发式的交流互动。 中国数据分析师行业峰会、大数据生态纵览峰会(CDA SUMMIT)。一年两次的行业峰会,汇聚了国内*的专家学者,发布前沿思想与技术,参会人员上千名,盛世浩大,影响超前,为数据人才和大数据行业的发展起到了极大的推动作用。发展历程:"2006年 开展数据统计、计量实战,学术研究等相关培训视频和现场班2007年 开展数据统计、数据分析相关培训班2011年 随着大数据热潮的来临,依托累计上万类共享资料,多年沉淀师资团队,论坛召集多位专家,研发CDA数据分析师体系2013年CDA数据分析师品牌成立,提供系统化的大数据、数据分析人才培养和认证2014年 CDA INSTITUTE 成立 ,并推出第一届全国CDA数据分析师认证考试2015年第一届中国数据分析师行业峰会(CDAS)在9月11日成功举办,参会人数逾3000人2016年 CDA汇聚海内外大数据、数据分析专家上千人,推出就业班、数据科学家训练营、企业内训、CDA俱乐部等多个项目2017年整合论坛与CDA数据分析师业内资源,形成数据分析领域生态圈,并进一步升级CDA企业内训体系,正式推出大数据实验室2018年北上广深等多个城市均有校区;拥有200多位专业师资;培养学员超过3万人,每年6月/12月全国28个城市举办CDA认证考试2019年已举办九届数据分析师认证考试,得到业界广泛认可,学员遍布各大知名企业。人工智能产品“好学AI”问世,引领DT时代新一波技术培训浪潮"数据分析师师资力量
更多点击获取距我最近校区
-
上地十街
北京市海淀区上地十街
电话咨询 -
高粱桥斜街59号
北京市海淀区高粱桥斜街59号
电话咨询 -
厂洼街校区
厂洼路丹龙大厦
电话咨询