初識Python語言
第一周
主要內容
Python語言概述和環(huán)境安裝丨變量、數(shù)據(jù)類型和進制丨運算符和分支結構丨循環(huán)結構入門丨循環(huán)結構的應用
可解決問題
了解Python,搭建Python開發(fā)環(huán)境,編寫簡單的Python代碼
可掌握的核心能力
Python開發(fā)環(huán)境的安裝(3.6+) | Pycharm的安裝和使用 | Markdown軟件的安裝和使用 |
分支結構的應用場景 | for循環(huán)和while循環(huán)應用場景區(qū)分 | break和continue關鍵字的使用 |
窮舉法(暴力破解法)的應用 |
常用數(shù)據(jù)結構和函數(shù)
第二周
主要內容
字符串丨列表的應用丨元組和集合丨字典類型的應用丨函數(shù)使用入門
可解決問題
掌握Python中常用數(shù)據(jù)類型,實現(xiàn)常用的業(yè)務邏輯
可掌握的核心能力
列表的運算 | 創(chuàng)建列表的生成式(推導式) | 元組的應用場景(打包解包、變量值交換) |
集合類型的特點(無序性、互異性、確定性) | 集合的運算 | 字典中鍵和值的特點 |
字典的索引運算和循環(huán)遍歷 | 函數(shù)的定義和調用 |
函數(shù)和面向對象編程
第三周
主要內容
包和模塊丨函數(shù)的高級用法丨裝飾器和生成器丨面向對象編程基礎丨面向對象編程進階
可解決問題
掌握Python中模塊的使用,導入三方模塊,數(shù)據(jù)作用域,了解Python高級特性,面向過程,面向對象的編程思維
可掌握的核心能力
包和模塊的概念 | Python標準庫中的常用模塊 | 安裝和使用第三方模塊(pip命令詳解) |
Python中的作用域(LEGB、閉包) | Python內置函數(shù)中的高階函數(shù) | 裝飾器函數(shù)的工作原理 |
普通函數(shù)到生成器的轉變 | 面向對象的核心概念(類和對象) | 常用的魔法方法 |
多重繼承和MRO問題 |
Python網(wǎng)絡數(shù)據(jù)采集
第四周
主要內容
爬蟲概述和頁面抓取丨解析頁面的方式丨爬取數(shù)據(jù)的持久化和商業(yè)IP代理丨獲取頁面動態(tài)內容-1丨獲取頁面動態(tài)內容-2
可解決問題
掌握爬蟲技能,主流的數(shù)據(jù)抓取,自動化瀏覽器操作,競品研究。
可掌握的核心能力
爬蟲的作用和分類 | 爬蟲合法性的探討 | 三方庫requests的安裝和使用 |
三方庫beautifulsoup4的安裝和使用 | 通過瀏覽器開發(fā)者工具獲得元素的選擇器 | 使用XPath語法實現(xiàn)頁面解析 |
將爬取到的數(shù)據(jù)寫入CSV文件 | 將爬取到的數(shù)據(jù)寫入Excel文件 | 修改請求頭Cookie信息 |
破解目標網(wǎng)站封禁IP的方法 | Ajax技術和頁面動態(tài)內容 | 抓包工具的介紹和使用 |
通過數(shù)據(jù)接口獲取JSON數(shù)據(jù) | 使用打碼平臺破解文字驗證碼 |
數(shù)據(jù)分析概述和Excel的應用
第五周
主要內容
數(shù)據(jù)分析和數(shù)據(jù)分析師概述丨指標和指標體系建設丨Excel的安裝和快速上手丨Excel中的函數(shù)和公式計算丨Excel透視表和、透視圖和商業(yè)數(shù)據(jù)看板
可解決問題
數(shù)據(jù)分析崗位認知,入門受眾面最廣的數(shù)據(jù)分析工具Excel
可掌握的核心能力
數(shù)據(jù)分析在各行各業(yè)的應用 | 互聯(lián)網(wǎng)產(chǎn)品的定義和商業(yè)模式認知 | 互聯(lián)網(wǎng)產(chǎn)品類型和盈利模式分析 |
互聯(lián)產(chǎn)品的指標分類和常見指標 | 如何為企業(yè)搭建指標體系 | 數(shù)據(jù)采集的埋點設計和規(guī)范 |
Excel中函數(shù)的應用場景和分類 | 透視表的本質和應用場景 | 添加和定制切片器 |
制作商業(yè)數(shù)據(jù)看板 |
關系型數(shù)據(jù)庫和SQL
第六周
主要內容
數(shù)據(jù)庫概述和MySQL的安裝使用丨表關系和SQL的應用丨SQL數(shù)據(jù)查詢詳解丨窗口函數(shù)和JSON類型丨Python程序接入MySQL數(shù)據(jù)庫
可解決問題
掌握數(shù)據(jù)庫的核心內容,掌握SQL的使用,掌握使用SQL進行數(shù)據(jù)分析
可掌握的核心能力
關系型數(shù)據(jù)庫的特點 | 關系型數(shù)據(jù)庫產(chǎn)品介紹 | MySQL圖形化工具Workbench的使用 |
投影、別名和運算 | 數(shù)據(jù)篩選和空值處理(where子句) | 分組和聚合函數(shù)(group?by子句和having子句) |
嵌套查詢(子查詢) | 連接查詢(內連接、左外連接、右外連接) | 使用窗口函數(shù)解決排名和TopN查詢問題 |
使用數(shù)據(jù)庫持久化網(wǎng)絡爬蟲采集的數(shù)據(jù) |
商業(yè)智能(BI)工具
第七周
主要內容
MySQL其他相關知識丨從Excel到Power?BI丨Power?BI中的數(shù)據(jù)清洗和建模丨Power?BI中的數(shù)據(jù)可視化和報表制作丨認識和使用Tableau
可解決問題
掌握主流BI工具PowerBI,Tableau等工具的使用
可掌握的核心能力
從Excel升級到Power?BI的理由 | Power?Query編輯器的使用 | 事實表和維度表 |
DAX函數(shù) | 高階視覺對象的應用 | 數(shù)據(jù)的鉆取 |
Tableau?Desktop功能區(qū)介紹 | 基礎可視化圖表的應用 | 餅圖、折線圖、樹狀圖、堆積柱狀圖、直方圖、散點圖、氣泡圖 |
商業(yè)智能(BI)工具
第八周
主要內容
深入探索Tableau丨Tableau數(shù)據(jù)分析項目實戰(zhàn)丨認識和使用fineBI丨數(shù)據(jù)思維和分析模型-1丨數(shù)據(jù)思維和分析模型-2
可解決問題
掌握主流數(shù)據(jù)分析思維,使用模型對項目進行分析。
可掌握的核心能力
數(shù)據(jù)分箱和數(shù)據(jù)桶 | 相關分析和回歸分析 | LOD表達式的應用場景 |
儀表板的布局和樣式 | RFM模型 | AIPL模型 |
AARRR模型(海盜模型) | RARRA增長模型 | 渠道和運營分析 |
A/B測試的應用閉環(huán) | 產(chǎn)品生命周期和迭代流程 | 用戶生命周期和運營策略 |
數(shù)據(jù)分析報告撰寫原則 | 數(shù)據(jù)分析報告撰寫要素 | 優(yōu)質數(shù)據(jù)分析報告解讀 |
Python數(shù)據(jù)分析
第九周
主要內容
Python數(shù)據(jù)分析工具介紹丨使用NumPy實現(xiàn)批量數(shù)據(jù)處理丨使用Pandas進行數(shù)據(jù)分析-1丨使用Pandas進行數(shù)據(jù)分析-2丨使用Pandas進行數(shù)據(jù)分析-3
可解決問題
掌握使用Python進行數(shù)據(jù)分析,掌握Python數(shù)據(jù)分析三劍客。
可掌握的核心能力
新建和使用Notebook | ndarray對象的索引和切片 | 廣播機制 |
讀取CSV和Excel文件創(chuàng)建DataFrame | DataFrame對象的數(shù)據(jù)篩選 | DataFrame對象的數(shù)據(jù)拼接和合并 |
數(shù)據(jù)清洗的概念 | 數(shù)據(jù)的分箱(離散化) | DataFrame對象的數(shù)據(jù)分組聚合操作 |
生成透視表和交叉表 | 計算協(xié)方差和相關系數(shù) |
Python數(shù)據(jù)分析
第十周
主要內容
使用Matplotlib繪制統(tǒng)計圖表丨Seaborn和Pyecharts的使用丨電商項目相關業(yè)務知識介紹丨項目實操
可解決問題
掌握數(shù)據(jù)可視化的多種庫,結合項目進行可視化,進行數(shù)據(jù)分析
可掌握的核心能力
Matplotlib的配置參數(shù) | 定制坐標系 | 柱狀圖和堆疊柱狀圖 |
餅圖和環(huán)狀餅圖 | 加載Seaborn自帶的數(shù)據(jù)集 | Pyecharts常用圖表舉例 |
電商產(chǎn)品的生命周期 | 電商用戶的生命周期 | 電商產(chǎn)品核心指標和指標體系解析 |
電商產(chǎn)品運營活動概述 | FAST模型和KISS復盤 | 用戶畫像和用戶標簽 |
電商產(chǎn)品用戶購買預測 | 電商產(chǎn)品用戶評論情感預測 |
統(tǒng)計思維和機器學習的數(shù)學基礎
第十一周
主要內容
線性代數(shù)丨微積分丨概率論丨統(tǒng)計學丨信息論
可解決問題
掌握統(tǒng)計思維,為機器學習做準備
可掌握的核心能力
矩陣和行列式 | 特征值和特征向量 | 導數(shù)的概念和意義 |
空間函數(shù)和偏導數(shù) | 貝葉斯定理 | 正態(tài)分布詳解 |
假設檢驗 | 主成分分析 | 聯(lián)合熵和條件熵 |
機器學習算法
第十二周
主要內容
機器學習概述和kNN算法丨回歸算法丨邏輯回歸丨樸素貝葉斯丨決策樹
可解決問題
掌握機器學習的主流算法,掌握分類,回歸,樹模型
可掌握的核心能力
機器學習三大要素:模型、策略、算法 | 模型評估方法概述 | 機器學習中的概念解析 |
一元線性回歸和多元線性回歸 | 線性回歸算法原理 | 回歸模型評價標準MSE、R^2、RMSE、MAE等 |
Sigmoid函數(shù) | 似然函數(shù)、極大似然估計 | 決策樹算法概述及學習過程 |
特征依據(jù):香濃熵、信息增益、GINI系數(shù) | 隨機森林集成算法 |
機器學習算法
第十三周
主要內容
支持向量機丨聚類算法和輪廓系數(shù)丨集成算法丨特征工程和評價指標丨機器學習項目實戰(zhàn)
可解決問題
掌握集成學習的主流算法,掌握非監(jiān)督學習,掌握模型評估及優(yōu)化策略。
可掌握的核心能力
SVM算法數(shù)學推導過程 | 最大幾何間隔、拉格朗日乘子法、對偶性質 | KMeans聚類算法原理及應用 |
DBSCAN聚類算法原理及應用 | Bagging思想、Boosting思想、Stacking思想 | 特征工程 |
建模流程規(guī)范 | 數(shù)據(jù)量綱處理:歸一化、標準化、缺失值處理 | WOE、IV值意義及特征轉換 |
特征重要性評估 |
數(shù)據(jù)倉庫和大數(shù)據(jù)挖掘
第十四周
主要內容
數(shù)據(jù)倉庫、數(shù)據(jù)湖和Hadoop生態(tài)圈丨ETL工具丨數(shù)據(jù)倉庫丨Hive丨數(shù)倉搭建和數(shù)據(jù)分析項目
可解決問題
了解大數(shù)據(jù)生態(tài),使用大數(shù)據(jù)工具進行數(shù)據(jù)分析,數(shù)據(jù)挖掘。
可掌握的核心能力
Hadoop生態(tài)圈概述 | 數(shù)據(jù)的預處理 | 數(shù)據(jù)倉庫建模 |
Hive的數(shù)據(jù)定義語言 | Hive的數(shù)據(jù)操作語言 | Hive的數(shù)據(jù)查詢語言 |
Hive數(shù)據(jù)抽樣(隨機抽樣、塊抽樣、分桶抽樣) | 用戶行為分析和購買預測 |
就業(yè)指導和模擬面試
第十五周
主要內容
就業(yè)期的技術和心理準備丨如何制作一份優(yōu)質的簡歷丨面試流程和注意事項丨一對一模擬模式丨一對一模擬面試
可解決問題
就業(yè)沖刺,掌握面試技巧,如何表達出自己的能力
可掌握的核心能力
數(shù)據(jù)分析師的硬實力和軟技能 | 數(shù)據(jù)挖掘工程師簡歷要點 | STAR法則的應用 |
高頻面試題回答技巧 | 面試后的總結和復盤 | 簡歷文字問題剖析 |