利用Python進行數據分析(原書第2版)
作者: (美)韋斯·麥金尼(Wes McKinney)
ISBN號: 9787111603702
版次: 1-1
出版日期:
頁數: 476
字數: 500
出版社: 機械工業出版社
內容簡介
閱讀本書可以獲得關於在Python下操作、處理、清洗、規整數據集的完整說明。本書第2版針對Python3.6進行了更新,並增加了實際案例向你展示如何高效地解決一系列數據分析問題。你將在閱讀過程中學習到新版本的pandas、NumPy、IPython和Jupyter。
目錄
目錄
前言1
第1章 準備工作7
1.1 本書內容7
1.1.1 什麼類型的數據7
1.2 為何利用Python進行數據分析8
1.2.1 Python作為膠水8
1.2.2 解決“雙語言”難題8
1.2.3 為何不使用Python9
1.3 重要的Python庫9
1.3.1 NumPy9
1.3.2 pandas10
1.3.3 matplotlib11
1.3.4 IPython與Jupyter11
1.3.5 SciPy12
1.3.6 scikit-learn12
1.3.7 statsmodels13
1.4 安裝與設置13
1.4.1 Windows14
1.4.2 Apple(OS X和macOS)14
1.4.3 GNU/Linux14
1.4.4 安裝及更新Python包15
1.4.5 Python 2和Python 316
1.4.6 集成開發環境和文本編輯器16
1.5 社區和會議17
1.6 快速瀏覽本書17
1.6.1 代碼示例18
1.6.2 示例數據18
1.6.3導入約定18
1.6.4術語19
第2章 Python語言基礎、IPython及Jupyter notebook20
2.1 Python解釋器21
2.2 IPython基礎22
2.2.1 運行IPython命令行22
2.2.2 運行 Jupyter notebook23
2.2.3 Tab補全25
2.2.4 內省27
2.2.5 %run命令28
2.2.6 執行剪貼板中的程序30
2.2.7 終端快捷鍵30
2.2.8 關於魔術命令31
2.2.9 matplotlib集成33
2.3 Python語言基礎34
2.3.1 語言語義34
2.3.2 標量類型42
2.3.3 控制流49
第3章 內建數據結構、函數及文件54
3.1 數據結構和序列54
3.1.1 元組54
3.1.2 列表57
3.1.3 內建序列函數61
3.1.4 字典64
3.1.5集合67
3.1.6 列表、集合和字典的推導式69
3.2 函數72
3.2.1 命名空間、作用域和本地函數72
3.2.2 返回多個值73
3.2.3 函數是對象74
3.2.4 匿名(Lambda)函數75
3.2.5 柯里化:部分參數應用76
3.2.6 生成器77
3.2.7 錯誤和異常處理79
3.3 文件與操作系統82
3.3.1 字節與Unicode文件85
3.4 本章小結86
第4章 NumPy基礎:數組與向量化計算87
4.1 NumPy ndarray:多維數組對象89
4.1.1 生成ndarray90
4.1.2 ndarray的數據類型92
4.1.3 NumPy數組算術94
4.1.4 基礎索引與切片95
4.1.5 布爾索引100
4.1.6 神奇索引103
4.1.7 數組轉置和換軸104
4.2 通用函數:快速的逐元素數組函數106
4.3 使用數組進行面向數組編程109
4.3.1 將條件邏輯作為數組操作110
4.3.2 數學和統計方法111
4.3.3 布爾值數組的方法113
4.3.4 排序114
4.3.5 唯一值與其他集合邏輯115
4.4 使用數組進行文件輸入和輸出115
4.5 線性代數116
4.6 偽隨機數生成118
4.7 示例:隨機漫步120
4.7.1 一次性模擬多次隨機漫步121
4.8 本章小結122
第5章 pandas入門123
5.1 pandas數據結構介紹123
5.1.1 Series123
5.1.2 DataFrame128
5.1.3 索引對象134
5.2 基本功能135
5.2.1 重建索引136
5.2.2 軸向上刪除條目138
5.2.3 索引、選擇與過濾140
5.2.4 整數索引144
5.2.5 算術和數據對齊145
5.2.6 函數應用和映射150
5.2.7 排序和排名152
5.2.8 含有重複標籤的軸索引155
5.3 描述性統計的概述與計算157
5.3.1 相關性和協方差159
5.3.2 唯一值、計數和成員屬性161
5.4 本章小結164
第6章 數據載入、存儲及文件格式165
6.1 文本格式數據的讀寫165
6.1.1 分塊讀入文本文件171
6.1.2 將數據寫入文本格式172
6.1.3 使用分隔格式174
6.1.4 JSON數據176
6.1.5 XML和HTML:網絡抓取177
6.2 二進制格式180
6.2.1 使用HDF5格式181
6.2.2 讀取Microsoft Excel文件183
6.3 與Web API交互184
6.4 與數據庫交互186
6.5 本章小結187
第7章 數據清洗與準備188
7.1 處理缺失值188
7.1.1 過濾缺失值189
7.1.2 補全缺失值191
7.2 數據轉換194
7.2.1 刪除重複值194
7.2.2 使用函數或映射進行數據轉換195
7.2.3 替代值197
7.2.4 重命名軸索引198
7.2.5 離散化和分箱199
7.2.6 檢測和過濾異常值202
7.2.7 置換和隨機抽樣203
7.2.8 計算指標/虛擬變量204
7.3 字符串操作207
7.3.1 字符串對象方法208
7.3.2 正則表達式210
7.3.3 pandas中的向量化字符串函數213
7.4 本章小結215
第8章 數據規整:連接、聯合與重塑216
8.1 分層索引216
8.1.1重排序和層級排序219
8.1.2 按層級進行匯總統計220
8.1.3 使用DataFrame的列進行索引220
8.2 聯合與合併數據集221
8.2.1 數據庫風格的DataFrame連接222
8.2.2 根據索引合併226
8.2.3 沿軸向連接230
8.2.4 聯合重疊數據235
8.3 重塑和透視236
8.3.1 使用多層索引進行重塑236
8.3.2 將“長”透視為“寬”240
8.3.3 將“寬”透視為“長”242
8.4 本章小結244
第9章 繪圖與可視化245
9.1 簡明matplotlib API入門245
9.1.1 圖片與子圖246
9.1.2 顏色、標記和線類型250
9.1.3 刻度、標籤和圖例252
9.1.4 註釋與子圖加工255
9.1.5 將圖片保存到文件258
9.1.6 matplotlib設置258
9.2 使用pandas和seaborn繪圖259
9.2.1 折線圖259
9.2.2 柱狀圖262
9.2.3 直方圖和密度圖266
9.2.4 散點圖或點圖269
9.2.5 分面網格和分類數據270
9.3 其他Python可視化工具271
9.4 本章小結272
第10章 數據聚合與分組操作274
10.1 GroupBy機制274
10.1.1 遍歷各分組278
10.1.2 選擇一列或所有列的子集279
10.1.3 使用字典和Series分組280
10.1.4 使用函數分組281
10.1.5 根據索引層級分組282
10.2 數據聚合282
10.2.1 逐列及多函數應用284
10.2.2 返回不含行索引的聚合數據287
10.3 應用:通用拆分-應用-聯合288
10.3.1 壓縮分組鍵290
10.3.2 分位數與桶分析291
10.3.3 示例:使用指定分組值填充缺失值292
10.3.4 示例:隨機採樣與排列294
10.3.5 示例:分組加權平均和相關性296
10.3.6 示例:逐組線性回歸298
10.4 數據透視表與交叉表298
10.4.1 交叉表:crosstab301
10.5 本章小結302
第11章 時間序列303
11.1 日期和時間數據的類型及工具303
11.1.1 字符串與datetime互相轉換305
11.2 時間序列基礎307
11.2.1 索引、選擇、子集308
11.2.2 含有重複索引的時間序列311
11.3 日期範圍、頻率和移位312
11.3.1 生成日期範圍313
11.3.2 頻率和日期偏置316
11.3.3 移位(前向和後向)日期317
11.4 時區處理320
11.4.1 時區的本地化和轉換320
11.4.2 時區感知時間戳對象的操作323
11.4.3 不同時區間的操作324
11.5 時間區間和區間算術324
11.5.1 區間頻率轉換326
11.5.2 季度區間頻率327
11.5.3 將時
Python金融大數據分析 第2版
作 者:(德)伊夫·希爾皮斯科(Yves Hilpisch) 著 姚軍 譯
出 版 社:人民郵電出版社
出版日期:2020年04月01日
頁 數:648
裝 幀:平裝
ISBN:9787115521330
內容簡介
《Python金融大數據分析 第2版》分為5部分,共21章。部分介紹了Python在金融學中的應用,其內容涵蓋了Python用於金融行業的原因、Python的基礎架構和工具,以及Python在計量金融學中的一些具體入門實例;第2部分介紹了Python的基礎知識以及Python中很好有名的庫NumPy和pandas工具集,還介紹了面向對象編程;第3部分介紹金融數據科學的相關基本技術和方法,包括數據可視化、輸入/輸出操作和數學中與金融相關的知識等;第4部分介紹Python在算法交易上的應用,重點介紹常見算法,包括機器學習、深度神經網絡等人工智能相關算法;第5部分講解基於蒙特卡洛模擬開發期權及衍生品定價的應用,其內容涵蓋了估值框架的介紹、金融模型的模擬、衍生品的估值、投資組合的估值等知識。 《Python金融大數據分析 第2版》本書適合對使用Python進行大數據分析、處理感興趣的金融行業開發人員......
目錄
●部分Python與金融
章為什麼將Python用於金融3
1.1Python編程語言3
1.1.1Python簡史5
1.1.2Python生態系統6
1.1.3Python用戶譜系7
1.1.4科學棧7
1.2金融中的科技8
1.2.1科技投入9
1.2.2作為業務引擎的科技9
1.2.3作為進入門檻的科技和人才10
1.2.4不斷提高的速度、頻率和數據量10
1.2.5實時分析的興起11
1.3用於金融的Python12
1.3.1金融和Python語法12
1.3.2Python的效率和生產率16
1.3.3從原型化到生產20
1.4數據驅動和人工智能優先的金融學21
1.4.1數據驅動金融學21
1.4.2人工智能優先金融學24
1.5結語26
1.6延伸閱讀27
第2章Python基礎架構29
2.1作為包管理器使用的conda31
2.1.1安裝Miniconda31
2.1.2conda基本操作33
2.2作為虛擬環境管理器的conda37
2.3使用Docker容器41
2.3.1Docker鏡像和容器41
2.3.2構建Ubuntu和PythonDocker鏡像42
2.4使用雲實例46
2.4.1RSA公鑰和私鑰47
2.4.2JupyterNotebook配置文件48
2.4.3Python和JupyterNotebook安裝腳本49
2.4.4協調Droplet設置的腳本51
2.5結語52
2.6延伸閱讀53
第2部分掌握基礎知識
第3章數據類型與結構57
3.1基本數據類型58
3.1.1整數58
3.1.2浮點數59
3.1.3布爾值61
3.1.4字符串65
3.1.5題外話:打印和字符串替換66
3.1.6題外話:正則表達式69
3.2基本數據結構71
3.2.1元組71
3.2.2列表72
3.2.3題外話:控制結構74
3.2.4題外話:函數式編程75
3.2.5字典76
3.2.6集合78
3.3結語79
3.4延伸閱讀79
第4章用NumPy進行數值計算81
4.1數據數組82
4.1.1用Python列表形成數組82
4.1.2Pythonarray類84
4.2常規NumPy數組86
4.2.1基礎知識86
4.2.2多維數組89
4.2.3元信息93
4.2.4改變組成與大小93
4.2.5布爾數組97
4.2.6速度對比99
4.3NumPy結構數組100
4.4代碼向量化102
4.4.1基本向量化102
4.4.2內存佈局105
4.5結語107
4.6延伸閱讀108
第5章pandas數據分析109
5.1DataFrame類110
5.1.1使用DataFrame類的步110
5.1.2使用DataFrame類的第二步114
5.2基本分析118
5.3基本可視化122
5.4Series類124
5.5GroupBy操作126
5.6複雜選擇128
5.7聯接、連接和合併131
5.7.1聯接132
5.7.2連接133
5.7.3合併135
5.8性能特徵137
5.9結語139
5.10延伸閱讀140
第6章面向對象編程141
6.1Python對像簡介145
6.1.1int145
6.1.2list146
6.1.3ndarray146
6.1.4DataFrame148
6.2Python類基礎知識149
6.3Python數據模型154
6.4Vector類158
6.5結語159
6.6延伸閱讀159
第3部分金融數據科學
第7章數據可視化163
7.1靜態2D繪圖164
7.1.1一維數據集164
7.1.2二維數據集170
7.1.3其他繪圖樣式177
7.2靜態3D繪圖184
7.3交互式2D繪圖188
7.3.1基本圖表188
7.3.2金融圖表192
7.4結語196
7.5延伸閱讀196
第8章金融時間序列197
8.1金融數據198
8.1.1數據導入198
8.1.2匯總統計201
8.1.3隨時間推移的變化203
8.1.4重新採樣207
8.2滾動統計209
8.2.1概述209
8.2.2技術分析示例211
8.3相關分析213
8.3.1數據213
8.3.2對數回報率214
8.3.3OLS回歸216
8.3.4相關217
8.4高頻數據218
8.5結語220
8.6延伸閱讀220
第9章輸入/輸出操作221
9.1Python基本I/O222
9.1.1將對象寫入磁盤222
9.1.2讀取和寫入文本文件225
9.1.3使用SQL數據庫229
9.1.4讀寫NumPy數組232
9.2pandas的I/O234
9.2.1使用SQL數據庫235
9.2.2從SQL到pandas237
9.2.3使用CSV文件239
9.2.4使用Excel文件240
9.3PyTables的I/O242
9.3.1使用表242
9.3.2使用壓縮表250
9.3.3使用數組252
9.3.4內存外計算253
9.4TsTables的I/O256
9.4.1樣板數據257
9.4.2數據存儲258
9.4.3數據檢索259
9.5結語261
9.6延伸閱讀262
0章高性能的Python265
10.1循環266
10.1.1Python266
10.1.2NumPy267
10.1.3Numba268
10.1.4Cython269
10.2算法271
10.2.1質數271
10.2.2斐波那契數275
10.2.3π279
10.3二叉樹283
10.3.1Python283
10.3.2NumPy285
10.3.3Numba286
10.3.4Cython287
10.4蒙特卡洛模擬288
10.4.1Python289
10.4.2NumPy291
10.4.3Numba291
10.4.4Cython292
10.4.5多進程293
10.5pandas遞歸算法294
10.5.1Python294
10.5.2Numba296
10.5.3Cython296
10.6結語297
10.7延伸閱讀298
1章數學工具299
11.1逼近法299
11.1.1回歸301
11.1.2插值310
11.2凸優化314
11.2.1全局優化315
11.2.2局部優化317
11.2.3有約束優化318
11.3積分320
11.3.1數值積分321
11.3.2通過模擬求取積分322
11.4符號計算323
11.4.1基礎知識323
11.4.2方程式325
11.4.3積分與微分325
11.4.4微分326
11.5結語328
11.6延伸閱讀328
2章推斷統計學331
12.1隨機數332
12.2模擬338
12.2.1隨機變量338
12.2.2隨機過程341
12.2.3方差縮減356
12.3估值359
12.3.1歐式期權359
12.3.2美式期權364
12.4風險測度367
12.4.1風險價值367
12.4.2信用價值調整371
12.5Python腳本374
12.6結語377
12.7延伸閱讀377
3章統計學379
13.1正態性檢驗380
13.1.1基準案例381
13.1.2真實數據390
13.2投資組合優化396
13.2.1數據396
13.2.2基本理論398
13.2.3最優投資組合401
13.2.4有效邊界404
13.2.5資本市場線405
13.3貝葉斯統計408
13.3.1貝葉斯公式409
13.3.2貝葉斯回歸410
13.3.3兩種金融工具414
13.3.4隨時更新估算值418
13.4機器學習423
13.4.1無監督學習423
13.4.2有監督學習426
13.5結語441
13.6延伸閱讀441
第4部分算法交易
4章FXCM交易平台445
14.1入門446
14.2讀取數據447
14.2.1讀取分筆交易數據447
14.2.2讀取K線(蠟燭圖)數據449
14.3使用API451
14.3.1讀取歷史數據452
14.3.2讀取流數據454
14.3.3下單455
14.3.4賬戶信息457
14.4結語457
14.5延伸閱讀458
5章交易策略459
15.1簡單移動平均數460
15.1.1數據導入460
15.1.2交易策略461
15.1.3向量化事後檢驗463
15.1.4優化465
15.2隨機遊走假設467
15.3線性OLS回歸469
15.3.1數據470
15.3.2回歸472
15.4聚類474
15.5頻率方法476
15.6分類479
15.6.1兩個二元特徵479
15.6.25個二元特徵480
15.6.35個數字化特徵482
15.6.4順序訓練-測試分離484
15.6.5隨機訓練-測試分離485
15.7深度神經網絡486
15.7.1用scikit-learn實現DNN486
15.7.2用TensorFlow實現DNN489
15.8結語492
15.9延伸閱讀493
6章自動化交易495
16.1資本管理496
16.1.1二項設定中的凱利標準496
16.1.2用於股票及指數的凱利標準500
16.2基於ML的交易策略505
16.2.1向量化事後檢驗505
16.2.2最優槓桿510
16.2.3風險分析512
16.2.4持久化模型對象515
16.3在線算法516
16.4基礎設施與部署518
16.5日誌與監控519
16.6結語521
16.7Python腳本522
16.7.1自動化交易策略522
16.7.2策略監控525
16.8延伸閱讀525
第5部分衍生品分析
7章估值框架529
17.1資產定價基本定理529
17.1.1簡單示例530
17.1.2一般結果530
17.2風險中立折現532
17.2.1日期建模與處理532
17.2.2恆定短期利率534
17.3市場環境536
17.4結語539
17.5延伸閱讀540
8章金融模型的模擬541
18.1隨機數生成542
18.2通用模擬類544
18.3幾何布朗運動548
18.3.1模擬類548
18.3.2用例550
18.4跳躍擴散553
18.4.1模擬類553
18.4.2用例556
18.5平方根擴散557
18.5.1模擬類558
18.5.2用例560
18.6結語561
18.7延伸閱讀563
9章衍生品估值565
19.1通用估值類566
19.2歐式行權570
19.2.1估值類570
19.2.2用例572
19.3美式行權577
19.3.1最小二乘蒙特卡洛方法577
19.3.2估值類578
19.3.3用例580
19.4結語583
19.5延伸閱讀585
第20章投資組合估值587
20.1衍生品頭寸588
20.1.1類588
20.1.2用例590
20.2衍生品投資組合592
20.2.1類592
20.2.2用例597
20.3結語604
20.4延伸閱讀605
第21章基於市場的估值607
21.1期權數據608
21.2模型檢驗610
21.2.1相關市場數據611
21.2.2期權建模612
21.2.3檢驗過程615
21.3投資組合估值620
21.3.1建立期權頭寸模型621
21.3.2期權投資組合622
21.4Python代碼623
21.5結語625
21.6延伸閱讀626
附錄A日期與時間627
A.1Python627
A.2NumPy633
A.3pandas636
附錄BBSM期權類641
B.1類定義641
B.2類的使用643
內容虛線
內容簡介
零基礎學Python爬蟲 數據分析與可視化從入門到精通
【 作 者 】: 孟兵等
【 I S B N】: 9787111668992
【出 版 社】: 機械工業出版社
【出版時間】: 2021-01
【印刷次數】: 1
【商品標識】: 29166854
【頁數】 : 376
【裝幀】 : 平裝-膠訂
【紙張】: 膠版紙
【開本】: 16開
內容簡介
Python 語言功能強大而靈活,具有很強的擴展性,同時它的語法又相對簡潔易懂,
沒有編程基礎的普通辦公人員經過適當的學習也能輕鬆上手。本書以Python 語言為工具,
從編程新手的角度和日常辦公的需求出發,深入淺出地講解如何通過Python 編程高效地
完成數據的獲取、處理、分析與可視化。全書共13 章。第1 章和第2 章主要講解Python
編程環境的搭建和Python 語言的基礎語法知識。第3 ~ 6章以數據處理與分析為主題,
講解NumPy 模塊和pandas 模塊的基本用法和實際應用。第7 ~ 9 章以數據獲取為主題,
由淺入深地講解如何通過編寫爬蟲程序從網頁上採集數據,並保存到數據庫中。第10 章主要
講解自然語言處理技術在文本分詞中的應用。第11 章和第12 章以數據可視化為主題,
講解如何使用Matplotlib 模塊和pyecharts 模塊繪製圖表。第13 章通過量化金融案例
對前面所學的知識進行了綜合應用。
本書適合想要提高數據處理和分析效率的職場人士和辦公人員閱讀,也可供Python
編程愛好者參考
編輯推薦
揭秘python爬蟲在行業實戰中的應用,
講解大數據分析與可視化的典型技術
數據自動爬取 海量數據分析 中文文本分詞 大數據可視化
目錄
第1 章 Python 快速上手
1.1?Python編程環境的搭建
1.2?Python的模塊
1.2.1?初識模塊
1.2.2?模塊的安裝
第2章 Python的基礎語法知識
2.1?變量
2.2?數據類型:數字與字符串
2.2.1?數字
2.2.2?字符串
2.2.3?數據類型的查詢
2.2.4?數據類型的轉換
2.3?數據類型:列表、字典、元組與集合
2.3.1?列表
2.3.2?字典
2.3.3?元組和集合
2.4?運算符
2.4.1?算術運算符和字符串運算符
2.4.2?比較運算符
2.4.3?賦值運算符
2.4.4?邏輯運算符
2.5?編碼基本規範
2.5.1?縮進
2.5.2?註釋
2.6?控制語句
2.6.1?if語句
2.6.2?for語句
2.6.3?while語句
2.6.4?控制語句的嵌套
2.7?函數
2.7.1?內置函數
2.7.2?自定義函數
2.8?模塊的導入
2.8.1?import語句導入法
2.8.2?from語句導入法
第3章 數組的存儲和處理—NumPy模塊
3.1?創建數組
3.1.1?使用array()函數創建數組
3.1.2?創建等差數組
3.1.3?創建隨機數組
3.2?查看數組的屬性
3.3?選取數組元素
3.3.1?一維數組的元素選取
3.3.2?二維數組的元素選取
3.4?數組的重塑與轉置
3.4.1?一維數組的重塑
3.4.2?多維數組的重塑
3.4.3?數組的轉置
3.5?數組的處理
3.5.1?添加數組元素
3.5.2?刪除數組元素
3.5.3?處理數組的缺失值
3.5.4?處理數組的重複值
3.5.5?拼接數組
3.5.6?拆分數組
3.6?數組的運算
3.6.1?數組之間的四則運算
3.6.2?數組元素的統計運算
第4章 數據的簡單處理—pandas模塊入門
4.1?數據結構
4.1.1?Series對象
4.1.2?DataFrame對象
4.2?讀取數據
4.2.1?讀取Excel工作簿數據
4.2.2?讀取csv文件數據
4.3?查看數據
4.3.1?查看數據的前幾行
4.3.2?查看數據的行數和列數
4.3.3?查看數據的類型
4.4?選擇數據
4.4.1?選擇行數據
4.4.2?選擇列數據
4.4.3?同時選擇行列數據
4.5?修改行標籤和列標籤
第5章 數據的高級處理—pandas模塊進階
5.1?數據的查找和替換
5.1.1?查找數據
5.1.2?替換數據
5.2?數據的處理
5.2.1?插入數據
5.2.2?刪除數據
5.2.3?處理缺失值
5.2.4?處理重複值
5.2.5?排序數據
5.2.6?篩選數據
5.3?數據表的處理
5.3.1?轉置數據表的行列
5.3.2?將數據表轉換為樹形結構
5.3.3?數據表的拼接
5.4?數據的運算
5.4.1?數據的統計運算
5.4.2?獲取數值分佈情況
5.4.3?計算相關係數
5.4.4?分組匯總數據
5.4.5?創建數據透視表
5.5?案例:獲取並分析股票歷史數據
第6章 使用Python進行數據分析
6.1?相關性分析
6.1.1?獲取股價數據
6.1.2?合併股價數據
6.1.3?股價數據相關性分析
6.2?假設檢驗
6.3?方差分析
6.3.1?方差分析的基本步驟
6.3.2?單因素方差分析的代碼實現
6.3.3?雙因素方差分析的代碼實現
6.3.4?利用第三方模塊快速完成方差分析
6.4?描述性統計分析
6.4.1?描述性統計指標的計算
6.4.2?數據的分佈狀態分析
6.4.3?數據的頻數和頻率分析
6.5?線性回歸分析
6.5.1?線性回歸分析的數學原理
6.5.2?線性回歸分析的思路
6.5.3?廣告費與銷量的一元線性回歸分析
6.5.4?不同渠道的廣告費與銷量的多元線性回歸分析
第7章 Python爬蟲基礎
7.1?認識網頁結構
7.1.1?查看網頁的源代碼
7.1.2?網頁結構的組成
7.1.3?百度新聞頁面結構剖析
7.2?requests模塊
7.2.1?requests模塊獲取數據的方式
7.2.2?get()函數的參數介紹
7.3?案例:爬取豆瓣電影動畫排行榜
7.4?正則表達式
7.4.1?正則表達式基礎
7.4.2?用正則表達式提取數據
7.5?BeautifulSoup模塊
7.5.1?實例化BeautifulSoup對象
7.5.2?用BeautifulSoup對象定位標籤
7.5.3?從標籤中提取文本內容和屬性值
7.6?XPath表達式
7.6.1?實例化etree對象
7.6.2?用XPath表達式定位標籤並提取數據
7.6.3?快速獲取標籤節點的XPath表達式
7.7?數據清洗
7.8?案例:爬取噹噹網的圖書銷售排行榜
第8章 Python爬蟲進階
8.1?Selenium模塊基礎
8.1.1?Selenium模塊的安裝與基本用法
8.1.2?Selenium模塊的標籤定位
8.1.3?Selenium模塊的標籤操作
8.2?Selenium模塊進階
8.2.1?模擬鼠標操作