Home > Information
Check-outs :

Python網路爬蟲與資料視覺化應用實務

  • Hit:52
  • Rating:0
  • Review:0
  • Trackback:0
  • Email:0


轉寄 列印
第1級人氣樹(0)
人氣指樹
  • keepsite
  • Introduction
  • Collection(0)
  • Review(0)
  • Rating(0)

【大數據時代必備的資料擷取與分析技能!】

  在資訊爆炸的時代,網路就是一個龐大的資源庫,不論是「想找出最便宜的商品價格」、「想知道競爭者的商品資訊」、「分析時下流行的趨勢」、「想了解歷史股價」、「分析球員的打擊率、得分率」、「分析點閱率最高的影片做為行銷決策」、……等等,都可以輕易取得各種數據。

  雖然數據來源不是問題,但要抓取、整理、分析龐大的資料,就需要一些工具及方法才能有效率地完成。本書實際教您使用 Python 的 Beautiful Soup、Pandas、Selenium 及 Scrapy 來建立爬蟲程式,並依不同的網頁型態使用對應的工具來抓取資料。在取得和儲存資料後,教您利用 Python的Matplotlib、Pandas、SeaBorn、Bokeh,將資料以視覺化的方式呈現,讓決策者能快速理解資料的【模式】、【趨勢】和【關聯性】。

本書特色

  ※從網路爬蟲→資料清理→資料視覺化,有效率地完成資料的探索及呈現。
  ※清楚解說 Python 各套件的使用時機
  .【擷取靜態網頁資料】-CSS 選擇器+Beautiful Soup 及 lxml
  .【擷取 Javascript 動態網頁資料】-Selenium
  .【擷取整個網站資料】-Scrapy 框架
  .【資料視覺化】-Matplotlib、Pandas、Seaborn、Bokeh
  ※列舉多項實例,讓您應用所學,實際擷取資料
  .用 Beautiful Soup 爬取股價、電影、圖書等資訊
  .用 Selenium 爬取旅館、食譜資訊
  .用 Scrapy 爬取 Tutsplus 教學文件及 PTT 看板資訊

Please login for this service.
Please login for this service.
Please login for this service.
Please login for this service.