Home > Information
Check-outs :

網站擷取:使用Python

  • Hit:194
  • Rating:0
  • Review:0
  • Trackback:0
  • Email:0


轉寄 列印
第1級人氣樹(0)
人氣指樹
  • keepsite
  • Introduction
  • Collection(0)
  • Review(0)
  • Rating(0)

在現代網路蒐集資料

  「本書涵蓋的工具與範例,讓我輕易把好幾個重複的工作自動化,騰出時間解決更多有趣的問題。這是本重視成果、內容從實務問題與解法出發,又能很快讀完的好書。」 — Eric VanWyk, 電子計算機工程師,麻州歐林工程學院

  學會網頁搜刮(scraping)及爬行(crawling)技術,就能從任何網站來源取得任意格式的無限量資料。您可以從這本實務指南學到如何使用Python與web APIs,同時從上千,甚至上百萬的網頁之中獲取並處理資料。

  本書適合會寫Python的程式設計者、網路安全工作者以及網站管理者閱讀。不僅會提到網頁搜刮的基本機制,還會提到一些進階主題,像是分析原始資料,或是利用搜刮工具進行網站前端測試。本書也將提供程式範例協助您從實務的角度理解觀念。

  •學會如何解析複雜的HTML頁面
  •走訪許多頁面與網站
  •掌握APIs的概觀以及它們如何運作
  •學會多種儲存搜刮來的資料的方式
  •下載文件並讀取內容,從中擷取資料
  •使用工具與技巧整理格式雜亂的原始資料
  •讀寫自然語言
  •爬過表單與登入頁
  •瞭解如何搜刮JavaScript
  •學會影像處理與文字識別

Please login for this service.
Please login for this service.
Please login for this service.
Please login for this service.