贊助廠商

///本部落格所有文章列表///

搜尋本部落格文章資料

如果你要使用 Excel 來抓取網頁上的表格資料,可以參考以下的文章:

Excel-從網頁上取得外部資料

Excel-在工作表中匯入網頁中的動態資料

Excel-取得部落格網頁的標題至工作表中

相同的動作,如果要在Google 試算表中執行,則可以 IMPROTHTML函數。

(參考:https://support.google.com/docs/answer/3093339?hl=zh-Hant

Google試算表-抓取網頁資料(IMPORTHTML)

例如,要抓取本部落格(http://isvincent.pixnet.net)的文章清單第 28頁:

http://isvincent.pixnet.net/blog/listall/28

Google試算表-抓取網頁資料(IMPORTHTML)

在儲存格A1輸入:

=IMPORTHTML(http://isvincent.pixnet.net/blog/listall/28,"table",3)

此處的參數 table 是指網頁中資料結構為表格者,參數 3 為第 3 個。

當你輸入完公式,按下 Enter 鍵後,速度很快的就會顯示匯入的結果:

(匯入的資料是靜態結果,並不會跟著網頁內容更新而變動。)

Google試算表-抓取網頁資料(IMPORTHTML)

如果你將公式中的參數 table 改成 list,則會得到以下的結果:

Google試算表-抓取網頁資料(IMPORTHTML)

對應至網頁中的:

Google試算表-抓取網頁資料(IMPORTHTML)

其他相關的函數還有:

IMPORTXML:匯入多種結構化資料類型的資料,包括 XML、HTML、CSV、TSV 和 RSS 以及 ATOM XML 資訊提供。

IMPORTRANGE:匯入指定試算表中特定儲存格的範圍。

IMPORTFEED:匯入 RSS 或 ATOM 資訊提供。

IMPORTDATA:將指定網址的資料匯入成 .csv (逗號分隔值) 或 .tsv (Tab 分隔值) 格式。

創作者介紹

學不完.教不停.用不盡

vincent 發表在 痞客邦 PIXNET 留言(1) 人氣()


留言列表 (1)

發表留言
  • pulipuli.chen
  • 非常實用的技巧!感謝您!
  • 謝謝你光臨我的網站。

    vincent 於 2017/05/30 22:05 回覆

找更多相關文章與討論

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼