學習使用Google Apps Script自動抓取Google Sites的目錄,並嵌入另一個Google Sites頁尾。從解析HTML到設置自動更新,實現網站目錄同步。
若想在Google Sites設計自動化流程,從指定網站抓取目錄並嵌入至另一個網站的頁尾,可以透過Google Apps Script實現。以下是步驟說明:
使用Google Apps Script是一種常用方法,它提供了抓取網頁內容的功能。透過UrlFetchApp函數可以從指定的Google Sites頁面抓取HTML內容,接著進行解析以取得所需的目錄項目。
開啟Google Apps Script並創建專案。
使用UrlFetchApp.fetch(url)抓取指定頁面的HTML內容。
檢查並取得所需目錄結構,例如標題、超連結等。
抓取HTML內容後,可以利用HtmlService或JavaScript的正則表達式解析HTML並提取目錄資訊。檢查HTML結構後,設定解析規則來提取出目錄的標題和鏈結。
使用正則表達式或DOM解析器,針對目錄結構篩選出特定標籤。
儲存提取出的項目並準備放置於另一網站的頁尾。
目前,Google Sites並未提供直接API來更新頁尾的功能,但可利用Google Docs或Google Sheets間接實現更新。以下為可行步驟:
把解析出的目錄項目儲存至Google Docs或Google Sheets。
將該文件嵌入至目標網站的頁尾,讓它顯示更新的目錄資訊。
這樣一來,每次文件更新時,目標網站的嵌入內容也會同步更新,達成自動更新效果。
在Google Apps Script中設置觸發器能實現定期抓取與更新的自動化過程:
建立觸發器(例如每日或每周運行),讓腳本自動抓取並解析最新的網站目錄。
更新嵌入至目標網站的文件內容,讓目標頁尾顯示最新的目錄。
注意:若原始網站變動頻繁,建議設置合適的觸發頻率,避免過度操作而影響效能。此外,因為Google Sites的API限制,目前無法完全自動化嵌入操作。