網址連結提取器

從郵件、網頁內容、HTML 原始碼或上傳的 TXT、CSV 檔案中快速提取網址連結 URL 與網域(Domain)。支援自動去重、移除常見 Tracking 參數(如 UTM)、依關鍵字或網域篩選,並查看統計資訊。結果可匯出為 TXT 或 CSV。支援最大 2 MB 檔案與 50 萬字元文字,全程在瀏覽器本地處理,資料不會上傳到伺服器。

提取設定

輸出
結果排序

已有每行一個 URL?請使用文字去重工具清理並去重列表。

輸入

0 / 500,000

提取結果將顯示在這裡

在左側輸入區貼上文字或上傳 .txt / .csv 檔案

使用說明

工具簡介

網址連結提取器從混雜文字中提取 URL——郵件、Newsletter、網頁複製內容、HTML 原始碼或日誌片段均可,無需預先整理為每行一個連結。

處理包括自動去重、尾部標點清理,以及預設可選的 tracking 參數去除。可依關鍵字或 hostname 篩選,查看網域統計,然後複製或匯出。全部在瀏覽器本地完成,不上傳伺服器。

適用場景

  • 整理郵件或行銷訊息中的連結
  • 從 HTML 原始碼或網頁複製內容中提取 URL
  • 清洗帶追蹤參數的分享連結
  • 取得 hostname 列表用於 SEO 或競品分析
  • 匯出到試算表或其他工具

若已有「每行一個 URL」的列表,請使用 文字去重工具

操作步驟

  1. 在「輸入」區貼上,或上傳 .txt / .csv(可點「範例」試用)
  2. 查看右側「提取結果」與下方統計
  3. 使用「網域分布」(最多前 50 個)並點擊快速篩選
  4. 調整輸出模式、排序、清洗選項與篩選條件
  5. 複製或下載 TXT / CSV;「清空文字」僅清輸入;「重置」恢復預設

選項說明

選項作用
輸出:完整 URL / 僅網域每行一條完整連結,或僅 hostname
排序:出現順序 / A–Z / Z–A結果列表順序
去除 tracking 參數去掉 utm_*、fbclid、gclid 等(預設開啟)
去除協定前綴輸出時不帶 https://
去除末尾斜線去掉路徑末尾的 `/`(如 `/blog/` → `/blog`)。純網域或根路徑(如 `https://example.com/`)勾選後通常看起來不變。
包含 / 排除關鍵字子串 OR 匹配,保留或排除
網域篩選只保留匹配的 hostname(含子網域,OR)

匯出

方式內容
複製 / TXT每行一條(URL 或 domain,取決於輸出模式)
CSVurl、hostname、protocol 三欄 + 表頭(UTF-8)

限制與提示

  • 單次最多 500,000 字元;上傳 ≤ 2 MB 且解碼後仍受字元上限
  • 貼上 HTML 按普通文字掃描,不會在瀏覽器中渲染
  • 不支援 PDF、Word 直接上傳;請複製文字後貼上
  • 不支援僅路徑形式(如 `/api/user`)

本工具只做格式級提取,不保證連結可存取或安全。

常見問題

Q: 這個工具能做什麼?

A: 從混雜文字或上傳的 TXT/CSV 中找出 URL,自動去重,並預設去除常見 tracking 查詢參數。可切換為僅輸出 hostname,依關鍵字或網域篩選,查看統計,複製或匯出 TXT/CSV。全部在瀏覽器本地完成。

Q: 怎麼用?

A: 1. 在左側輸入區貼上文字,或點「上傳」選擇 .txt / .csv(UTF-8)

2. 右側即時顯示提取結果;統計區顯示匹配、保留、去重、網域數及 HTTPS/HTTP

3. 在「提取設定」中調整輸出模式、排序與清洗選項

4. 使用「包含/排除關鍵字」或「網域篩選」縮小結果;點擊網域 chip 可快速填入

5. 使用「複製」或「下載」(TXT / CSV);「清空文字」僅清輸入;「重置」恢復預設

Q: 支援從檔案上傳嗎?

A: 支援 .txt 和 .csv(UTF-8)。上傳不超過 2 MB;解碼文字不超過 500,000 字元(與貼上相同)。超出會顯示錯誤並拒絕載入,不會截斷。

Q: 為什麼既有 2 MB 又有 50 萬字元兩個上限?

A: 2 MB 限制上傳檔案體積;50 萬字元限制實際參與提取的文字長度(貼上與上傳解碼後共用)。

檔案可能不到 2 MB 但解碼後超過 50 萬字元,請拆分檔案。

Q: 輸入和輸出是什麼格式?

A: 輸入:任意文字,或上傳 TXT/CSV 的全文。

輸出:每行一條(完整 URL 或 hostname,取決於輸出模式)。

CSV 含 url、hostname、protocol 三欄及表頭(UTF-8)。

Q: 什麼是 tracking 參數?

A: 用於統計或廣告的 URL 查詢參數,如 utm_source、fbclid。預設開啟「去除 tracking 參數」時會從結果中移除常見項;關閉後可保留原始 query。

Q: 完整 URL 和「僅網域」有什麼區別?

A: 完整 URL 保留路徑與 query(清洗後);僅網域只輸出 hostname(如 blog.example.com),便於查看連結來源分布。

Q: 包含、排除和網域篩選怎麼用?

A: 多個條件可用逗號、分號或換行分隔(OR,不區分大小寫)。「包含」保留匹配任一關鍵字的 URL;「排除」去掉匹配的 URL;「網域篩選」依 hostname 保留(含子網域)。點擊網域分布中的 chip 可快速填入。

Q: 能從 HTML 裡提取連結嗎?

A: 可以貼上 HTML 原始碼作為普通文字掃描(包括 href、src 中的 URL)。不會渲染頁面或解析 DOM,特殊寫法可能漏提。

Q: 為什麼提取結果比預期少?

A: 常見原因:篩選過嚴、連結缺少可識別 hostname、僅路徑形式(如 /api/user,不支援)、原文字未包含完整 URL。可放寬篩選或檢查來源。

Q: 資料會上傳嗎?

A: 不會。處理在瀏覽器本地完成。選項可能保存在 localStorage;輸入保存在目前分頁的 sessionStorage。詳見頁底「隱私說明」。

Q: 和文字去重工具有什麼區別?

A: 本工具從混合文字中找連結;文字去重工具用於清理「每行一個 URL」的已有列表。若已是逐行列表,請用文字去重工具。

類似工具

同類別或功能相近的工具

查看全部