使用说明
工具简介
网址链接提取器从混杂文本中提取 URL——邮件、Newsletter、网页复制内容、HTML 源码或日志片段均可,无需预先整理为每行一个链接。
处理包括自动去重、尾部标点清理,以及默认可选的 tracking 参数去除。可按关键词或 hostname 筛选,查看域名统计,然后复制或导出。全部在浏览器本地完成,不上传服务器。
适用场景
- 整理邮件或营销消息中的链接
- 从 HTML 源码或网页复制内容中提取 URL
- 清洗带追踪参数的分享链接
- 获取 hostname 列表用于 SEO 或竞品分析
- 导出到表格或其他工具
若已有「每行一个 URL」的列表,请使用 文本去重工具。
操作步骤
- 在「输入」区粘贴,或上传 .txt / .csv(可点「示例」试用)
- 查看右侧「提取结果」与下方统计
- 使用「域名分布」(最多前 50 个)并点击快速筛选
- 调整输出模式、排序、清洗选项与筛选条件
- 复制或下载 TXT / CSV;「清空文本」仅清输入;「重置」恢复默认
选项说明
| 选项 | 作用 |
|---|---|
| 输出:完整 URL / 仅域名 | 每行一条完整链接,或仅 hostname |
| 排序:出现顺序 / A–Z / Z–A | 结果列表顺序 |
| 去除 tracking 参数 | 去掉 utm_*、fbclid、gclid 等(默认开启) |
| 去除协议前缀 | 输出时不带 https:// |
| 去除末尾斜杠 | 去掉路径末尾的 `/`(如 `/blog/` → `/blog`)。纯域名或根路径(如 `https://example.com/`)勾选后通常看起来不变。 |
| 包含 / 排除关键词 | 子串 OR 匹配,保留或排除 |
| 域名筛选 | 只保留匹配的 hostname(含子域,OR) |
导出
| 方式 | 内容 |
|---|---|
| 复制 / TXT | 每行一条(URL 或 domain,取决于输出模式) |
| CSV | url、hostname、protocol 三列 + 表头(UTF-8) |
限制与提示
- 单次最多 500,000 字符;上传 ≤ 2 MB 且解码后仍受字符上限
- 粘贴 HTML 按普通文本扫描,不会在浏览器中渲染
- 不支持 PDF、Word 直接上传;请复制文本后粘贴
- 不支持仅路径形式(如 `/api/user`)
本工具只做格式级提取,不保证链接可访问或安全。