URL抽出

メール、Web ページの内容、HTML ソース、またはアップロードした TXT / CSV から、URL とドメインを素早く抽出。自動重複削除、一般的なトラッキング用パラメータ(utm など)の除去、キーワード・ドメイン絞り込み、統計表示に対応。結果は TXT または CSV で出力。最大 2 MB・50 万文字まで。ブラウザ内だけで処理し、データはサーバーに送信されません。

抽出設定

出力
並び順

すでに 1 行 1 URL のリストなら テキスト重複削除 で整理できます。

入力

0 / 500,000

抽出結果はここに表示されます

左の入力欄にテキストを貼るか、.txt / .csv をアップロード

使い方

概要

URL 抽出は、メール、Newsletter、Web コピー、HTML ソース、ログなどの混在テキストからリンクを取り出します。1 行 1 URL に整える必要はありません。

重複削除、末尾句読点の除去、一般的なトラッキングパラメータの除去(既定)に対応。キーワードや hostname で絞り込み、ドメイン統計を見て、コピーまたはエクスポートできます。すべてブラウザ内で完結し、サーバーへ送信しません。

こんなときに

  • メールやマーケ文面からリンクを集める
  • HTML ソースや Web コピーから URL を抜き出す
  • トラッキング付き共有 URL を整理する
  • SEO や競合確認用に hostname リストを作る
  • 表計算など他ツールへ渡す

すでに 1 行 1 URL のリストなら テキスト重複削除 をご利用ください。

手順

  1. 「入力」に貼り付け、または .txt / .csv をアップロード(「サンプル」で試せます)
  2. 右の「抽出結果」と下の統計を確認
  3. 「ドメイン内訳」(最大 50 件)をクリックして絞り込み
  4. 出力形式、並び順、クリーンアップ、フィルタを調整
  5. コピーまたは TXT / CSV ダウンロード。「クリア」は入力のみ、「リセット」は既定に戻します

オプション

オプション内容
出力:完全な URL / ドメインのみ1 行 1 リンク、または hostname のみ
並び順:出現順 / A–Z / Z–A結果の順序
トラッキング用パラメータを除去utm_*、fbclid、gclid など(既定オン)
プロトコルを除去https:// を付けない
末尾のスラッシュを除去パス末尾の `/` を除去(例: `/blog/` → `/blog`)。`https://example.com/` のようなドメインのみの URL は、オンにしても見た目が変わらないことがあります。
含める / 除外キーワード部分一致 OR
ドメイン絞り込み一致 hostname のみ(サブドメイン含む、OR)

エクスポート

方法内容
コピー / TXT1 行 1 件(出力形式に依存)
CSVurl、hostname、protocol 列 + ヘッダー(UTF-8)

上限とヒント

  • 1 回 500,000 文字まで。アップロード 2 MB 以下かつデコード後も文字上限内
  • HTML はテキストとしてスキャン(ブラウザ表示はしません)
  • PDF・Word の直接アップロードは非対応。テキストをコピーして貼り付けてください
  • `/api/user` のようなパスのみは抽出しません

形式レベルの抽出であり、リンクの有効性や安全性は保証しません。

よくある質問

Q: このツールは何をしますか?

A: 混在テキストまたは TXT/CSV から URL を見つけ、重複を削除し、一般的なトラッキング用クエリ(utm、fbclid など)を既定で除去します。hostname のみの出力、キーワード・ドメイン絞り込み、統計表示、TXT/CSV 出力ができます。すべてブラウザ内で完結します。

Q: 使い方は?

A: 1. 左の入力欄に貼り付けるか、.txt / .csv をアップロード(UTF-8)

2. 右に抽出結果が表示され、一致・残件・重複除去・ドメイン数・HTTPS/HTTP が確認できます

3. 「抽出設定」で出力形式、並び順、クリーンアップを調整

4. 「含める/除外キーワード」「ドメイン絞り込み」で絞り込み。ドメイン chip をクリックでフィルタに追加

5. 「コピー」または「ダウンロード」(TXT / CSV)。「クリア」は入力のみ、「リセット」は既定に戻します

Q: ファイルをアップロードできますか?

A: .txt と .csv(UTF-8)に対応。最大 2 MB、デコード後 500,000 文字まで(貼り付けと同じ)。超過時はエラー表示、切り詰めはしません。

Q: 2 MB と 50 万文字の両方の上限があるのはなぜ?

A: 2 MB はファイルサイズの上限、50 万文字は抽出に使うテキスト長の上限です(貼り付けとアップロード共通)。

2 MB 未満でもデコード後に 50 万文字を超える場合は分割してください。

Q: 入力と出力の形式は?

A: 入力:任意のテキスト、または TXT/CSV の全文。

出力:1 行 1 件(完全な URL または hostname。出力形式による)。

CSV は url、hostname、protocol 列とヘッダー(UTF-8)。

Q: トラッキング用パラメータとは?

A: 分析や広告用の URL クエリ(utm_source、fbclid など)。「トラッキング用パラメータを除去」がオン(既定)のとき、一般的なものを結果から取り除きます。オフにすると元の query を保持します。

Q: 完全な URL と「ドメインのみ」の違いは?

A: 完全な URL はパスと query を含みます(クリーンアップ後)。ドメインのみは hostname だけ(例: blog.example.com)— リンク元の分布を見るのに便利です。

Q: 含める/除外/ドメイン絞り込みの使い方は?

A: カンマ・セミコロン・改行で複数指定(OR、大文字小文字無視)。「含める」はいずれかに一致する URL を残す。「除外」は一致を除く。「ドメイン絞り込み」は hostname で残す(サブドメイン含む)。ドメイン内訳の chip クリックで追加できます。

Q: HTML からリンクを取れますか?

A: HTML ソースをテキストとして貼ればスキャンできます(href、src 内の URL など)。ページはレンダリングせず DOM も解析しません。特殊な書き方は取りこぼす場合があります。

Q: 想定より結果が少ないのはなぜ?

A: 絞り込みが厳しい、hostname が認識できない、/api/user のようなパスのみ(非対応)、テキストに完全な URL がない、などがよくあります。絞り込みを緩めるか元データを確認してください。

Q: データはアップロードされますか?

A: いいえ。処理はブラウザ内のみ。オプションは localStorage、入力はこのタブの sessionStorage に保持されます。詳細は下の「プライバシーについて」。

Q: テキスト重複削除との違いは?

A: URL 抽出は混在テキストからリンクを探します。テキスト重複削除は「1 行 1 URL」のリストを整理します。すでに行単位リストなら後者を使ってください。

関連ツール

同カテゴリまたは関連機能のツール

すべて見る