URL抽出

メール、Web ページの内容、HTML ソース、またはアップロードした TXT / CSV から、URL とドメインを素早く抽出。自動重複削除、一般的なトラッキング用パラメータ（utm など）の除去、キーワード・ドメイン絞り込み、統計表示に対応。結果は TXT または CSV で出力。最大 2 MB・50 万文字まで。ブラウザ内だけで処理し、データはサーバーに送信されません。

抽出設定

出力

並び順

トラッキング用パラメータを除去

プロトコルを除去

末尾のスラッシュを除去

すでに 1 行 1 URL のリストならテキスト重複削除で整理できます。

入力

0 / 500,000

抽出結果はここに表示されます

左の入力欄にテキストを貼るか、.txt / .csv をアップロード

使い方

概要

URL 抽出は、メール、Newsletter、Web コピー、HTML ソース、ログなどの混在テキストからリンクを取り出します。1 行 1 URL に整える必要はありません。

重複削除、末尾句読点の除去、一般的なトラッキングパラメータの除去（既定）に対応。キーワードや hostname で絞り込み、ドメイン統計を見て、コピーまたはエクスポートできます。すべてブラウザ内で完結し、サーバーへ送信しません。

こんなときに

メールやマーケ文面からリンクを集める
HTML ソースや Web コピーから URL を抜き出す
トラッキング付き共有 URL を整理する
SEO や競合確認用に hostname リストを作る
表計算など他ツールへ渡す

すでに 1 行 1 URL のリストならテキスト重複削除をご利用ください。

手順

「入力」に貼り付け、または .txt / .csv をアップロード（「サンプル」で試せます）
右の「抽出結果」と下の統計を確認
「ドメイン内訳」（最大 50 件）をクリックして絞り込み
出力形式、並び順、クリーンアップ、フィルタを調整
コピーまたは TXT / CSV ダウンロード。「クリア」は入力のみ、「リセット」は既定に戻します

オプション

オプション	内容
出力：完全な URL / ドメインのみ	1 行 1 リンク、または hostname のみ
並び順：出現順 / A–Z / Z–A	結果の順序
トラッキング用パラメータを除去	utm_*、fbclid、gclid など（既定オン）
プロトコルを除去	https:// を付けない
末尾のスラッシュを除去	パス末尾の `/` を除去（例: `/blog/` → `/blog`）。`https://example.com/` のようなドメインのみの URL は、オンにしても見た目が変わらないことがあります。
含める / 除外キーワード	部分一致 OR
ドメイン絞り込み	一致 hostname のみ（サブドメイン含む、OR）

エクスポート

方法	内容
コピー / TXT	1 行 1 件（出力形式に依存）
CSV	url、hostname、protocol 列 + ヘッダー（UTF-8）

上限とヒント

1 回 500,000 文字まで。アップロード 2 MB 以下かつデコード後も文字上限内
HTML はテキストとしてスキャン（ブラウザ表示はしません）
PDF・Word の直接アップロードは非対応。テキストをコピーして貼り付けてください
`/api/user` のようなパスのみは抽出しません

形式レベルの抽出であり、リンクの有効性や安全性は保証しません。

よくある質問

Q: このツールは何をしますか？: A: 混在テキストまたは TXT/CSV から URL を見つけ、重複を削除し、一般的なトラッキング用クエリ（utm、fbclid など）を既定で除去します。hostname のみの出力、キーワード・ドメイン絞り込み、統計表示、TXT/CSV 出力ができます。すべてブラウザ内で完結します。
Q: 使い方は？: A: 1. 左の入力欄に貼り付けるか、.txt / .csv をアップロード（UTF-8）
2. 右に抽出結果が表示され、一致・残件・重複除去・ドメイン数・HTTPS/HTTP が確認できます
3. 「抽出設定」で出力形式、並び順、クリーンアップを調整
4. 「含める/除外キーワード」「ドメイン絞り込み」で絞り込み。ドメイン chip をクリックでフィルタに追加
5. 「コピー」または「ダウンロード」（TXT / CSV）。「クリア」は入力のみ、「リセット」は既定に戻します
Q: ファイルをアップロードできますか？: A: .txt と .csv（UTF-8）に対応。最大 2 MB、デコード後 500,000 文字まで（貼り付けと同じ）。超過時はエラー表示、切り詰めはしません。
Q: 2 MB と 50 万文字の両方の上限があるのはなぜ？: A: 2 MB はファイルサイズの上限、50 万文字は抽出に使うテキスト長の上限です（貼り付けとアップロード共通）。
2 MB 未満でもデコード後に 50 万文字を超える場合は分割してください。
Q: 入力と出力の形式は？: A: 入力：任意のテキスト、または TXT/CSV の全文。
出力：1 行 1 件（完全な URL または hostname。出力形式による）。
CSV は url、hostname、protocol 列とヘッダー（UTF-8）。
Q: トラッキング用パラメータとは？: A: 分析や広告用の URL クエリ（utm_source、fbclid など）。「トラッキング用パラメータを除去」がオン（既定）のとき、一般的なものを結果から取り除きます。オフにすると元の query を保持します。
Q: 完全な URL と「ドメインのみ」の違いは？: A: 完全な URL はパスと query を含みます（クリーンアップ後）。ドメインのみは hostname だけ（例: blog.example.com）— リンク元の分布を見るのに便利です。
Q: 含める/除外/ドメイン絞り込みの使い方は？: A: カンマ・セミコロン・改行で複数指定（OR、大文字小文字無視）。「含める」はいずれかに一致する URL を残す。「除外」は一致を除く。「ドメイン絞り込み」は hostname で残す（サブドメイン含む）。ドメイン内訳の chip クリックで追加できます。
Q: HTML からリンクを取れますか？: A: HTML ソースをテキストとして貼ればスキャンできます（href、src 内の URL など）。ページはレンダリングせず DOM も解析しません。特殊な書き方は取りこぼす場合があります。
Q: 想定より結果が少ないのはなぜ？: A: 絞り込みが厳しい、hostname が認識できない、/api/user のようなパスのみ（非対応）、テキストに完全な URL がない、などがよくあります。絞り込みを緩めるか元データを確認してください。
Q: データはアップロードされますか？: A: いいえ。処理はブラウザ内のみ。オプションは localStorage、入力はこのタブの sessionStorage に保持されます。詳細は下の「プライバシーについて」。
Q: テキスト重複削除との違いは？: A: URL 抽出は混在テキストからリンクを探します。テキスト重複削除は「1 行 1 URL」のリストを整理します。すでに行単位リストなら後者を使ってください。