文本去重

选择场景与选项,在左侧输入或粘贴列表,右侧实时显示去重结果与统计;下方可查看每一行的保留或重复状态。单次输入上限约 50 万字符,适合大批量邮箱等列表。

场景模式

逐行比较,默认保留首次出现的行。可按需开启忽略大小写、去空白等选项。

选项

结果排序

输入

0 行

0 / 500,000

请输入文本

在左侧输入框中粘贴或输入多行内容,将实时显示去重结果与预览。

使用说明

工具说明

文本去重工具(Text Deduplicator)面向列表型内容清洗:每一行视为一条记录,保留首次出现的行,将后续相同(在选定规则下)的行标记为重复。快速清理重复内容,让你的列表更干净、更易用。

无论是邮箱列表、URL 链接、关键词,还是普通文本,只需粘贴内容,即可一键去重。所有处理都在浏览器本地完成,无需注册,也不会上传任何数据。支持离线使用,适合处理敏感数据(如客户邮箱、内部资料等)。

支持的使用场景

1. 通用文本去重

适用于任何按「每行一条」的内容,例如:

  • 商品名称
  • 标签列表
  • 日志数据

工具会自动保留每条内容的第一次出现,删除后续重复项。

2. 邮箱列表去重

专为邮件营销和用户数据清洗设计:

  • 自动忽略大小写(如 `Test@Email.com` = `test@email.com`)
  • 自动识别重复邮箱
  • 无效邮箱会单独标记,方便你检查,而不会被直接删除

适合整理订阅用户、客户名单等。

3. URL 链接去重

用于清理重复网页链接,特别适合 SEO 和数据整理:

工具会自动处理常见差异,例如:

  • `/page` 和 `/page/` 视为相同
  • 忽略页面锚点(`#section`)

还可以选择是否忽略参数(如 `?utm=xxx`),避免同一页面被重复统计。

4. 关键词去重

适用于 SEO、广告投放或内容规划:

  • 支持大小写区分(默认)
  • 可开启「忽略大小写」统一去重

帮助你快速整理关键词列表,避免重复投放或内容冲突。

简单 3 步完成去重

  1. 选择对应的使用场景(文本 / 邮箱 / URL / 关键词)
  2. 粘贴你的内容(每行一条)
  3. 自动完成去重,立即查看结果

你还可以:

  • 查看哪些内容被删除(清晰标注)
  • 一键复制去重结果
  • 查看统计数据(总数 / 保留 / 删除)

灵活选项(可选)

你可以根据需要开启或关闭以下功能:

  • 忽略大小写(统一内容格式)
  • 去除空格(避免格式导致重复)
  • 忽略空行(保持结果干净)
  • 排序结果(A–Z 或 Z–A)
  • URL 去参数(适合 SEO 数据清洗)
  • 邮箱格式检查(识别无效地址)

大多数情况下,默认设置已经足够使用。

可视化差异预览

所有处理都是透明的:

  • 保留的内容正常显示
  • 被删除的重复项会加删除线,并标记为「重复」(`dup`)

你可以清楚看到每一条变化,不用担心误删。

使用限制

当前单次最多约 500,000(50 万)字符,便于大批量邮箱、网址或关键词列表去重;极端超长内容仍建议分段处理。

常见问题

Q: 什么是文本去重工具?

A: 文本去重工具可以自动识别并删除重复内容,保留唯一的一份。常用于清理列表数据,比如邮箱、关键词或链接。

Q: 如何去除重复行?

A: 只需将内容粘贴到输入框中,每行一条,工具会自动检测并删除重复项,无需额外操作。

Q: 邮箱去重是如何判断重复的?

A: 工具会先统一为小写再比较,因此:`Test@Email.com` 和 `test@email.com` 会被识别为同一个邮箱。

Q: 无效邮箱会被删除吗?

A: 不会。格式不正确的邮箱会被单独标记出来,方便你手动检查,而不会直接丢失。

Q: URL 去重和普通文本有什么区别?

A: URL 去重会自动处理常见格式差异,例如:

  • 是否带 `/`
  • 是否包含 `#锚点`
  • 是否包含参数(可选)

这样可以避免同一个页面被重复计算。

Q: 是否支持去除 URL 参数(如 utm)?

A: 支持。你可以开启「忽略 ?query 参数」,这样类似:

  • example.com/page?utm=1
  • example.com/page?utm=2

会被视为同一个链接。

Q: 关键词去重会区分大小写吗?

A: 默认会区分,例如:`AI` 和 `ai`;如果开启「忽略大小写」,它们会被合并。

Q: 工具会保存或上传我的数据吗?

A: 不会。所有处理都在你的浏览器中完成,不会上传或存储任何数据。若您未清除站点数据,草稿可能保存在本机浏览器的 localStorage 中,便于下次继续编辑。

Q: 可以处理多大的文本?

A: 单次输入上限为 500,000(约 50 万)个字符,达到上限后将无法继续输入;若仍超出,请将列表分段处理。

Q: 去重后可以导出结果吗?

A: 可以。你可以一键复制结果,用于粘贴到 Excel、文档或其他工具中。

Q: 为什么有些内容看起来一样但没有被去重?

A: 可能原因包括:

  • 大小写不同(未开启忽略大小写)
  • 存在隐藏空格或符号
  • URL 参数不同(未开启忽略 query)

可以尝试调整选项后再处理。