help_outline用户手册
欢迎使用 Alchemy!本手册将引导您了解如何高效地使用本工具的各项功能,将任何网页转换为干净、结构化的 Markdown 内容。
核心功能
1. 批量转换
这是 Alchemy 的主要功能。您可以将一个或多个 URL 粘贴到主输入框中(每行一个),然后点击“开始转换”即可。适用于您已经明确知道需要转换哪些页面的情况。
2. 从页面提取链接
当您需要转换一个网站的多个页面,但不想手动一个个复制链接时,此功能非常有用。它像一个小型爬虫,帮助您发现并收集链接。
- 入口页面 URL:您希望从哪个页面开始查找链接。
- URL 路径过滤器:一个强大的筛选工具。例如,如果您想提取一个博客的所有文章,入口 URL 可能是 `https://example.com/blog`,路径过滤器可以设置为 `/blog/`,这样就能确保只提取博客文章,而不会包含“关于我们”、“联系方式”等无关链接。
- 最大链接数:限制提取链接的数量,以防目标页面链接过多。
提取成功后,找到的链接会自动填充到主输入框中,并会提示您下载一个 Markdown 格式的索引文件,方便您存档和核对。
3. 高级选项
- 启用动态渲染 (JS):强烈建议始终保持开启。开启后,Alchemy 会使用一个完整的浏览器环境来加载页面,能执行 JavaScript,从而获取到动态加载的内容(例如由 React, Vue 等框架生成的页面)。关闭此选项仅适用于非常简单的纯静态 HTML 页面。
- 自定义内容选择器:允许您通过 CSS 选择器(例如 `#content`, `.main-article`)来精确指定您想提取的页面区域。这在处理一些布局复杂的网站时非常有用,可以进一步排除噪音。
结果视图
转换完成后,结果区会以两种视图展示:
- 概要列表:默认视图,实时展示每个链接的转换状态(成功/失败)、标题和抓取模式。您可以点击任意一项,完整内容视图会自动滚动到对应位置。
- 完整内容:切换后可查看所有成功页面的 Markdown 全文,并支持一键复制和打包下载。
常见问题 (FAQ)
1. 为什么我的转换会失败?
最常见的原因是目标网站需要登录、有严格的防火墙或反爬虫机制。网络问题或URL本身无效也会导致失败。
2. 提取的链接不准确怎么办?
请检查您的“URL 路径过滤器”是否设置得过于宽泛或狭窄。一个好的过滤器是提取成功的关键。
3. 我可以转换本地的 HTML 文件吗?
当前网页版暂不支持。这是我们未来浏览器插件版本计划支持的功能。