Firecrawl
Moltbot 可将 Firecrawl 作为 web_fetch 的回退提取器。Firecrawl 是托管内容提取服务,支持反爬与缓存,适用于重度 JS 或阻止普通 HTTP 抓取的页面。
获取 API Key
- 注册 Firecrawl 账号并生成 API key。
- 在配置中填写,或在网关环境中设置
FIRECRAWL_API_KEY。
配置 Firecrawl
{
tools: {
web: {
fetch: {
firecrawl: {
apiKey: "FIRECRAWL_API_KEY_HERE",
baseUrl: "https://api.firecrawl.dev",
onlyMainContent: true,
maxAgeMs: 172800000,
timeoutSeconds: 60
}
}
}
}
}说明:当存在 API key 时,firecrawl.enabled 默认为 true。maxAgeMs 控制缓存结果的最大年龄(毫秒),默认 2 天。
隐身 / 反爬
Firecrawl 提供 proxy 参数(basic、stealth 或 auto)用于反爬。Moltbot 对 Firecrawl 请求始终使用 proxy: "auto" 和 storeInCache: true。若省略 proxy,Firecrawl 默认为 auto。auto 在基础尝试失败时会用隐身代理重试,可能比仅 basic 消耗更多额度。
web_fetch 如何使用 Firecrawl
web_fetch 的提取顺序:
- Readability(本地)
- Firecrawl(若已配置)
- 基础 HTML 清理(最后回退)
完整 Web 工具配置见 Web 工具。
最后更新于: