Industry

产品

Client

2024年4月14日

Jina AI 开源 RAG 关键组件-网页内容爬取

摘要 Reader是一个将任何URL转换为LLM友好输入的工具,只需在URL前加上https://r.jina.ai/即可。它可以提供改进的输出,适用于您的代理和RAG系统。

关键部分

  • 标准模式:将https://r.jina.ai/添加到任何URL前,以将其转换为LLM友好输入。

  • 流式模式:使用accept-header控制流式传输行为,可以更快地访问和处理数据。

  • JSON模式:使用accept-header控制输出格式为JSON,目前仅包含url、title和content三个字段。

  • 安装:需要Node v18和Firebase CLI来运行项目,并在backend/functions目录中安装npm依赖。

  • thinapps-shared子模块:是一个内部包,用于在产品之间共享代码,不影响Reader的功能。

请注意,Reader由Jina AI支持,并在Apache-2.0许可下发布。

© 2024 GUIZANG, Inc. All rights reserved.