Koala OSS Club
科技周报
深度分析
俱乐部视频
周边
reader API | 网页内容供 LLM 使用
在使用 LLM 开发知识问答类应用时,通常需要将⽹⻚中的内容作为素材纳⼊知识库。Jina AI 近期开源的 reader API 是⼀个为这⼀场景设计的函数服务,可以将特定⽹⻚中的内容清洗为简洁的⽂本供 LLM 使⽤。在实现上 reader API 使⽤了我们之前介绍的Mozilla readability 库,⽤于从⽹⻚中提取主要信息。在 reader 发布之后也有其他同类项⽬开源,例如 firecrawl,有兴趣的⼩伙伴可以对⽐选⽤最符合⾃⼰需求的⼯具。
URL
https://github.com/jina-ai/reader
标签
AI,工具
视频
科技周报视频合集