一个月前,我开始构建一个免费开源的PDF聊天应用程序。我原本以为这会非常简单。
上传PDF,提取文本,将其提供给LLM。能出什么问题?
2025年08月25日
一个月前,我开始构建一个免费开源的PDF聊天应用程序。我原本以为这会非常简单。
上传PDF,提取文本,将其提供给LLM。能出什么问题?
2025年08月25日
olmOCR 是 Ai2 推出的开源工具,用在将 PDF 文档高效转换为干净的结构化纯文本。olmOCR结合文档锚定(document-anchoring)技术与Qwen2-VL-7B-Instruct(阿里多模态模型),支持处理多种类型的 PDF文档,包括学术论文、书籍、表格和图表等。olmOCR基于提取文档中的文本和布局信息,与页面图像结合,更准确地提取内容、保留结构化信息。
主要功能支持:
2025年08月25日
谷歌公司今日宣布升级其对话式人工智能搜索工具"AI搜索模式",大幅扩展其功能范围。
该公司于今年3月推出AI搜索模式,让用户能够将传统的谷歌搜索体验从简单的链接列表转变为动态、个性化的解释和连贯段落,同时支持用户直接询问网页内容相关问题。
此次更新中,谷歌新增四大重要功能,涵盖搜索直播(支持Google Lens的视频功能)、Canvas画布、图像和PDF上传等。
目前用户已能在谷歌应用的移动设备上使用AI模式询问图像相关问题;本周同样功能将登陆桌面浏览器。公司表示,未来几周内还将推出PDF上传支持功能。
2025年08月25日
IT之家 8 月 20 日消息,Adobe 今天凌晨宣布推出全新的 Acrobat 平台,将 PDF 应用、Adobe Express 内容创作服务以及可以自动完成特定任务的 AI 助手整合在一起。Acrobat Studio 将支持一次上传最多 100 个文档,并将信息集中到一个工作区内。
据外媒 The Verge 报道,Adobe 的目标是让 Acrobat 不再只是 PDF 阅读和编辑工具,而成为支持
2025年08月25日
hi, 大家好, 我是徐小夕.
徐小夕【知乎专栏作家】掘金签约作者,定期分享AI创业,可视化,企业实战项目知识,深度复盘企业中经常遇到的500+技术问题解决方案。【关注趣谈前端,技术路上不迷茫】