1. 首页 >> ChatGPT教程 >>

怎么用 ChatGPT 和你的卡片笔记对话?开源利用 Quivr 尝试


chatgpt中文版 http://chatgpt.guige.xyz 

卡片

我非常喜欢使用卡片笔记。其优点明显,例如能显著减轻写作压力。在你面对空白屏幕时,写一篇文章的压力可能会很大,而随时三言两语记录卡片笔记则显得更加轻松。由于笔记以卡片情势存在,可以进行大量重组复用,对内容输出来讲,非常友好。

但是,卡片笔记也会带来一些问题。信息分散在许多卡片中,在查找和使用时增加了困难。为了解决这个问题,现有的卡片笔记工具普遍采取了双链方法。

双链将笔记之间进行链接。当我们需要查找笔记时,不再仅仅依照关键词搜索,而是找到某一篇笔记作为种子,然后沿着链接指出的路径和聚簇关联,找到相关的卡片,并且进行整合输出。Obsidian,Roam Research 和 Logseq 等卡片笔记工具都提供了这样的双向链接功能。

疑问

近一段时间,我在知识星球和公众号后台经常收到读者的疑问:能否将 AI (例如 ChatGPT)与我们的本地卡片笔记库进行交互?这样就能够获得与特定主题紧密相关的诸多卡片内容,并将它们有机地整合。然后利用 ChatGPT 的自然语言问答交互能力,让 AI 以流畅、清晰、准确且综合的方式,回答我们的问题,构成独有的知识输出。


回答这个问题有些困难。单一文档的问答对话已有很多解决方案,例如我之前推荐过的 ChatDoc 等。但是,要从多文档中综合提取信息,ChatDoc 弄不定。好用的多文档问答工具倒是现成的,例如 ChatBase 。

好用归好用,价格却不能疏忽。ChatBase 最低月费是 19 美元。

一开始我觉得 19 美金 / 月这价格虽然不低,但如果能提高用户工作效力并带来竞争优势,也许值得。但是,我看到这篇作者的访谈后,就改变了想法。

作者视察到大部份用户一上来都选择了最低挡位的19美金,但是很快要末提高定阅等级(多交钱),要末干脆不续订了。这表明19 美元的月定阅费对大部份人来讲,根本不够用

好在我最近发现了一个新的利用,能以经济实惠的方式为大部份用户提供多文档对话功能。


利用


这款工具叫做 Quivr ,网址在这里。


使用之前,你需要先设置你的 OpenAI API 密钥,然后选择相关的模型。我建议你选择gpt⑶.5-turbo⑴6k模型,由于这个 6 月 13 日更新的模型 token 最大长度有显著提升,可以大几率避免答案中途平白无故截断。


使用 Quivr 的进程里,你仍然要为调用 OpenAI API 付费。但是比起 ChatBase 19 美元起的月费,这个本钱就显得微不足道了。

上传


Quivr 的界面简洁易用,用户可以将一系列文档拖拽上传,或直接指定某个网址,它自己帮你爬取网站信息。这样一来,你就能够轻松愉快和自己的卡片笔记对话了。

为了演示方便和保护隐私,我上传了之前发布在公众号和知识星球、小报童的一些文章。如果这款工具可以妥善处理文章这样的长篇材料,那末卡片笔记篇幅短小,更是不在话下。

除文本和 Markdown 文件,Quivr 还支持其他类型的文件,如 PDF、PowerPoint、Excel、Word,乃至音频和视频。这意味着用户可以上传各种区别的材料和类型,然后统一进行发问,我认为这个设计准确捉住了知识生产用户的痛点。

在上传进程中,工具会提示哪些文件已成功上传。我上传的都是 markdown 纯文本文件,体积不大,很快就完成了。

Explore选项下,我们可以检查已上传的文件,确认没有遗漏。

用户还可以通过图表查看当前存储空间的使用情况。如果你使用的资料都是 Markdown 文件,这 200 MB 的空间应当能用一段时间了。


至此我们的资料已上传好了,下面可以开始发问了。

发问

我首先询问我的知识库中包括哪些 GPT 的利用介绍。

Quivr 返回了四个结果,其中前三个还算准确,而且明显不是来自单一文件,而是综合了多个文件的信息。除过于笼统的第四个答案,我整体比较满意。

我接着发问 GPT⑷ 在编程上能提供何种帮助。它根据我的资料列出了一些具体利用,如代码解释器和Github Copilot Chat等。

只是我不明白答案第二项这个自动化论文评分(AES)是啥,我没写过啊?结果在 Obsidian 里面一查询,发现是《AI 写文献回顾,好使吗?》一文中援用的 GPT⑷ 给出的答案。难怪,哈哈。

我进一步发问,哪些 GPT 功能和 GPT 插件可以用于科研文献回顾,并要求它给出综合结果并列出原始信息。

Quivr 将GPT 功能和GPT 插件(分别来自两篇区别的文章)分开处理,分别提供了来源。但是,我发现 Quivr 并未列出具体的文档名,而且部份结果存在误导,如将 Wolfram 误为文献回顾的插件。

我怀疑多是我的提示词有误,因而我对提示词进行了修正,并提出新的问题。

这次我要求综合结果、具体细节,还要求了原始信息。

下面是 Quivr 的回答:

这答案看完,我很是振奋。首先 Quivr 确切综合了大概 4 篇文档的内容,而且都进行了梳理提炼,在答案中列出这些原始文件名称,使得我们验证答案变得更加容易,也为进一步的知识发掘提供了基础。

特点

另外我发现 Quivr 还保存了历次对话,以便于用户随时回顾和分析历史信息。这个功能可以帮助你不断与自己的卡片笔记库深入对话,找到深层次的洞察,发现可能被疏忽的问题。

Quivr 是完全开源的,你可以在 GitHub 上找到其源代码仓库。

Quivr 为用户提供了在本机部署服务的方法,使用的是 Docker。如果你有需求,可以依照官方教程操作。

LangChain

我们扼要介绍一下 Quivr 所使用的技术。它的基础框架是 LangChain,这是一个在 GitHub 上特别受欢迎的库,评价超过 5 万颗星,月下载量过百万。



LangChain 这个库的优势在于解决了人们使用大型语言模型时重复性操作问题。深度学习中求导、反向传播等重复性操作很恼人,因而催生了 TensorFlow 和 PyTorch 这样的深度学习框架。一样,LangChain 也在事实上成为 LLM 利用领域的通用框架,你在目前海量出现的 LLM 利用中,大多都能看见它的影子。

如果你对 LangChain 感兴趣,我推荐这门由 Deep Learning AI 和 LangChain 官方联合推出的不要钱课程。

虽然这只是一门基础课程,但学过后你可以对一些已存在的项目进行修改调剂,满足你自己的利用需求。

安全

我知道读到这里,又有读者要跟我聊隐私数据泄漏问题了。有人坚持认为一调用 OpenAI API ,你的数据就会被科技巨头收割。在 ChatGPT 科研预览版阶段,这样的担心确切很有必要。我在去年 12 月第一次介绍 ChatGPT 的时候就专门提过。不过我们也要注意与时俱进。自 2023 年 3 月 1 日起,OpenAI 在数据政策上已做出了重大的调剂。

通过 API 上传的数据其实不会被 OpenAI 用于训练或改进模型,除非用户明确要求这样做。由于法规要求,OpenAI 会保存你通过 API 上传的数据 30 天,然后删除。

如果你就是对数据隐私高度敏感,没法使用 OpenAI ,Quivr 也能帮到你。最近它已支持了开源模型 GPT4All 。这个模型我之前给你介绍过的,在笔记本上就可以运行。虽然处理复杂认知问题,GPT4All 相较于 GPT⑷ 还有相当的差距,但是对若干份文档抽取重点做出解答,还足够胜任。


随着更多的本地化模型和开源模型的加入,个人和机构的知识库也能够完全在本地利用 Quivr 进行知识检索和问答,而无需担心数据隐私泄漏。


小结

今天我为你介绍了利用 ChatGPT 与你的卡片笔记库交互的不要钱开源软件 ——Quivr。从卡片中提取内容时减少手动查询操作,更减轻了你输入卡片时的整理压力。与 ChatBase 等利用相比,Quivr 不要钱开源。它支持多种文件格式,还可使用本地开源大语言模型 GPT4All 等。希望它能对你的知识管理起到帮助。

桂&哥&网&络www.guIgEge.cn

本文来源于chatgptplus账号购买平台,转载请注明出处:https://chatgpt.guigege.cn/jiaocheng/29151.html 咨询请加VX:muhuanidc

联系我们

在线咨询:点击这里给我发消息

微信号:muhuanidc

工作日:9:30-22:30

X

截屏,微信识别二维码

微信号:muhuanidc

(点击微信号复制,添加好友)

打开微信

微信号已复制,请打开微信添加咨询详情!