<< 2025-03-09 | 2025-03-11 >>
工作
成果和进展:
- 在云服务器上部署了 DeepClaude 项目,供技术部的同事们使用。
明日工作安排:
复盘:
- 云服务器还是挺好用的,之前买的 NAS 真是买对了。
生活
流水账:
- 早上照例煮了玉米和鸡蛋,还热了一杯牛奶。不过说到这个玉米,真是让我有点反胃。随机掰开两个玉米,发现坏的地方都挺多,看不下去把剩下的全扔了,这次就当是吃一堑长一智吧。
- 之后我就去上班了,写好了 2025-03-06 和 2025-03-07 的工作日志,然后顺便研究了一下波哥在 MEET ENVDAMA 上推荐的一些他觉得不错的技术。有一个叫 DeepClaude 的项目很有意思,它是把 DeepSeek 和 Claude 两个模型结合在一起,前面用 R1 的推理模型,后面接 3.7 的输出模型,结合两者的优点进行输出,效果比单一模型要好的多。还有一个项目是 DeepResearch 的开源模型和它的 UI,看起来也挺有意思的。之前波哥自己写的同类项目就很牛,OpenAI 和 Google 都有自己的类似项目,而且效果都还可以,所以这个开源的我也想试试,暂时先🐎了一下。
- 后面主要在研究 DeepClaude,因为这个同事们都用得上。于是我就按照官方说明,一步步跟着部署。整个过程还挺方便的,先把它下载到本地,配置好之后跑了一下,发现效果不错。在 Cherry Studio 上有 DeepSeek-R1 的思考过程,加上 Claude-3.7-Sonnet 的输出确实有所增强。除了推荐的编程可以用之外,官方还建议后面的输出换成 Gemini-2.0 的两个模型,可以用于日常和创作之类的,而且还是免费的量大管饱啊。
- 不过,如果想让部门都用得上的话,肯定得部署在云服务器上,我也不会一直开着电脑本地跑的。正好我自己有一台华为云的服务器,反正闲着还不如拿来发挥下。于是我就上去部署了下,但发现需要配置一些环境,比如 Python 和 UV 等工具之类的。下载和安装这些工具花了我一些时间,毕竟系统不是 Windows,我只能根据报错让 AI 帮我解决。等前置的安装完成后,开始部署整个模型,还算顺利地给它弄好了,但测试时发现只有回答的输出,缺少了前置的思考过程,这让我觉得有点奇怪。所以我让小付哥换平台也试了一下,结果发现还是不行,这次直接是报错了,连回答的都没有生成。我一开始怀疑是不是模型设置有问题,或者是我填错了域名之类的,但检查后发现都没问题。又翻来覆去地检查了半天,甚至把模型改了,全部替换掉,但还是不对。我有点想放弃了,但后来想了想,我自己还有一个 NAS,或许可以先在上面部署一下,看看能不能用。结果是能用的,但问题是这个走的是 IPv6,而公司的网络只能用 IPv4,所以只能连手机热点,这条路算是走不通了。于是,我决定还是回去,到华为云的服务器上继续折腾。经过一番排查,终于找到了问题的根源——原来是我在填 R1 模型名字时出了错,把默认后面多的日期删掉就好了。搞定之后立刻把这个成果分享到了群里,让大家也去试试。
- 弄完这个之后,我就开始摸鱼了。主要研究了一些嵌入模型,比如 OpenAI 和阿里的。虽然具体细节我也不是很懂,但感觉阿里的模型挺不错的。所以就在 Cherry Studio 上配置了相关的嵌入模型,为了让它能读取我知识库里的内容。
- 后面继续尝试解决昨天那个阅读提示词的问题,整个过程真的是一言难尽。即使下班回到宿舍后,我还在琢磨这件事,但始终没有找到有效的解决方案。说实话,效果还不如之前让 GPT-4o 逆向的结果,重点是重新来一遍也不行。看来这件事挺看运气的,最后当然只能继续使用原来的版本。
- 晚上看了会《鹅鸭杀》的直播,还是很有意思的,看得我津津有味。不过,明天我和深甫哥一起出差,得早起赶车去他那先,只能早点休息,10 点半就睡了。
情绪:
- 尽管在部署 DeepClaude 项目到云服务器的过程中,因为多次遇到障碍会有些 烦躁 ,但是是在工作中搞这些东西,也算是摸鱼的一种方式了,所以心情也还好。
感恩:
- 感激波哥的技术推荐,拓展了我们对 AI 的使用。
- 特别感激小付哥,在 DeepClaude 测试期间一直配合我,给了我很多宝贵的反馈。
- 感谢 DeepClaude 这个项目,融合了 DeepSeek-R1 和 Claude-3.7-Sonnet 或 Gemini-2.0 等优势,确实能生成更好的回答。
- 感谢 Vercel 等自部署服务,免费让我运行了很多好用的服务。
- 感谢猪猪、崔姐、轰轰、童姐、布姐、芒果、三哥、波神等人的直播,《鹅鸭杀》新地图也很有节目效果,看的超级搞笑。
成就:
- 在云服务器上部署了 DeepClaude,为技术部引入了更强的模型。
- 用 Vercel 部署了 DeepResearch,为后续搜索提供更好的方法。
- 本来 DeepResearch 推荐的部署服务是腾讯云外站的,又要重新注册很麻烦,但机制的我放到了 Vercel 上也能完美运行。
- 在 Cherry Studio 上配置了阿里的嵌入模型,能用于知识库内容的读取。
- 早睡。
反思:
- 不能贪便宜啊,🌽的教训很深刻。