关于Because在HiAgent上的智能体开发
我在HiAgent上开发了多个智能体,分别为解决不同方向的痛点而设计。我希望的是,无论是智能体还是开发过程中设计的一些工具,我都希望公开服务的信息要素能够打破网络壁垒,实现自由流动。
一、夏洛蒂
这是我第一个开发的智能体,且在第二次宣传的时候作为了学校推送的尾图。
设计夏洛蒂智能体的起因是,学校的官方网页数量如此之多,但是我们寻常只关注于手机平台的信息,很少将注意力专门放到网页之上。因此我希望能够设计一个信息聚合的智能体,能够快速找到、定位学校以往发布过的教务通知、奖学金公告等等。
在设计和编写逻辑的过程中,我也遇到了很多难题,比如,我要问最近的新闻,但是她返回的信息却是很久以前的。这个应该如何解决?又比如,智能体的数据库如何进行更新?
对于时间问题,我编写了一个日期插件用于获取当前的日期,在每一次查询的时候都会将日期放入进行筛选。而智能体的数据库我采用了已有数据+新数据动态更新的模式,以确保数据的可信之处。当然,很多问题不可能一次解决,而是需要不断的更新和打磨。
在后面,我不断优化我的数据采集工具,最终能获取到的数据比以往更加丰富。
'夏洛蒂'智能体数据源清单(第二版)
二、烟绯
设计烟绯的起因很简单,对于一个具有超强文字处理能力的智能体而言,什么领域能够发挥它的最大能力?我认为当属法律。因为律法往往是白纸黑字,讲求的是严谨和规则分明。
我使用了爬虫,下载了当前中国现行的法律法规300余部,并且分割具体的2万1千多的条例作为数据库。在搭建了夏洛蒂的基础上,搭建烟绯就轻车熟路,在给定了数据库和有关提示词之后,便完成了。
三、凝光
这大约算是我花时间比较多的一个智能体。整体模式上和夏洛蒂差不多,遵循:数据采集->数据基本处理->导入到数据库/知识库 的模式。
但是,我并没有做到太多细致的内容,而是专注于宏观层面的一些分析。我搜集了来自东方财富网上的券商报告、行业研报,之后使用智能体进一步提取其中的有效信息,设计一定的偏好后,最后汇总成为一篇完整的金融分析报告,实现了兼顾百家之言,明辨经济局势。
四、丽莎
做这个智能体,也是因为我和南开大学图书馆缘分很多。
我当时给她的定位是:
🎶一键查询图书馆座位;
🎶任意图书在馆查询,大致位置定位;
🎶热门图书推荐,可以按门类推荐图书,也了解图书馆热搜关键词;
因为很多时候,要想查看图书馆可用座位,首先需要链接校园网,然后使用飞书的南开微应用去查询,有点麻烦。所以我和吴某某同学合作,一起实现了OpenLibrary,即开放式查询南开大学图书馆。目前来看,这个目的算是达到了,图书馆的所有面向师生开放的功能都在NK-GenIOS的插件商店中可以使用了。
以及,我设计的可视化图书馆预约座位的在线面板:http://120.26.224.151:3393/
也是为了方便查询当前图书馆的可用座位。
五、智能体辩论
这个创意点子,源自我和吴某某同学的讨论中。因为我们想知道,智能体的思辨能力和语言能力究竟到了什么地步?
因此我搭建了一个智能体的辩论框架并且开源:
飞书文档:https://nankai.feishu.cn/drive/folder/GqZzfVNbClOqxIdMg8Tc01iGn3d?from=from_copylink
GitHub:https://github.com/Because66666/debate_model
目前一共进行了8场辩论赛,记录见:https://nankai.feishu.cn/drive/folder/MCh5ffdivlrC1Pdyz0Icr9kgn5b?from=from_copylink
在智能体辩论过程中,我发现推理模型相比以往的通用模型占据了更大的优势,思辨能力更强。以DeepSeekR1和QwQ-32B为首的推理模型在辩论过程中提出了很多非常精彩的观点,例如在勾股定理是定理还是定义?(QwQ-32b)中,反方提出的:“数学定义的选择永远基于人类对世界的认知框架,而勾股定理正是欧氏几何最优雅的元定义!”非常精彩。
在辩论过程中,我也不可避免的遇到了大模型幻觉问题。尽管我在开发智能体的时候接入了联网搜索以减轻幻觉程度,但是这类问题难以根除,且幻觉程度跟辩论的命题有很大的关系。
六、我开发过的工具
俗话说,“磨刀不误砍柴工”。除去我之前提及的一些工具之外,我还开发了智能体-统计-日志-对话内容的下载与保存工具:https://github.com/Because66666/Download_higent_history
因为当智能体平稳运行之后,我需要从后台批量收集智能体的对话记录,导出后进行阅读和评判,以确定之后的改进方向。
之前,也因为智能体接入网络的问题,图书馆接口的想法,我也开发了一些插件上架到了NK-GenIOS平台上,收获广泛使用。
七、我对AI的一些思考
超强的文字处理能力,庞大的知识库,以及有一定的推理能力,这是当下AI取得的成就。目前的AI基座的发展已经超乎想象,AI的应用开发更是有丰富的想象力。我最近分别让两位顶尖AI(DeepSeekR1和QwQ-32B)做了2025年的考研数学一的试卷,均达到了135~145分的高分水平。(见2025-考研数学一)
也许我们不仅仅把它当作一个助手,而是把它当作一个划时代的生产力更为合适。前沿AI圈基本每周都在狂欢新的技术,拥抱新的人工智能服务,畅想新的可能。DeepSeekR1的发布仿佛还在昨日,深圳的首批智能体公务员已经上岗为政务加速,Manus带来的全自动化通用人工智能更是让我们窥见未来的一角。越来越多的人都开始思考这样一个问题:AI的能力这么强,我们应该如何从事什么社会分工,来实现自己的价值?
我问过AI,它并不能给出令人满意的回答,只是一昧按照以往的经验,说汽车代替了马车,取代了马车夫但也带来了司机一职。但是我认为这种说法在manus面前显得苍白无力。无论是查学术文献写综述,还是对上市公司进行调研,亦或者进行有偏好性的简历筛选,它都能完美胜任。
后面我和不同的人交流过,和老师也交流过,想明白了这一件事:在实现了AI平权之后,我们应该做的是创新,而创新的高度取决于自己知识的深度,正如普通的司机并不会绘制出人工智能的基本蓝图。
但是走向AI平权的道路上并不是坦途。AI的信息污染已经相当严重,以图片检索为例,在结果页面上你又能找到多少非AI生成的图片呢?
以及,还有一些潜在的风险,比如AI如何接管工作,对于这种近似科幻小说的剧本,却有着接近现实的意义。
无论如何,我们都需要向前看,顺应时代潮流去学习,去创新,去通过AI来将自己的想法变为现实。
声明:全文为作者手敲,无AI生成文本内容。