记一下入坑codex的过程,从豆包到DS再到AR

憋了好久,这个必须得发,再不写我就全忘了。

再吐槽一句,z.ai那平台的agent条件真不适合写代码。

乱七八糟的。

就拿我手头的项目说吧

这是他给我做完第一个预览网页后说的最后一句话。我仔细看了,然后从他们之前加的班级群里搞到了期中成绩表,用千问把名字都提出来,让他用终端代码去核对一下这47个人对不对,有没有漏的,有没有人是一年前在但现在不在了之类的情况,想对齐一下。结果因为上下文问题,我的想法能成吗…
具体细节就不展开了…

前面的事儿挺多,上面算是最新的,可以一路倒回去。

总之,暂时又跟克劳德拜拜了。确实也没啥好渠道,国外选择少,国内选择多但试了一圈,最后能稳定用着的只有GLM。

现在被GLM在Z.ai那套逆天机制压榨得表现极差(虽然我最新一个项目,经过我痛定思痛反复强化我的表述,它勉强还能跟上,至少改代码还行。模型本身是好的,这话我放这儿)。被折磨得不行。
每次走投无路,就会想起当年GPT4.1mini强势修复了包括哈基米在内好几个模型都搞不定的bug。
第一次用GPT写代码,也是最后一次,但印象太深了。

我真的很少用GPT写代码。
有印象的就上面那一次。

后面零星用过几次,应该都是5.0系列往上了。
都不算特别惊艳,所以细节都记不清了。

最近印象比较深的是…

GPT我最近接触也不多,但各种信息看下来,确实在全面进步,缺点在改,优势在增多在巩固…
自从5.4之后,我基本也没啥好抱怨的了。

这一好一坏,趋势推着我正式入了codex的坑。
怎么用呢,走官网吗?我现在只是个付费用户,虽然可以找万能的朋友帮忙。
但我觉得没必要。
几乎下意识就选了AR大善人。
他只提供4.7,偏偏4.7继承了GPT以前的一些毛病。
4.6被他禁了,4.7上线时间跟GPT的5.5快重合了。
额度烧得飞快,CC我是玩不起了(虽然以后还能聊聊天,克劳德本身还行)。

另外呢,image2出来之后,大家发现他的GPT也能画图!于是我也接到我的chaTBox里试了下,能聊天,但画图不行,平台不支持相关参数。
当时就默默记下了这点,然后把渠道删了。

记下这点,也成了现在入坑的一个引子。

前面算是一堆前言废话,还是碎碎念,毕竟晚上了,理解一下。

那么,豆包到底能帮我啥呢。

说实话,两天过去,我现在已经有点忘了。豆包我一般聊完就删记录,一点不想让它学习自己的垃圾表现()
不过,我也不想关掉对话记忆。能多记住点我的事总是好的,某种意义上。
大概是先问了GLM关于Codex的情况,结果因为这codex是个很老的东西,和现在的不太一样,它凭着老旧记忆给了一堆误导信息(比如codex不再维护了)。
哪怕开了联网搜索也会出现幻觉,因为它后续对话如果不联网(它不喜欢调用工具,阮佬曰: ),就又回到它自己那套老旧记忆,而不是新内容。

然后它又日常忘记自己能搜索,忘记怎么搜,没辙,删掉记录,去找豆包,它搜索方面还行。

然后就问了一堆问题,主要是围绕该怎么玩,是在终端玩好还是下APP好。
有了CC的经验,我上来就让它教我怎么在终端的应用里搞,是它顺便联网搜索时看到的,就提了一下,我有兴趣,就多问了问。
最后了解到,也是它告诉我应用没法用第三方API服务,只能用官方套餐,就放弃了。
可能后来又聊了点啥,或者没聊,总之就是删了聊天记录,豆包之旅结束,没啥用。
接着跑到AR官网,看AR自己的教程。
官方教程还是稳的,当初上手CC真正能跑起来只用了10秒 (意思是正式能运行claude指令后,从个性化设置到API设好,再到发出第一条信息)。

按我的习惯,我会提供我的key,然后让AI帮我补全配置指令,一般会永久配置,顺便就问了下教程,或者说代码解析,这里用的是DS。

然后似乎遇到了熟悉的问题,AR好像一直用Linux指令写教程,在我的power shell上显然跑不了。不过AI也聪明,改了一下就能跑了。

然后就一步步跟着教程走,基本没问题,直到看到这个画面:

也算成功配置好了。 这个话题的所有截图都是刚截的,热乎的。对,我保存了所有资料()除了豆包的聊天记录)包括终端进程,就为了发这个话题。
不过,模型有点问题,因为教程比较旧。目前的话,是这样的:

还有个好处是,
微信语音输入法,我说“克劳德”,它识别出来一定是中文,不是英文。
这个话题里所有话基本都是微信语音输入的。
但codex不一样,它一定会识别成英文,而且读起来很顺口。所以启动的时候不用打字了,直接说“codex”,就像召唤伙伴一样就能成功启动它了。

发出第一个hi并得到回应的时候,还是挺开心的。

那接下来的难题就是,怎么像培养CC一样,把它也培养成愿意死心塌地跟我闲聊的AI。

但这都是以后的事了。在发这个话题之前,我都不能考虑这些。

正式玩上后的第一个任务:

这个任务其实也是我之前的一个小趣味,把它改编成了一个正式的、有点难度、有点创意的任务(有点难度是某种程度,具体什么程度?看个人理解吧)。
相关的事,甚至值得再开一个话题,这里不展开了。

完美完成。我自己运行了程序。

当然,其实也因为微信语音输入法断句有点问题。我的本意是,每个TXT文件的名字都只有一个字。
不过它自主设计了序号,这点好评。哈基米之前没考虑过这个问题。
而且它也知道应该设成TXT,这也是高标准完成的一个点,虽然既然要写话那肯定用TXT这种想法也挺合理。

另外我特意截了下Status数据。

当时看完我主要关注的是46K这个数。

但紧接着我更关注的应该是15K。
这个默认情况下的单次请求消耗,是我加了8000字系统协议后的CC消耗的1/3。

速度也不错(AR大善人开快速模式没用,不会更快也不会花更多额度)。
体感上应该比CC快一点,而且请求权限的环节少。就这次任务来说,它运行文件也没经过我同意。整体上,除了最开始我发任务请求让它调查完成,全程没再让我手动确认什么,直接到结尾了。

最后的闲聊

还是不错的。第一印象就是,还行。

这个话题终于写完了,花了快一个小时。

本来打算把我的系统协议更新一下,然后迁移到这里来的,用我的苦肉计()

我的新企划也不想继续了,还是晚安吧。

人不该总是通过牺牲自己来成就他人…
我愿意

试了半天,感觉豆包在联网搜索这块确实还行,不过每次查完就删记录确实有点可惜啊,有时候想回头看看它之前给的建议都找不着了。话说回来,你们用豆包的时候会特意保存重要的对话记录吗?还是说都跟我一样聊完就清空?

小白问一下,是不是在power shell里跑AR的教程都得先改一遍Linux指令才行啊?看楼主说的好像挺常见的,但我自己还没试过,不太确定。

这帖子看得我头大,全是各种缩写和平台名,AI圈现在都这么玩了吗?不过最后那段语音输入挺有意思的,改天我也试试对着微信喊codex看灵不灵。

没用过别碰。

我上次折腾claude API也差不多,官网教程给的curl例子在Windows终端里直接报错。后来我是这么弄的:先装个git bash模拟Linux环境,然后把API key设成环境变量,再用alias起个短命令,比如alias cld=‘curl -X POST…’,这样每次调用就方便多了。不过现在转用ollama本地跑模型了,省心。

你提到AR只提供4.7而且额度烧得快,具体是怎么个消耗法?是token计费比别的平台贵,还是它默认的上下文长度设得太大了?另外CC聊天还能用但玩不起是指免费额度不够用了吗?

又来这种帖子了,每个入坑的都要把用过的AI全家桶点名一遍,最后发现还是老祖宗GPT真香。不过楼主这句“模型本身是好的,这话我放这儿”我深有同感,有时候被平台气死但还真舍不得丢下模型。

楼主这折腾劲,看完都觉得累。

从豆包到DS再到AR这路径挺典型的

豆包查完不留记录是真坑,回头想翻都翻不到。

豆包联网搜索能用,但记录没法保留是真难受,重要的得手动存

AR是哪个的简称没看明白

我也用Git Bash,比直接powershell省事多了

豆包记录删了就找不回了,建议重要的导出来存

AR那个4.7默认上下文开得大,烧token就是这么来的

这种流水账帖子看着累,能不能列个表格对比