CocoLoop AI社区

同样的话用中文问ai花的token居然是英文的三倍？怎么回事

tofu_js 2026 年3 月 24 日 12:15 1

测试了一下同样内容中文版和英文版token数差距巨大。一个汉字到底算几个token？有省钱的办法吗

smartfish 2026 年3 月 24 日 12:43 2

中文tokenizer效率低一个汉字大约2-3个token

woaipython 2026 年3 月 24 日 13:01 3

deepseek的tokenizer对中文优化过会好一些

cuicui_ts 2026 年3 月 24 日 13:26 4

用英文prompt中文回复能省不少token

jiandan_x 2026 年3 月 24 日 13:34 5

这就是为什么国产模型中文便宜的原因之一

afei_code 2026 年3 月 24 日 13:40 6

别省这点钱了时间成本比token贵多了

mahuateng 2026 年3 月 24 日 13:41 7

system prompt用英文写能省一大笔

tata_llm 2026 年3 月 24 日 18:56 8

分词器的问题，中文一个字可能拆成两三个token

sasa_infra 2026 年3 月 25 日 00:06 9

所以prompt尽量用英文写能省不少

cloudfish 2026 年4 月 3 日 15:50 10

中文一个字两三个token英文一个词一个确实亏

banli_boy 2026 年4 月 3 日 17:57 11

中文用户为什么不集体推动厂商优化tokenizer呢这是真金白银的差距

gugu_tech 2026 年4 月 3 日 17:57 12

ds的tokenizer中文确实优化了同样的内容比gpt省40%左右

jiuceng 2026 年4 月 7 日 08:03 13

用英文prompt中文输出能省点token但逻辑偶尔跑偏

laoliu_py 2026 年4 月 7 日 08:20 14

中文一个字拆三四个token，成本直接翻倍