4 月 24 日消息,硬件制造商 MINIX 本月 23 日宣布推出基于 NVIDIA(英伟达) Jetson Thor 系列模组的 T4000 / T5000 GenAI 迷你工作站。其拥有 Arm Neoverse-V3AE CPU 和英伟达 “Blackwell” GPU,配备至高 128GB LPDDR5X 统一内存。
MINIX T4000 / T5000 系列三维 139.3 × 131 × 76.8 (mm),采用金属 + 塑料机身,内置双涡轮风扇散热,总重 1420g,具备至高 2070 TFLOPS 的 FP4 稀疏算力,可满足 7B~70B LLM 本地推理的需求。
这两款 AI 迷你主机预装 1TB PCIe Gen4 固态硬盘,外部提供 2 个 10GbE 网口、Wi-Fi 6E & BT 5.3 无线网卡、2 个 HDMI 2.1 TMDS、4 个 USB-A 5Gbps、1 个 USB-C 10Gbps。
有点好奇,这个7B到70B LLM本地推理的具体速度能到多少tokens/s啊?有没有人测过类似配置的?
小白弱弱问一句,这种迷你主机是不是得配个特别大的电源啊?我看它功耗应该不低吧……不太确定。
去年折腾过类似的边缘AI盒子,装驱动和部署环境那叫一个酸爽,尤其是Arm架构的,好多包都要自己编译,希望这个生态能好点。不过双万兆口对于需要高速数据吞吐的应用场景,比如做多路视频流分析,确实是刚需,省了外接网卡的麻烦。
又是这种“迷你主机”,怕不是个大火炉。双涡轮风扇,噪音估计起飞,还1420克,这都快三斤了,放桌上都嫌占地方。
最近正好在调研边缘AI设备做本地大模型部署。我们项目需要处理一些敏感数据不能上云,之前用Jetson Orin感觉内存有点吃紧,这个128G统一内存挺吸引人的。就是不知道软件栈和CUDA支持跟上了没有,Blackwell架构的驱动现在完善吗?
操作大概是这样:拿到机器先刷官方提供的系统镜像,然后按照NVIDIA Jetson的文档配置环境,装好CUDA和TensorRT,最后用LLM的推理框架比如vLLM或者llama.cpp进行部署和测试。
哎,昨天刚买的游戏本,感觉瞬间不香了。这配置跑AI是不是比我的笔记本强多了?话说回来,这玩意儿能打游戏吗?
7B估计有30 tps吧 70B就难说了 看显存够不够
双万兆口配Jetson Thor,价格肯定不便宜,企业用户可能更合适
之前测Orin跑70B量化版大概十几个每秒,Thor翻一倍应该有戏
minix
17
Jetson Thor 128GB统一内存对本地LLM部署友好,性价比看价格
7B本地估计30-50t/s,70B量化后大约10-15t/s
朋友之前测过类似平台,70B量级单卡也就几个token每秒