拾柒

毛老爷子，请来教下我，这场持久战怎么打！！

1月前阅读 122

取消

拾柒

vllm-playground + Gemma4 模型部署问题排查与解决报告排查时间：2026 年 4 月 19 日 — 4 月 20 日部署环境：大脑服务器（192.168.51.70），NVIDIA RTX 4090 48GB涉及组件：vllm-playground、vLLM (Docker)、google/gemma-4-E2B-it、ModelScope一、问题概述在 vllm-playground 上部署 Google Gemma4（google/gemma-4-E2B-it）模型，目标是：通过 ModelScope（魔塔）下载模型（网络原因无法访问 HuggingFace）充分利用 48GB GPU 显存，支持长上下文（max_model_len）和长输出（max_tokens）通过 vllm-playground Web UI 进行交互共发现并修复了 6 个关键问题，涉及镜像版本、OOM、输出截断等多个层面。二、问题列表与解决方案问题 1：vLLM Docker 镜像版本过旧现象：vllm-playground 默认使用 vllm/vllm-openai:v0.12...

vllm-playground + Gemma4 模型部署问题排查与解决报告

1月前阅读 364

取消

拾柒

ROCm 7.2.1 + RX 6900 XT 排障记：当显卡变成"哑巴"引子给家里的 Ubuntu 机器装了 AMD ROCm 7.2.1，硬件是一块 RX 6900 XT（16GB，gfx1030，RDNA2 架构）。安装过程很顺利，rocm-smi 能看到卡，温度正常，显认正常。但当我跑 rocminfo 的时候，它冷冷地甩了一句：HSA_STATUS_ERROR_OUT_OF_RESOURCES: The runtime failed to allocate the necessary resources.GPU 认到了，但用不了。就像一个站在那里的哑巴——嘴在，但说不出话。第一层：显卡的"算力"去哪了？我用 rocminfo 看 KFD（内核融合驱动）的拓扑，发现一个诡异的现象：RX 6900 XT 被注册成了一个零算力设备：simd_count: 0 ← 应该是 160 gfx_target_version: 0 ← 应该是 100300 gpu_id: 0 ← 根本...

ROCm 7.2.1 + RX 6900 XT 坑多多

1月前阅读 407

取消

1人

ai小虾米感谢大佬的无私分享，同6900XT也遇到rocm安装问题，通过大佬的方法解决了

拾柒

飞牛 NAS 故障复盘适合：技术博客发布 / 提交官方工单附件目标：不仅讲结论，也讲“怎么排查、怎么修、怎么验证”1. 环境与问题概述设备：两台飞牛 NAS（记为 NAS-A、NAS-B）更新后主要问题：SMB 显示开启，但共享“可发现不可访问”文档服务 trim-docs-pgsql 启动失败一台机器出现持续 soft lockup 内核告警2. SMB 故障：完整排查与修复步骤2.1 现象确认（先不改配置）A. 检查端口是否监听# 在任意同网段终端 nc -vz NAS_IP 139 nc -vz NAS_IP 445端口不开：优先查服务未起端口开但打不开共享：优先查 Samba 日志与配置B. 检查 SMB 服务状态systemctl is-active smbd nmbd smb systemctl status smbd --no-pager -n 50C. 查看关键日志journalctl -u smbd -n 120 --no-pager | egrep -i 'trim_perms|vfs_init failed|error loading modu...

飞牛 1.1.19 NAS 升级后的连环故障排查及解决方案

3月前阅读 731

取消

拾柒

想走的路不好走，想做人不好做。都说身不由己，不是废话吗？己不由心，身又岂能由己？好自为之吧。

查看全文

5月前阅读 429

取消

拾柒

拾柒

最新文章