分类技术文章下的文章

拾柒

vllm-playground + Gemma4 模型部署问题排查与解决报告排查时间：2026 年 4 月 19 日 — 4 月 20 日部署环境：大脑服务器（192.168.51.70），NVIDIA RTX 4090 48GB涉及组件：vllm-playground、vLLM (Docker)、google/gemma-4-E2B-it、ModelScope一、问题概述在 vllm-playground 上部署 Google Gemma4（google/gemma-4-E2B-it）模型，目标是：通过 ModelScope（魔塔）下载模型（网络原因无法访问 HuggingFace）充分利用 48GB GPU 显存，支持长上下文（max_model_len）和长输出（max_tokens）通过 vllm-playground Web UI 进行交互共发现并修复了 6 个关键问题，涉及镜像版本、OOM、输出截断等多个层面。二、问题列表与解决方案问题 1：vLLM Docker 镜像版本过旧现象：vllm-playground 默认使用 vllm/vllm-openai:v0.12...

vllm-playground + Gemma4 模型部署问题排查与解决报告

2月前阅读 482

取消

拾柒

ROCm 7.2.1 + RX 6900 XT 排障记：当显卡变成"哑巴"引子给家里的 Ubuntu 机器装了 AMD ROCm 7.2.1，硬件是一块 RX 6900 XT（16GB，gfx1030，RDNA2 架构）。安装过程很顺利，rocm-smi 能看到卡，温度正常，显认正常。但当我跑 rocminfo 的时候，它冷冷地甩了一句：HSA_STATUS_ERROR_OUT_OF_RESOURCES: The runtime failed to allocate the necessary resources.GPU 认到了，但用不了。就像一个站在那里的哑巴——嘴在，但说不出话。第一层：显卡的"算力"去哪了？我用 rocminfo 看 KFD（内核融合驱动）的拓扑，发现一个诡异的现象：RX 6900 XT 被注册成了一个零算力设备：simd_count: 0 ← 应该是 160 gfx_target_version: 0 ← 应该是 100300 gpu_id: 0 ← 根本...

ROCm 7.2.1 + RX 6900 XT 坑多多

2月前阅读 524

取消

1人

ai小虾米感谢大佬的无私分享，同6900XT也遇到rocm安装问题，通过大佬的方法解决了

拾柒

个人知识库构建：三阶段MVP开发指南本文将聚焦今天讨论的核心内容，为您提供一个从零开始构建个人知识库的简明路线图。我们将采用最小可行产品（MVP）策略，分三个阶段循序渐进地实现目标。整体架构：三阶段演进路线以下是个人知识库系统从基础到智能的核心构建流程，它展示了数据如何被处理并最终转化为知识：flowchart TD A[阶段一：文件自动整理] --> B[阶段二：内容识别与检索] B --> C[阶段三：文字生成任务] subgraph A[数据基础层] A1[文件监听与收集] --> A2[规则分类与存储] end subgraph B[智能检索层] B1[内容解析与提取] --> B2[文本向量化] --> B3[向量数据库存储] --> B4[相似性检索] end subgraph C[应用智能层] B4 --> C1[大语言模型集成] --> C2[任务自动化生成] end A2 --&...