基于 RTX 5090D 集群 + Mac Mini 矩阵
总投资 64万元 · 自建机房 · 跑通 HappyHorse 视频生成
中国AIGC核心市场规模2025年达805.8亿元,AI视频生成成为增长最快的赛道
RTX 5090D 为核心 GPU,Mac Mini 为 LLM 推理矩阵
| GPU | RTX 5090D 32GB × 4 |
| CPU | AMD Threadripper 7960X 24核 |
| 主板 | ASRock WRX90(128条PCIe通道) |
| 内存 | 256GB DDR5 ECC |
| 电源 | 2000W 80+ Titanium |
| 存储 | 4TB NVMe + 16TB HDD |
| 散热 | 360mm水冷 + 涡轮版显卡 |
| Mac Mini M4 Pro 64GB | × 8台 |
| Mac Studio M4 Max 128GB | × 1台 |
| 统一内存合计 | 640 GB |
| 推理框架 | Exo + Ollama + MLX |
| 可运行模型 | 70B-120B+ 量化模型 |
| 并发能力 | 20-40用户同时在线 |
| 功耗 | 全部仅 ~500W |
5090D 是性价比最优解 — 32GB显存 + 正规渠道 + AI性能碾压4090
| 指标 | RTX 4090 | RTX 5090D ⭐ | H100 |
|---|---|---|---|
| 显存 | 24GB GDDR6X | 32GB GDDR7 | 80GB HBM3 |
| 显存带宽 | ~1 TB/s | ~1.8 TB/s | 3.35 TB/s |
| FP8 AI性能 | ~660 TOPS | ~1800 TOPS | ~3958 TOPS |
| TDP 功耗 | 450W | 575W | 700W |
| 中国市场价 | ~2-2.5万(已停产/假货多) | ~3-4万(正规渠道) | ~15-25万 |
| 跑 HappyHorse 全精度 | ❌ 需量化 | ✅ 32GB够用 | ✅ 充裕 |
| NVLink | ❌ 不支持 | ❌ 不支持 | ✅ 支持 |
| 性价比评分 | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐ |
自建机房 + 自有硬件,全部控制在 100万以内,实际约 64万元即可启动
| 采购项目 | 明细 | 金额(万元) |
|---|---|---|
| GPU工作站 A | 5090D×4 + TR7960X + 256GB | 22.0 |
| GPU工作站 B | 5090D×4 + TR7960X + 256GB | 22.0 |
| Mac Mini M4 Pro 64GB | × 8台 | 14.4 |
| Mac Studio M4 Max 128GB | × 1台 | 3.5 |
| 🏠 自建机房改造 | 空调×2 + 配电改造 + 机架 + 门禁监控 | 2.0 |
| ⚡ 工业电申请 + UPS | 三相380V接入 + 3kVA UPS | 1.0 |
| 🌐 网络 + 云服务器 | 商业专线(1年) + API网关 + 域名 | 2.5 |
| 软件开发 | API平台/计费/监控/前端 | 5.0 |
| 运营资金(6个月) | 人力+推广+杂费 | 6.0 |
| 合计 | ~64万元(预留36万弹性空间) | |
自建机房 + 工业电,月电费仅 600-2,400 元,比IDC托管省 50%+
| 设备 | 数量 | 单机满载 | AI推理实际 |
|---|---|---|---|
| 5090D×4 工作站 | 2台 | 2×2500W | 2×1800W |
| Mac Mini M4 Pro | 8台 | 8×65W | 8×40W |
| Mac Studio M4 Max | 1台 | 1×200W | 1×120W |
| 网络+UPS+散热 | — | ~300W | ~200W |
| ❄️ 空调制冷 (×2台) | — | ~2400W | ~1500W |
| 合计(含空调) | ~5.54 kW | ||
| 运行场景 | 日均小时 | 月用电 | 电费(元) |
|---|---|---|---|
| 🟢 轻载(白天8h推理) | 8h | ~1,330 kWh | ~660元 |
| 🟡 中载(16h运行) | 16h | ~2,660 kWh | ~1,330元 |
| 🔴 重载(24h满负荷) | 24h | ~3,990 kWh | ~2,000元 |
| 自建机房月总成本(电费+网络) | ~2,500-4,000元/月 | ||
| 地区 | 工商业平段电价 | 月电费估算 |
|---|---|---|
| 广东/上海/北京 | 0.7-1.0 元/kWh | 2,100-2,900元 |
| 中西部省份 | 0.5-0.7 元/kWh | 1,500-2,000元 |
| 宁夏/甘肃/贵州 | 0.3-0.5 元/kWh | 900-1,500元 |
8张5090D + Mac集群 可以同时跑视频生成、LLM推理、图像生成
| 单卡生成速度 | ~70秒/段(1080p) |
| 分配GPU数 | 4-6张 5090D |
| 每小时产能 | 200-300段 |
| 日产能(20h) | 4,000-6,000段 |
| 月产能 | ~12-18万段 |
| 硬件 | 8×Mac Mini + Studio |
| 模型 | Qwen3/DeepSeek 70B |
| 速度 | 15-20 tokens/s/用户 |
| 并发用户 | 20-40人 |
| 日处理Token | ~5000万 Token |
| 分配GPU数 | 2-4张 5090D |
| 模型 | SD3.5 / FLUX |
| 单张速度 | 3-8秒/张(1024px) |
| 每小时产能 | 400-1000张 |
| 月产能 | ~25-60万张 |
三条产品线交叉覆盖,LLM是利润基石,视频生成是增长引擎
| 服务 | 定价 | 成本 | 毛利率 |
|---|---|---|---|
| 🎬 视频生成(标清5s) | ¥1-3/段 | ¥0.15 | 85% |
| 🎬 视频生成(高清10s) | ¥3-8/段 | ¥0.5 | 80% |
| 💬 LLM推理(Qwen3-70B) | ¥5/百万Token | ¥0.8 | 84% |
| 🖼️ 图像生成(1024px) | ¥0.15/张 | ¥0.02 | 87% |
| 🔊 语音合成(Kokoro) | ¥0.3/千字 | ¥0.05 | 83% |
| 服务 | 客单价 | 毛利率 |
|---|---|---|
| 企业私有化LLM部署 | ¥5-20万/套 | 50-65% |
| 电商AI内容工厂搭建 | ¥3-10万/项目 | 55-70% |
| 短视频批量制作 | ¥0.5-1万/批次 | 60-75% |
| 阶段 | 月收入 | 月成本 | 月利润 |
|---|---|---|---|
| Month 1-3 冷启动 | 0.5-1万 | 1.5万 | -0.5~-1万 |
| Month 4-6 增长期 | 3-5万 | 2万 | 1-3万 |
| Month 7-12 | 8-15万 | 3.5万 | 4.5-11.5万 |
| Year 2 稳定期 | 15-25万 | 5万 | 10-20万 |
全部可在本方案硬件上运行,按优先级排列
| 项目 | 类型 | 许可证 |
|---|---|---|
| HappyHorse-1.0 | 视频生成 ⭐ | 完全开源 |
| Qwen3系列 | LLM | Apache 2.0 |
| DeepSeek-V3.2 | LLM | 商用友好 |
| Stable Diffusion 3.5 | 图像生成 | 商用友好 |
| Kokoro-82M | 语音合成 | Apache 2.0 |
| ChatTTS | 对话语音 | 商用友好 |
| 项目 | 类型 | 许可证 |
|---|---|---|
| GLM-5 | LLM (长上下文) | 商用友好 |
| Gemma 4 | LLM (多模态) | Apache 2.0 |
| FLUX.1 | 图像生成 | 需核实版本 |
| Wan 2.2 | 视频生成 | 商用友好 |
| XTTS-v2 | 声音克隆 | 商用友好 |
| Bark | 多语言TTS | MIT |
| AudioCraft | 音乐生成 | MIT |
| Hunyuan3D v2 | 3D生成 | 开源 |
| 层级 | 技术选型 |
|---|---|
| 视频推理 | HappyHorse + ComfyUI |
| LLM推理 | Exo (Mac集群) / vLLM (GPU) |
| 图像推理 | ComfyUI + SD3.5/FLUX |
| 语音合成 | Kokoro / ChatTTS |
| 任务队列 | Redis + Celery |
| API网关 | One API / Nginx |
| 计费系统 | 自研 / New API |
| 监控 | Prometheus + Grafana |
| 前端 | Open WebUI + 自研管理后台 |
| 时间 | 里程碑 | 指标 |
|---|---|---|
| Month 2 | 系统上线内测 | HappyHorse可用 |
| Month 4 | 首笔收入 | MRR > ¥5,000 |
| Month 6 | 盈亏平衡 | MRR > ¥30,000 |
| Month 9 | 第一个企业大单 | 单笔 > ¥50,000 |
| Month 12 | 年度总结 | 年收入 > 80万 |
| Month 18 | 投资回收 | 累计利润 > 65万 |
| Month 24 | 规模化运营 | 年化收入 > 200万 |
| 风险 | 描述 | 应对措施 | 概率 | 影响 |
|---|---|---|---|---|
| 🔧 硬件故障 | GPU烧卡、Mac故障导致停机 | 双工作站冗余;Apple Care+;备用设备 | 中 | 中 |
| 💸 价格战 | 大厂降价或新竞品涌入 | 差异化定位:私有化+行业方案;不打纯价格战 | 高 | 低-中 |
| ⚡ 芯片迭代 | 新一代GPU出现,5090贬值 | 设备折旧2-3年即回本;新设备增量购入 | 高 | 低 |
| 📜 合规风险 | AI内容审核、数据安全法规 | 接入内容安全审核API;等保认证 | 中 | 中 |
| 👥 客户获取慢 | 冷启动期找不到付费客户 | 免费试用+电商垂直社群推广;私域流量 | 中 | 高 |
| 🔥 散热问题 | 4×5090D散热不良导致降频 | 涡轮版/水冷方案;双空调一用一备;自建机房可控温度 | 中 | 低 |
用传统方案 1/50 的投入,撬动 AI 算力商业化