基于 MCP 实现和具身人、无人车、无人机的大模型交互。
graph LR
A[用户] --> B[人机界面:语音对话/键盘交互]
B --> C[FastMCP 工具层]
C --> D[HUTB 模拟器 API 客户端]
C --> E[Deepseek AI]
style B fill:#e1f5fe
style C fill:#ccffcc
style D fill:#fff3e0
style E fill:#f3e5f5
运行推荐的软硬件
- Intel i7 gen 9th - 11th+ / AMD ryzen 9+
- +16 GB 内存
- NVIDIA RTX 3070+
- Windows 10/11
下载 HUTB项目中的hutb_v1.0.zip文件,解压到WindowsNoEditor文件夹下,双击 hutb.bat 启动模拟器(能够在未安装Python和UE4的情况下启动)。
加上语音识别和合成的整个工作流依次包括:麦克风 /Web浏览器、 语音 识别(方言、老人言: PaddleSpeech )、QWen/DeepSeek 大模型、流式语音合成 PP-TTS (语音播报/控制模拟器的模型或实体机器人)。
