项目记录 · 2026

互联网人类图鉴
提示词生成器

从一个 AI 生图提示词模板出发,我构建了自己的第一个 Hugging Face 应用—— 上传一张照片,自动识别人物表情与姿态,生成风格统一的 3D 卡通头像提示词。

2026 年 5 月 → 在线体验
互联网人类图鉴 · 提示词生成器 界面截图

部署在 Hugging Face Spaces 上的应用界面

这个项目是什么

「互联网人类图鉴」是一个关于现代网络人格的观察项目——把每一类互联网人(深夜改稿设计师、AI 创业哥、小红书精致人类……)用夸张的 DreamWorks 风格 3D 卡通形象呈现出来,带着一种轻讽刺的博物馆观察感。

这个工具解决的核心问题是:风格统一。每次手动写提示词,生成的图风格都不一样。 于是我把固定的风格参数锁死,只让 AI 从照片中提取那些因人而异的部分(表情、姿势、人格原型), 自动填进模板——一键出词,直接去生图。

技术栈

Python Gradio 6 豆包 Doubao Vision API Hugging Face Spaces OpenAI SDK

构建过程

  1. 设计提示词模板
    把风格参数(材质、灯光、配色、情绪氛围)固定在 FIXED_STYLE 里,只暴露 6 个变量字段给 AI 填写。
  2. 接入豆包视觉 API
    用豆包 Doubao-Seed-2.0-lite 视觉模型分析上传图片,以 JSON 格式返回结构化描述,再合并到模板。
  3. 用 Gradio 搭 Web 界面
    gr.Blocks 布局,左侧上传图片,右侧展示分析结果和完整提示词,一键复制。
  4. 部署到 Hugging Face Spaces
    API Key 存为 Space Secret,前端完全不暴露;添加 README 元数据,推送代码后自动构建。
  5. 公开上线 + 防滥用
    单 IP 限速(10 秒/次)、每日调用上限(30 次)、全局并发队列,再在 API 平台设月度消费上限,双重保险。

生成示例

用同一套提示词模板,不同照片生成的结果——风格高度统一,但人格特征各不相同:

由 AI 分析照片 → 填充提示词 → 生图工具输出

固定风格提示词

所有图片共用同一段基础描述,保证视觉统一性:

Stylized 3D caricature portrait, DreamWorks-Pixar inspired, exaggerated facial proportions, long nose, tiny eyes, angular jawline, soft matte plastic material, subsurface scattering skin shader, cinematic rim lighting, studio soft lighting, whimsical social satire atmosphere, modern internet culture parody, muted desaturated modern color palette, subtle social commentary vibe, high-end 3D render.

这次学到了什么

🔐

Secret 管理

API Key 存 HF Space Secret,环境变量注入,代码里永远不出现明文。

🌏

网络调试

HF 服务器在海外,豆包 API 的 ark.volces.com DNS 解析失败,换 ark.cn-beijing.volces.com 解决。

版本兼容

Gradio 6 移除了 show_copy_buttonCopyButton,改用 JS 剪贴板 API。

🛡️

限流防滥用

单 IP 速率限制 + 全局并发队列,公开部署也能控制 API 消耗。


这是我在 Hugging Face Spaces 上部署的第一个应用,整个流程从零摸索, 踩了不少坑——从 Gradio 版本兼容到跨境网络问题,最终都跑通了。

如果你也想试试这个工具,把你的照片上传进去,看看 AI 眼里的你是哪种互联网人格:

▶ 立即体验