🎨 Lumina_Dev_Legacy — [ARCHIVED]
⚠️ 项目状态:已归档 / 停止开发
本项目为 TAI Research 早期探索性项目,开发阶段已终止,代码仅作存档用途。项目未完成完整训练,不提供预训练模型权重。
| 项目信息 | |
|---|---|
| 状态 | 🔴 已废弃 (Archived) |
| 原因 | 项目方向调整,资源重新分配至其他研究领域 |
| 最后更新 | 2026 |
| 训练状态 | ❌ 未完成训练 |
| 可用资源 | 仅代码框架,无预训练权重 |
项目背景
Lumina 原本的目标是开发一个针对有限硬件(特别是 NVIDIA P4,8GB 显存)优化的轻量级图像生成模型,基于扩散模型架构,专注于文本到图像生成。
原始设计目标
- 极致的显存优化:专门为 8GB 显存的 GPU 优化
- 轻量级架构:参数量 < 2000 万
- 完整训练管道:从数据预处理到模型训练
- 高效推理:支持多种采样器
- 模块化设计:易于扩展和定制
为什么废弃?
- 方向调整:TAI Research 将重心转向语言模型和 AI 安全领域
- 资源限制:图像生成模型训练需要大量计算资源
- 竞争环境:开源社区已有成熟方案(Stable Diffusion、Flux 等)
代码内容
本仓库仅包含开发阶段的代码框架:
lumina_legacy/
├── configs/ # 配置文件
│ ├── model/ # 模型配置(UNet架构)
│ ├── training/ # 训练配置(P4优化)
│ └── data/ # 数据配置
├── src/ # 源代码
│ ├── models/ # UNet + 注意力机制
│ ├── training/ # 训练器 + 内存优化
│ ├── data/ # LAION数据处理
│ └── inference/ # 采样器(DDIM/DPM/LCM)
├── scripts/ # 工具脚本
│ ├── train.py # 训练入口
│ ├── download_laion.py # 数据下载
│ └── webui.py # Gradio界面
└── tests/ # 单元测试
⚠️ 注意:
- 代码未经完整测试,可能存在 bug
- 训练管道未验证
- 不保证可复现
技术栈
| 组件 | 技术 |
|---|---|
| 框架 | PyTorch 2.0+ |
| 架构 | 轻量级 UNet + Cross-Attention |
| 扩散 | DDPM / DDIM |
| 文本编码 | CLIP (预训练冻结) |
| 精度 | FP16 混合精度 |
| 优化 | 梯度检查点 + 梯度累积 |
原始设计架构
输入 (4×64×64)
↓
Conv2d (4→64)
↓
[下采样块 × 4]
↓
[注意力层 (8×8)]
↓
[上采样块 × 4]
↓
Conv2d (64→4)
↓
输出 (4×64×64)
如何使用这些代码
⚠️ 代码仅为存档,不提供任何保证
# 克隆仓库
git clone https://huggingface.co/TAI-Research/Lumina_Dev_Legacy
cd Lumina_Dev_Legacy
# 安装依赖(如需要)
pip install -r requirements.txt
# 尝试运行训练(仅测试代码是否可运行)
python scripts/train.py --config configs/training/p4_optimized.yaml --dummy
已知问题
- 训练管道未完整验证
- 数据处理模块有性能问题
- 推理采样器可能有 bug
- 缺少单元测试覆盖
后续
如果你对这个项目感兴趣,建议使用成熟的开源方案:
许可证
MIT License — 代码可自由使用,但无任何保证。
相关链接
最后更新: 2026-05-23
归档者: TAI Research
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support