🎨 Lumina_Dev_Legacy — [ARCHIVED]

⚠️ 项目状态：已归档 / 停止开发

本项目为 TAI Research 早期探索性项目，开发阶段已终止，代码仅作存档用途。项目未完成完整训练，不提供预训练模型权重。

项目信息
状态	🔴 已废弃 (Archived)
原因	项目方向调整，资源重新分配至其他研究领域
最后更新	2026
训练状态	❌ 未完成训练
可用资源	仅代码框架，无预训练权重

项目背景

Lumina 原本的目标是开发一个针对有限硬件（特别是 NVIDIA P4，8GB 显存）优化的轻量级图像生成模型，基于扩散模型架构，专注于文本到图像生成。

原始设计目标

极致的显存优化：专门为 8GB 显存的 GPU 优化
轻量级架构：参数量 < 2000 万
完整训练管道：从数据预处理到模型训练
高效推理：支持多种采样器
模块化设计：易于扩展和定制

为什么废弃？

方向调整：TAI Research 将重心转向语言模型和 AI 安全领域
资源限制：图像生成模型训练需要大量计算资源
竞争环境：开源社区已有成熟方案（Stable Diffusion、Flux 等）

代码内容

本仓库仅包含开发阶段的代码框架：

lumina_legacy/
├── configs/                    # 配置文件
│   ├── model/                 # 模型配置（UNet架构）
│   ├── training/              # 训练配置（P4优化）
│   └── data/                  # 数据配置
├── src/                       # 源代码
│   ├── models/                # UNet + 注意力机制
│   ├── training/              # 训练器 + 内存优化
│   ├── data/                  # LAION数据处理
│   └── inference/             # 采样器（DDIM/DPM/LCM）
├── scripts/                   # 工具脚本
│   ├── train.py              # 训练入口
│   ├── download_laion.py     # 数据下载
│   └── webui.py              # Gradio界面
└── tests/                     # 单元测试

⚠️ 注意：

代码未经完整测试，可能存在 bug
训练管道未验证
不保证可复现

技术栈

组件	技术
框架	PyTorch 2.0+
架构	轻量级 UNet + Cross-Attention
扩散	DDPM / DDIM
文本编码	CLIP (预训练冻结)
精度	FP16 混合精度
优化	梯度检查点 + 梯度累积

原始设计架构

输入 (4×64×64)
    ↓
Conv2d (4→64)
    ↓
[下采样块 × 4]
    ↓
[注意力层 (8×8)]
    ↓
[上采样块 × 4]
    ↓
Conv2d (64→4)
    ↓
输出 (4×64×64)

如何使用这些代码

⚠️ 代码仅为存档，不提供任何保证

# 克隆仓库
git clone https://huggingface.co/TAI-Research/Lumina_Dev_Legacy
cd Lumina_Dev_Legacy

# 安装依赖（如需要）
pip install -r requirements.txt

# 尝试运行训练（仅测试代码是否可运行）
python scripts/train.py --config configs/training/p4_optimized.yaml --dummy

已知问题

训练管道未完整验证
数据处理模块有性能问题
推理采样器可能有 bug
缺少单元测试覆盖

后续

如果你对这个项目感兴趣，建议使用成熟的开源方案：

许可证

MIT License — 代码可自由使用，但无任何保证。

TAI-Research
/

Lumina_Dev_Legacy

🎨 Lumina_Dev_Legacy — [ARCHIVED]

项目背景

原始设计目标

为什么废弃？

代码内容

技术栈

原始设计架构

如何使用这些代码

已知问题

后续

许可证

相关链接