Spaces:

RadicalNotionAI
/

modeldna

Running

App Files Files Community

trohrbaugh commited on 8 days ago

Commit

cdd7014

verified ·

1 Parent(s): 9b2b1d4

Add 8 KNOWN_BASES entries batch 1+2: GLM-4.x, Seed-OSS, Bailing, Kimi, ERNIE-4.5, Qianfan, LLaDA2, InternS1

Browse files

Files changed (1) hide show

scan.py +26 -3

scan.py CHANGED Viewed

@@ -128,9 +128,16 @@ KNOWN_BASES = {
     "bailing_v2": {
         "name": "AntGroup Bailing-V2 / V2.5 (inclusionAI Ling)",
         "vocab_size": 157184,
-        "model_type_patterns": ["bailing_hybrid", "bailing_moe"],
-        # V2 = bailing_moe (MoE 256/8, 4 dense prefix, GQA 64→8)
-        # V2.5 = bailing_hybrid: adds MLA kv_lora_rank + linear-attn + MTP
     },
     "kimi": {
         "name": "Moonshot Kimi (K2, Kimi-Linear)",
@@ -138,6 +145,22 @@ KNOWN_BASES = {
         "model_type_patterns": ["kimi_linear", "kimi"],
         # Kimi-Linear adds linear_attn_config + MLA + MTP on Kimi MoE backbone
     },
 }

     "bailing_v2": {
         "name": "AntGroup Bailing-V2 / V2.5 (inclusionAI Ling)",
         "vocab_size": 157184,
+        "model_type_patterns": ["bailing_hybrid", "bailing_moe", "bailingmm_moe_v2_lite"],
+        # V2 = bailing_moe; V2.5 = bailing_hybrid (MLA + linear-attn + MTP)
+        # bailingmm_moe_v2_lite = Ming-flash-omni multimodal lite variant
+    },
+    "llada2": {
+        "name": "inclusionAI LLaDA2 (discrete-diffusion MoE)",
+        "vocab_size": 157184,
+        "model_type_patterns": ["llada2_moe", "llada2"],
+        # Shares Bailing-V2 tokenizer/expert geometry (256/8, vocab 157184)
+        # but uses discrete-diffusion masked LM — non-autoregressive, separate family
     },
     "kimi": {
         "name": "Moonshot Kimi (K2, Kimi-Linear)",
         "model_type_patterns": ["kimi_linear", "kimi"],
         # Kimi-Linear adds linear_attn_config + MLA + MTP on Kimi MoE backbone
     },
+    "ernie4_5_vl": {
+        "name": "Baidu ERNIE 4.5 VL (MoE multimodal)",
+        "vocab_size": 103424,
+        "model_type_patterns": ["ernie4_5_moe_vl", "ernie4_5_vl"],
+    },
+    "qianfan_vl": {
+        "name": "Baidu Qianfan-VL (dense multimodal)",
+        "vocab_size": 182025,
+        "model_type_patterns": ["qianfan_vl", "qianfan"],
+        # Distinct Baidu tokenizer from ERNIE — two separate VLM lineages
+    },
+    "interns1": {
+        "name": "InternLM S1 (dense, long-chain reasoning)",
+        "vocab_size": 153216,
+        "model_type_patterns": ["interns1", "intern_s1"],
+    },
 }