apmoore1 commited on
Commit
777423b
·
verified ·
1 Parent(s): 89744d0

Upload README.md with huggingface_hub

Browse files
Files changed (1) hide show
  1. README.md +1936 -4
README.md CHANGED
@@ -1,10 +1,1942 @@
1
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
2
  tags:
3
  - model_hub_mixin
4
  - pytorch_model_hub_mixin
 
 
 
5
  ---
6
 
7
- This model has been pushed to the Hub using the [PytorchModelHubMixin](https://huggingface.co/docs/huggingface_hub/package_reference/mixins#huggingface_hub.PyTorchModelHubMixin) integration:
8
- - Code: [More Information Needed]
9
- - Paper: [More Information Needed]
10
- - Docs: [More Information Needed]
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
+ license: cc-by-nc-sa-4.0
3
+ base_model: jhu-clsp/mmBERT-small
4
+ base_model_relation: finetune
5
+ datasets:
6
+ - ucrelnlp/English-USAS-Mosaico
7
+ language:
8
+ - aai
9
+ - aak
10
+ - aau
11
+ - aaz
12
+ - aba
13
+ - abi
14
+ - abk
15
+ - abn
16
+ - abq
17
+ - abs
18
+ - abt
19
+ - abx
20
+ - aby
21
+ - abz
22
+ - aca
23
+ - acd
24
+ - ace
25
+ - acf
26
+ - ach
27
+ - acm
28
+ - acn
29
+ - acr
30
+ - acu
31
+ - ada
32
+ - ade
33
+ - adh
34
+ - adi
35
+ - adj
36
+ - adl
37
+ - ady
38
+ - adz
39
+ - aeb
40
+ - aer
41
+ - aeu
42
+ - aey
43
+ - afr
44
+ - agd
45
+ - agg
46
+ - agm
47
+ - agn
48
+ - agr
49
+ - agt
50
+ - agu
51
+ - agw
52
+ - agx
53
+ - aha
54
+ - ahk
55
+ - aia
56
+ - aii
57
+ - aim
58
+ - ain
59
+ - ajg
60
+ - aji
61
+ - ajz
62
+ - akb
63
+ - ake
64
+ - akh
65
+ - akp
66
+ - alj
67
+ - aln
68
+ - alp
69
+ - alq
70
+ - als
71
+ - alt
72
+ - aly
73
+ - alz
74
+ - ame
75
+ - amf
76
+ - amh
77
+ - ami
78
+ - amk
79
+ - amm
80
+ - amn
81
+ - amp
82
+ - amr
83
+ - amu
84
+ - amx
85
+ - ang
86
+ - anm
87
+ - ann
88
+ - anp
89
+ - anv
90
+ - any
91
+ - aoi
92
+ - aoj
93
+ - aom
94
+ - aoz
95
+ - apb
96
+ - apc
97
+ - ape
98
+ - apn
99
+ - apr
100
+ - apt
101
+ - apu
102
+ - apw
103
+ - apy
104
+ - apz
105
+ - arb
106
+ - are
107
+ - arg
108
+ - arl
109
+ - arn
110
+ - arp
111
+ - arq
112
+ - ars
113
+ - ary
114
+ - arz
115
+ - asg
116
+ - asm
117
+ - aso
118
+ - ast
119
+ - ata
120
+ - atb
121
+ - atd
122
+ - atg
123
+ - ati
124
+ - atj
125
+ - atq
126
+ - att
127
+ - auc
128
+ - aui
129
+ - auy
130
+ - ava
131
+ - avk
132
+ - avn
133
+ - avt
134
+ - avu
135
+ - awa
136
+ - awb
137
+ - awx
138
+ - ayo
139
+ - ayp
140
+ - ayr
141
+ - azb
142
+ - azg
143
+ - azj
144
+ - azz
145
+ - bak
146
+ - bam
147
+ - ban
148
+ - bao
149
+ - bar
150
+ - bas
151
+ - bav
152
+ - bba
153
+ - bbb
154
+ - bbc
155
+ - bbj
156
+ - bbk
157
+ - bbo
158
+ - bbr
159
+ - bch
160
+ - bci
161
+ - bcl
162
+ - bco
163
+ - bcw
164
+ - bdd
165
+ - bdh
166
+ - bdq
167
+ - bea
168
+ - bef
169
+ - bel
170
+ - bem
171
+ - ben
172
+ - beq
173
+ - bew
174
+ - bex
175
+ - bfd
176
+ - bfo
177
+ - bgr
178
+ - bgs
179
+ - bgt
180
+ - bgz
181
+ - bhg
182
+ - bhl
183
+ - bho
184
+ - bhp
185
+ - bhw
186
+ - bhz
187
+ - bib
188
+ - big
189
+ - bim
190
+ - bin
191
+ - bis
192
+ - biu
193
+ - biv
194
+ - bjn
195
+ - bjp
196
+ - bjr
197
+ - bjv
198
+ - bkd
199
+ - bkl
200
+ - bkq
201
+ - bku
202
+ - bkv
203
+ - bla
204
+ - blh
205
+ - blk
206
+ - blw
207
+ - blz
208
+ - bmh
209
+ - bmk
210
+ - bmq
211
+ - bmr
212
+ - bmu
213
+ - bmv
214
+ - bno
215
+ - bnp
216
+ - boa
217
+ - bod
218
+ - boj
219
+ - bom
220
+ - bon
221
+ - bos
222
+ - bov
223
+ - box
224
+ - bpr
225
+ - bps
226
+ - bpy
227
+ - bqc
228
+ - bqj
229
+ - bqp
230
+ - bre
231
+ - brh
232
+ - bru
233
+ - brx
234
+ - bsc
235
+ - bsn
236
+ - bsp
237
+ - bsq
238
+ - bss
239
+ - btd
240
+ - bth
241
+ - bts
242
+ - btt
243
+ - btx
244
+ - bud
245
+ - bug
246
+ - buk
247
+ - bul
248
+ - bum
249
+ - bus
250
+ - bvc
251
+ - bvd
252
+ - bvr
253
+ - bvz
254
+ - bwd
255
+ - bwi
256
+ - bwq
257
+ - bwu
258
+ - bxh
259
+ - bxr
260
+ - byr
261
+ - byv
262
+ - byx
263
+ - bzd
264
+ - bzh
265
+ - bzi
266
+ - bzj
267
+ - caa
268
+ - cab
269
+ - cac
270
+ - caf
271
+ - cag
272
+ - cak
273
+ - cao
274
+ - cap
275
+ - caq
276
+ - car
277
+ - cas
278
+ - cat
279
+ - cav
280
+ - cax
281
+ - cbc
282
+ - cbi
283
+ - cbk
284
+ - cbr
285
+ - cbs
286
+ - cbt
287
+ - cbu
288
+ - cbv
289
+ - cce
290
+ - cco
291
+ - ccp
292
+ - ceb
293
+ - ceg
294
+ - cek
295
+ - ces
296
+ - cfm
297
+ - cgc
298
+ - cgg
299
+ - cha
300
+ - chd
301
+ - che
302
+ - chf
303
+ - chj
304
+ - chk
305
+ - cho
306
+ - chq
307
+ - chr
308
+ - chu
309
+ - chv
310
+ - chw
311
+ - chz
312
+ - cjk
313
+ - cjo
314
+ - cjp
315
+ - cjs
316
+ - cjv
317
+ - ckb
318
+ - cko
319
+ - ckt
320
+ - cle
321
+ - clu
322
+ - cly
323
+ - cme
324
+ - cmn
325
+ - cmo
326
+ - cmr
327
+ - cnh
328
+ - cni
329
+ - cnk
330
+ - cnl
331
+ - cnt
332
+ - cnw
333
+ - coe
334
+ - cof
335
+ - cok
336
+ - con
337
+ - cop
338
+ - cor
339
+ - cos
340
+ - cot
341
+ - cou
342
+ - cpa
343
+ - cpb
344
+ - cpc
345
+ - cpu
346
+ - cpy
347
+ - crh
348
+ - crj
349
+ - crk
350
+ - crl
351
+ - crm
352
+ - crn
353
+ - crs
354
+ - crt
355
+ - crx
356
+ - csb
357
+ - csk
358
+ - cso
359
+ - csw
360
+ - csy
361
+ - cta
362
+ - ctd
363
+ - cto
364
+ - ctp
365
+ - ctu
366
+ - cub
367
+ - cuc
368
+ - cui
369
+ - cuk
370
+ - cul
371
+ - cut
372
+ - cux
373
+ - cwe
374
+ - cwt
375
+ - cya
376
+ - cym
377
+ - czt
378
+ - daa
379
+ - dad
380
+ - daf
381
+ - dag
382
+ - dah
383
+ - dak
384
+ - dan
385
+ - dar
386
+ - ddg
387
+ - ddn
388
+ - ded
389
+ - des
390
+ - deu
391
+ - dga
392
+ - dgc
393
+ - dgi
394
+ - dgr
395
+ - dgz
396
+ - dhg
397
+ - dhm
398
+ - dhv
399
+ - did
400
+ - dig
401
+ - dik
402
+ - diq
403
+ - dis
404
+ - diu
405
+ - div
406
+ - dje
407
+ - djk
408
+ - djr
409
+ - dks
410
+ - dln
411
+ - dng
412
+ - dnj
413
+ - dnw
414
+ - dob
415
+ - doi
416
+ - dop
417
+ - dos
418
+ - dow
419
+ - drg
420
+ - dru
421
+ - dsb
422
+ - dtb
423
+ - dtp
424
+ - dts
425
+ - dty
426
+ - dua
427
+ - due
428
+ - dug
429
+ - duo
430
+ - dur
431
+ - dwr
432
+ - dww
433
+ - dyi
434
+ - dyo
435
+ - dyu
436
+ - dzo
437
+ - ebk
438
+ - efi
439
+ - eka
440
+ - ekk
441
+ - eko
442
+ - ell
443
+ - emi
444
+ - eml
445
+ - emp
446
+ - enb
447
+ - enl
448
+ - enm
449
+ - enq
450
+ - enx
451
+ - epo
452
+ - eri
453
+ - ese
454
+ - esi
455
+ - esk
456
+ - ess
457
+ - esu
458
+ - eto
459
+ - etr
460
+ - etu
461
+ - eus
462
+ - eve
463
+ - ewe
464
+ - ewo
465
+ - ext
466
+ - eza
467
+ - faa
468
+ - fad
469
+ - fai
470
+ - fal
471
+ - fan
472
+ - fao
473
+ - far
474
+ - fas
475
+ - fat
476
+ - ffm
477
+ - fij
478
+ - fil
479
+ - fin
480
+ - fit
481
+ - fkv
482
+ - fmu
483
+ - fon
484
+ - for
485
+ - fra
486
+ - frd
487
+ - fro
488
+ - frp
489
+ - frr
490
+ - fry
491
+ - fub
492
+ - fud
493
+ - fue
494
+ - fuf
495
+ - fuh
496
+ - fuq
497
+ - fur
498
+ - fuv
499
+ - gaa
500
+ - gag
501
+ - gah
502
+ - gai
503
+ - gam
504
+ - gaw
505
+ - gaz
506
+ - gbi
507
+ - gbo
508
+ - gbr
509
+ - gcf
510
+ - gcr
511
+ - gde
512
+ - gdg
513
+ - gdn
514
+ - gdr
515
+ - geb
516
+ - gej
517
+ - gfk
518
+ - ghs
519
+ - gid
520
+ - gil
521
+ - giz
522
+ - gjn
523
+ - gkn
524
+ - gla
525
+ - gle
526
+ - glg
527
+ - glk
528
+ - glv
529
+ - gmh
530
+ - gmv
531
+ - gna
532
+ - gnb
533
+ - gnd
534
+ - gng
535
+ - gnn
536
+ - gnw
537
+ - goa
538
+ - gof
539
+ - gog
540
+ - goh
541
+ - gom
542
+ - gor
543
+ - gos
544
+ - got
545
+ - gqr
546
+ - grc
547
+ - grt
548
+ - gso
549
+ - gsw
550
+ - gub
551
+ - guc
552
+ - gud
553
+ - gug
554
+ - guh
555
+ - gui
556
+ - guj
557
+ - guk
558
+ - gul
559
+ - gum
560
+ - gun
561
+ - guo
562
+ - guq
563
+ - gur
564
+ - guu
565
+ - guw
566
+ - gux
567
+ - guz
568
+ - gvc
569
+ - gvf
570
+ - gvl
571
+ - gvn
572
+ - gwi
573
+ - gwr
574
+ - gya
575
+ - gym
576
+ - gyr
577
+ - hac
578
+ - hae
579
+ - hag
580
+ - hak
581
+ - hat
582
+ - hav
583
+ - haw
584
+ - hay
585
+ - hbo
586
+ - hch
587
+ - heb
588
+ - heg
589
+ - heh
590
+ - her
591
+ - hif
592
+ - hig
593
+ - hil
594
+ - hin
595
+ - hix
596
+ - hla
597
+ - hmo
598
+ - hmr
599
+ - hne
600
+ - hnj
601
+ - hnn
602
+ - hns
603
+ - hop
604
+ - hot
605
+ - hra
606
+ - hrv
607
+ - hrx
608
+ - hsb
609
+ - hto
610
+ - hub
611
+ - hui
612
+ - hun
613
+ - hus
614
+ - huu
615
+ - huv
616
+ - hvn
617
+ - hwc
618
+ - hye
619
+ - hyw
620
+ - ian
621
+ - iba
622
+ - ibg
623
+ - ibo
624
+ - icr
625
+ - ido
626
+ - idu
627
+ - ifa
628
+ - ifb
629
+ - ife
630
+ - ifk
631
+ - ifu
632
+ - ify
633
+ - ige
634
+ - ign
635
+ - ike
636
+ - ikk
637
+ - ikt
638
+ - ikw
639
+ - ilb
640
+ - ile
641
+ - ilo
642
+ - imo
643
+ - ina
644
+ - inb
645
+ - ind
646
+ - inh
647
+ - ino
648
+ - iou
649
+ - ipi
650
+ - iqw
651
+ - iri
652
+ - irk
653
+ - iry
654
+ - isd
655
+ - ish
656
+ - isl
657
+ - iso
658
+ - ita
659
+ - itv
660
+ - ium
661
+ - ivb
662
+ - ivv
663
+ - iws
664
+ - ixl
665
+ - izr
666
+ - izz
667
+ - jaa
668
+ - jac
669
+ - jae
670
+ - jam
671
+ - jav
672
+ - jbo
673
+ - jbu
674
+ - jic
675
+ - jiv
676
+ - jmc
677
+ - jpn
678
+ - jra
679
+ - jun
680
+ - jvn
681
+ - kaa
682
+ - kab
683
+ - kac
684
+ - kak
685
+ - kal
686
+ - kam
687
+ - kan
688
+ - kao
689
+ - kaq
690
+ - kas
691
+ - kat
692
+ - kaz
693
+ - kbc
694
+ - kbd
695
+ - kbh
696
+ - kbm
697
+ - kbo
698
+ - kbp
699
+ - kbq
700
+ - kbr
701
+ - kby
702
+ - kca
703
+ - kcg
704
+ - kck
705
+ - kdc
706
+ - kde
707
+ - kdh
708
+ - kdi
709
+ - kdj
710
+ - kdl
711
+ - kdr
712
+ - kea
713
+ - kei
714
+ - kek
715
+ - ken
716
+ - keo
717
+ - ker
718
+ - kew
719
+ - kez
720
+ - kff
721
+ - kgf
722
+ - kgk
723
+ - kgp
724
+ - kgr
725
+ - kha
726
+ - khk
727
+ - khm
728
+ - khs
729
+ - khz
730
+ - kia
731
+ - kij
732
+ - kik
733
+ - kin
734
+ - kir
735
+ - kiu
736
+ - kix
737
+ - kjb
738
+ - kje
739
+ - kjh
740
+ - kjs
741
+ - kkc
742
+ - kki
743
+ - kkj
744
+ - kkl
745
+ - kle
746
+ - klt
747
+ - klv
748
+ - kmb
749
+ - kmg
750
+ - kmh
751
+ - kmk
752
+ - kmm
753
+ - kmo
754
+ - kmr
755
+ - kms
756
+ - kmu
757
+ - kmy
758
+ - knc
759
+ - kne
760
+ - knf
761
+ - kng
762
+ - knj
763
+ - knk
764
+ - kno
765
+ - knv
766
+ - knx
767
+ - kny
768
+ - kog
769
+ - koi
770
+ - koo
771
+ - kor
772
+ - kos
773
+ - kpe
774
+ - kpf
775
+ - kpg
776
+ - kpj
777
+ - kpq
778
+ - kpr
779
+ - kpv
780
+ - kpw
781
+ - kpx
782
+ - kpz
783
+ - kqc
784
+ - kqe
785
+ - kqf
786
+ - kql
787
+ - kqn
788
+ - kqo
789
+ - kqp
790
+ - kqs
791
+ - kqw
792
+ - kqy
793
+ - krc
794
+ - kri
795
+ - krj
796
+ - krl
797
+ - kru
798
+ - krx
799
+ - ksb
800
+ - ksc
801
+ - ksd
802
+ - ksf
803
+ - ksh
804
+ - ksj
805
+ - ksp
806
+ - ksr
807
+ - kss
808
+ - ksw
809
+ - ktb
810
+ - ktj
811
+ - ktm
812
+ - kto
813
+ - ktu
814
+ - ktz
815
+ - kua
816
+ - kub
817
+ - kud
818
+ - kue
819
+ - kuj
820
+ - kum
821
+ - kup
822
+ - kus
823
+ - kvg
824
+ - kvj
825
+ - kvn
826
+ - kwd
827
+ - kwf
828
+ - kwi
829
+ - kwj
830
+ - kwn
831
+ - kwy
832
+ - kxc
833
+ - kxm
834
+ - kxw
835
+ - kyc
836
+ - kyf
837
+ - kyg
838
+ - kyq
839
+ - kyu
840
+ - kyz
841
+ - kze
842
+ - kzf
843
+ - kzj
844
+ - lac
845
+ - lad
846
+ - lai
847
+ - laj
848
+ - lam
849
+ - lao
850
+ - lap
851
+ - lat
852
+ - lbb
853
+ - lbe
854
+ - lbj
855
+ - lbk
856
+ - lcm
857
+ - lcp
858
+ - ldi
859
+ - ldn
860
+ - lee
861
+ - lef
862
+ - leh
863
+ - lem
864
+ - leu
865
+ - lew
866
+ - lex
867
+ - lez
868
+ - lfn
869
+ - lgg
870
+ - lgl
871
+ - lgm
872
+ - lhi
873
+ - lhu
874
+ - lia
875
+ - lid
876
+ - lif
877
+ - lij
878
+ - lim
879
+ - lin
880
+ - lip
881
+ - lis
882
+ - lit
883
+ - liv
884
+ - ljp
885
+ - lki
886
+ - llb
887
+ - lld
888
+ - llg
889
+ - lln
890
+ - lmk
891
+ - lmo
892
+ - lmp
893
+ - lnd
894
+ - lob
895
+ - loe
896
+ - log
897
+ - lok
898
+ - lol
899
+ - lom
900
+ - loq
901
+ - loz
902
+ - lrc
903
+ - lsi
904
+ - lsm
905
+ - ltg
906
+ - ltz
907
+ - lua
908
+ - lub
909
+ - luc
910
+ - lud
911
+ - lue
912
+ - lug
913
+ - lun
914
+ - luo
915
+ - lus
916
+ - lvs
917
+ - lwg
918
+ - lwo
919
+ - lww
920
+ - lzh
921
+ - maa
922
+ - mad
923
+ - maf
924
+ - mag
925
+ - mah
926
+ - mai
927
+ - maj
928
+ - mak
929
+ - mal
930
+ - mam
931
+ - maq
932
+ - mar
933
+ - mas
934
+ - mau
935
+ - mav
936
+ - maw
937
+ - maz
938
+ - mbb
939
+ - mbc
940
+ - mbd
941
+ - mbf
942
+ - mbh
943
+ - mbi
944
+ - mbj
945
+ - mbl
946
+ - mbs
947
+ - mbt
948
+ - mca
949
+ - mcb
950
+ - mcd
951
+ - mcf
952
+ - mck
953
+ - mcn
954
+ - mco
955
+ - mcp
956
+ - mcq
957
+ - mcu
958
+ - mda
959
+ - mdf
960
+ - mdy
961
+ - med
962
+ - mee
963
+ - mej
964
+ - mek
965
+ - men
966
+ - meq
967
+ - mer
968
+ - met
969
+ - meu
970
+ - mev
971
+ - mfe
972
+ - mfg
973
+ - mfh
974
+ - mfi
975
+ - mfk
976
+ - mfq
977
+ - mfy
978
+ - mfz
979
+ - mgc
980
+ - mgh
981
+ - mgo
982
+ - mgr
983
+ - mhi
984
+ - mhl
985
+ - mhr
986
+ - mhw
987
+ - mhx
988
+ - mhy
989
+ - mib
990
+ - mic
991
+ - mie
992
+ - mif
993
+ - mig
994
+ - mih
995
+ - mil
996
+ - mim
997
+ - min
998
+ - mio
999
+ - mip
1000
+ - miq
1001
+ - mir
1002
+ - mit
1003
+ - miy
1004
+ - miz
1005
+ - mjc
1006
+ - mjw
1007
+ - mkd
1008
+ - mkl
1009
+ - mkn
1010
+ - mks
1011
+ - mkz
1012
+ - mlh
1013
+ - mlp
1014
+ - mlt
1015
+ - mlu
1016
+ - mmn
1017
+ - mmo
1018
+ - mmx
1019
+ - mna
1020
+ - mnb
1021
+ - mnf
1022
+ - mni
1023
+ - mnk
1024
+ - mns
1025
+ - mnw
1026
+ - mnx
1027
+ - mny
1028
+ - moa
1029
+ - moc
1030
+ - mog
1031
+ - moh
1032
+ - mop
1033
+ - mor
1034
+ - mos
1035
+ - mox
1036
+ - mpg
1037
+ - mph
1038
+ - mpm
1039
+ - mpp
1040
+ - mps
1041
+ - mpt
1042
+ - mpx
1043
+ - mqb
1044
+ - mqj
1045
+ - mqy
1046
+ - mrg
1047
+ - mri
1048
+ - mrj
1049
+ - mrq
1050
+ - mrv
1051
+ - mrw
1052
+ - msb
1053
+ - msc
1054
+ - mse
1055
+ - msk
1056
+ - msy
1057
+ - mta
1058
+ - mtg
1059
+ - mti
1060
+ - mto
1061
+ - mtp
1062
+ - mua
1063
+ - mug
1064
+ - muh
1065
+ - mui
1066
+ - mup
1067
+ - mur
1068
+ - mus
1069
+ - mux
1070
+ - muy
1071
+ - mva
1072
+ - mvn
1073
+ - mvp
1074
+ - mwc
1075
+ - mwf
1076
+ - mwl
1077
+ - mwm
1078
+ - mwn
1079
+ - mwp
1080
+ - mwq
1081
+ - mwv
1082
+ - mww
1083
+ - mxb
1084
+ - mxp
1085
+ - mxq
1086
+ - mxt
1087
+ - mxv
1088
+ - mya
1089
+ - myb
1090
+ - myk
1091
+ - myu
1092
+ - myv
1093
+ - myw
1094
+ - myx
1095
+ - myy
1096
+ - mza
1097
+ - mzh
1098
+ - mzk
1099
+ - mzl
1100
+ - mzm
1101
+ - mzn
1102
+ - mzw
1103
+ - mzz
1104
+ - nab
1105
+ - naf
1106
+ - nah
1107
+ - nak
1108
+ - nap
1109
+ - naq
1110
+ - nas
1111
+ - nav
1112
+ - naw
1113
+ - nba
1114
+ - nbc
1115
+ - nbe
1116
+ - nbl
1117
+ - nbq
1118
+ - nbu
1119
+ - nca
1120
+ - nch
1121
+ - ncj
1122
+ - ncl
1123
+ - ncq
1124
+ - nct
1125
+ - ncu
1126
+ - ncx
1127
+ - ndc
1128
+ - nde
1129
+ - ndh
1130
+ - ndi
1131
+ - ndj
1132
+ - ndo
1133
+ - nds
1134
+ - ndz
1135
+ - neb
1136
+ - new
1137
+ - nfa
1138
+ - nfr
1139
+ - ngb
1140
+ - ngc
1141
+ - ngl
1142
+ - ngp
1143
+ - ngu
1144
+ - nhd
1145
+ - nhe
1146
+ - nhg
1147
+ - nhi
1148
+ - nhk
1149
+ - nho
1150
+ - nhr
1151
+ - nhu
1152
+ - nhw
1153
+ - nhx
1154
+ - nhy
1155
+ - nia
1156
+ - nif
1157
+ - nii
1158
+ - nij
1159
+ - nim
1160
+ - nin
1161
+ - nio
1162
+ - niu
1163
+ - niy
1164
+ - njb
1165
+ - njm
1166
+ - njn
1167
+ - njo
1168
+ - njz
1169
+ - nkf
1170
+ - nko
1171
+ - nld
1172
+ - nlg
1173
+ - nma
1174
+ - nmf
1175
+ - nmh
1176
+ - nmo
1177
+ - nmw
1178
+ - nmz
1179
+ - nnb
1180
+ - nng
1181
+ - nnh
1182
+ - nnl
1183
+ - nno
1184
+ - nnp
1185
+ - nnq
1186
+ - nnw
1187
+ - noa
1188
+ - nob
1189
+ - nod
1190
+ - nog
1191
+ - non
1192
+ - nop
1193
+ - not
1194
+ - nou
1195
+ - nov
1196
+ - nph
1197
+ - npi
1198
+ - npl
1199
+ - npo
1200
+ - npy
1201
+ - nqo
1202
+ - nre
1203
+ - nrf
1204
+ - nri
1205
+ - nrm
1206
+ - nsa
1207
+ - nse
1208
+ - nsm
1209
+ - nsn
1210
+ - nso
1211
+ - nss
1212
+ - nst
1213
+ - nsu
1214
+ - ntp
1215
+ - ntr
1216
+ - ntu
1217
+ - nuj
1218
+ - nus
1219
+ - nuy
1220
+ - nvm
1221
+ - nwb
1222
+ - nwi
1223
+ - nwx
1224
+ - nxd
1225
+ - nya
1226
+ - nyf
1227
+ - nyk
1228
+ - nyn
1229
+ - nyo
1230
+ - nyu
1231
+ - nyy
1232
+ - nza
1233
+ - nzi
1234
+ - nzm
1235
+ - obo
1236
+ - oci
1237
+ - ogo
1238
+ - ojb
1239
+ - oke
1240
+ - oku
1241
+ - okv
1242
+ - old
1243
+ - olo
1244
+ - omb
1245
+ - omw
1246
+ - ong
1247
+ - ons
1248
+ - ood
1249
+ - opm
1250
+ - orv
1251
+ - ory
1252
+ - oss
1253
+ - ota
1254
+ - otd
1255
+ - ote
1256
+ - otm
1257
+ - otn
1258
+ - oto
1259
+ - otq
1260
+ - ots
1261
+ - otw
1262
+ - oym
1263
+ - ozm
1264
+ - pab
1265
+ - pad
1266
+ - pag
1267
+ - pah
1268
+ - pam
1269
+ - pan
1270
+ - pao
1271
+ - pap
1272
+ - pau
1273
+ - pbb
1274
+ - pbc
1275
+ - pbi
1276
+ - pbt
1277
+ - pcd
1278
+ - pck
1279
+ - pcm
1280
+ - pdc
1281
+ - pdt
1282
+ - pem
1283
+ - pfe
1284
+ - pfl
1285
+ - phm
1286
+ - pib
1287
+ - pio
1288
+ - pir
1289
+ - pis
1290
+ - pjt
1291
+ - pkb
1292
+ - plg
1293
+ - pls
1294
+ - plt
1295
+ - plu
1296
+ - plw
1297
+ - pma
1298
+ - pmf
1299
+ - pmq
1300
+ - pms
1301
+ - pmx
1302
+ - pnb
1303
+ - pne
1304
+ - pnt
1305
+ - pny
1306
+ - poe
1307
+ - poh
1308
+ - poi
1309
+ - pol
1310
+ - pon
1311
+ - por
1312
+ - pos
1313
+ - pot
1314
+ - pov
1315
+ - poy
1316
+ - ppk
1317
+ - ppo
1318
+ - pps
1319
+ - prf
1320
+ - prg
1321
+ - pri
1322
+ - prq
1323
+ - pse
1324
+ - pss
1325
+ - ptp
1326
+ - ptu
1327
+ - pui
1328
+ - pwg
1329
+ - pwn
1330
+ - pww
1331
+ - pxm
1332
+ - qub
1333
+ - quc
1334
+ - quf
1335
+ - qug
1336
+ - quh
1337
+ - qul
1338
+ - qup
1339
+ - qus
1340
+ - quw
1341
+ - quy
1342
+ - quz
1343
+ - qva
1344
+ - qvc
1345
+ - qve
1346
+ - qvh
1347
+ - qvi
1348
+ - qvm
1349
+ - qvn
1350
+ - qvo
1351
+ - qvs
1352
+ - qvw
1353
+ - qvz
1354
+ - qwh
1355
+ - qxh
1356
+ - qxl
1357
+ - qxn
1358
+ - qxo
1359
+ - qxr
1360
+ - rad
1361
+ - rai
1362
+ - rap
1363
+ - rar
1364
+ - rav
1365
+ - raw
1366
+ - rcf
1367
+ - rej
1368
+ - rel
1369
+ - rgu
1370
+ - rhg
1371
+ - ria
1372
+ - rim
1373
+ - rjs
1374
+ - rkb
1375
+ - rmc
1376
+ - rme
1377
+ - rml
1378
+ - rmn
1379
+ - rmo
1380
+ - rmq
1381
+ - rmy
1382
+ - rnd
1383
+ - rng
1384
+ - rnl
1385
+ - roh
1386
+ - ron
1387
+ - roo
1388
+ - rop
1389
+ - row
1390
+ - rro
1391
+ - rtm
1392
+ - rub
1393
+ - rue
1394
+ - ruf
1395
+ - rug
1396
+ - run
1397
+ - rup
1398
+ - rus
1399
+ - rwo
1400
+ - sab
1401
+ - sag
1402
+ - sah
1403
+ - san
1404
+ - sas
1405
+ - sat
1406
+ - sba
1407
+ - sbd
1408
+ - sbe
1409
+ - sbl
1410
+ - sbs
1411
+ - sby
1412
+ - sck
1413
+ - scn
1414
+ - sco
1415
+ - sda
1416
+ - sdc
1417
+ - sdh
1418
+ - sdo
1419
+ - sdq
1420
+ - seh
1421
+ - ses
1422
+ - sey
1423
+ - sfw
1424
+ - sgb
1425
+ - sgc
1426
+ - sgh
1427
+ - sgs
1428
+ - sgw
1429
+ - sgz
1430
+ - shi
1431
+ - shk
1432
+ - shn
1433
+ - shp
1434
+ - shu
1435
+ - sid
1436
+ - sig
1437
+ - sil
1438
+ - sim
1439
+ - sin
1440
+ - sja
1441
+ - sjo
1442
+ - sju
1443
+ - skg
1444
+ - skr
1445
+ - sld
1446
+ - slk
1447
+ - sll
1448
+ - slv
1449
+ - sma
1450
+ - sme
1451
+ - smj
1452
+ - smk
1453
+ - sml
1454
+ - smn
1455
+ - smo
1456
+ - sms
1457
+ - smt
1458
+ - sna
1459
+ - snc
1460
+ - snd
1461
+ - snf
1462
+ - snn
1463
+ - snp
1464
+ - snw
1465
+ - sny
1466
+ - soe
1467
+ - som
1468
+ - sop
1469
+ - soq
1470
+ - sot
1471
+ - soy
1472
+ - spa
1473
+ - spl
1474
+ - spm
1475
+ - spp
1476
+ - sps
1477
+ - spy
1478
+ - srd
1479
+ - sri
1480
+ - srm
1481
+ - srn
1482
+ - srp
1483
+ - srq
1484
+ - srr
1485
+ - ssd
1486
+ - ssg
1487
+ - ssw
1488
+ - ssx
1489
+ - stn
1490
+ - stp
1491
+ - stq
1492
+ - sua
1493
+ - suc
1494
+ - sue
1495
+ - suk
1496
+ - sun
1497
+ - sur
1498
+ - sus
1499
+ - suz
1500
+ - swb
1501
+ - swc
1502
+ - swe
1503
+ - swg
1504
+ - swh
1505
+ - swk
1506
+ - swp
1507
+ - sxb
1508
+ - sxn
1509
+ - syb
1510
+ - syc
1511
+ - syl
1512
+ - szl
1513
+ - szy
1514
+ - tab
1515
+ - tac
1516
+ - tah
1517
+ - taj
1518
+ - tam
1519
+ - tap
1520
+ - taq
1521
+ - tar
1522
+ - tat
1523
+ - tav
1524
+ - taw
1525
+ - tay
1526
+ - tbc
1527
+ - tbg
1528
+ - tbk
1529
+ - tbl
1530
+ - tbo
1531
+ - tbw
1532
+ - tby
1533
+ - tbz
1534
+ - tca
1535
+ - tcc
1536
+ - tcf
1537
+ - tcs
1538
+ - tcy
1539
+ - tcz
1540
+ - ted
1541
+ - tee
1542
+ - tel
1543
+ - tem
1544
+ - teo
1545
+ - ter
1546
+ - tet
1547
+ - tew
1548
+ - tfr
1549
+ - tgk
1550
+ - tgo
1551
+ - tgp
1552
+ - tha
1553
+ - thk
1554
+ - thl
1555
+ - tif
1556
+ - tig
1557
+ - tih
1558
+ - tik
1559
+ - tim
1560
+ - tir
1561
+ - tiv
1562
+ - tiy
1563
+ - tke
1564
+ - tkl
1565
+ - tkr
1566
+ - tku
1567
+ - tlb
1568
+ - tlf
1569
+ - tlh
1570
+ - tlj
1571
+ - tll
1572
+ - tly
1573
+ - tmc
1574
+ - tmd
1575
+ - tna
1576
+ - tnc
1577
+ - tnk
1578
+ - tnn
1579
+ - tnp
1580
+ - tnr
1581
+ - tob
1582
+ - toc
1583
+ - tod
1584
+ - tog
1585
+ - toh
1586
+ - toi
1587
+ - toj
1588
+ - tok
1589
+ - ton
1590
+ - too
1591
+ - top
1592
+ - tos
1593
+ - tpa
1594
+ - tpi
1595
+ - tpm
1596
+ - tpp
1597
+ - tpt
1598
+ - tpw
1599
+ - tpz
1600
+ - tqo
1601
+ - trc
1602
+ - trn
1603
+ - tro
1604
+ - trp
1605
+ - trq
1606
+ - trs
1607
+ - trv
1608
+ - tsc
1609
+ - tsg
1610
+ - tsn
1611
+ - tso
1612
+ - tsw
1613
+ - tsz
1614
+ - ttc
1615
+ - tte
1616
+ - ttj
1617
+ - ttq
1618
+ - tuc
1619
+ - tue
1620
+ - tuf
1621
+ - tui
1622
+ - tuk
1623
+ - tul
1624
+ - tum
1625
+ - tuo
1626
+ - tur
1627
+ - tuv
1628
+ - tvk
1629
+ - tvl
1630
+ - twi
1631
+ - twu
1632
+ - twx
1633
+ - txq
1634
+ - txu
1635
+ - tyv
1636
+ - tzh
1637
+ - tzj
1638
+ - tzl
1639
+ - tzm
1640
+ - tzo
1641
+ - ubr
1642
+ - ubu
1643
+ - udm
1644
+ - udu
1645
+ - uig
1646
+ - ukr
1647
+ - umb
1648
+ - upv
1649
+ - ura
1650
+ - urb
1651
+ - urd
1652
+ - urh
1653
+ - uri
1654
+ - urk
1655
+ - urt
1656
+ - urw
1657
+ - ury
1658
+ - usa
1659
+ - usp
1660
+ - uth
1661
+ - uvh
1662
+ - uvl
1663
+ - uzn
1664
+ - uzs
1665
+ - vag
1666
+ - vap
1667
+ - var
1668
+ - vec
1669
+ - ven
1670
+ - vep
1671
+ - vid
1672
+ - vie
1673
+ - viv
1674
+ - vls
1675
+ - vmk
1676
+ - vmw
1677
+ - vmy
1678
+ - vol
1679
+ - vot
1680
+ - vro
1681
+ - vun
1682
+ - vut
1683
+ - waj
1684
+ - wal
1685
+ - wap
1686
+ - war
1687
+ - wat
1688
+ - way
1689
+ - wba
1690
+ - wbm
1691
+ - wbp
1692
+ - wed
1693
+ - wer
1694
+ - wes
1695
+ - wew
1696
+ - whg
1697
+ - whk
1698
+ - wib
1699
+ - wim
1700
+ - wiu
1701
+ - wln
1702
+ - wls
1703
+ - wlv
1704
+ - wlx
1705
+ - wmt
1706
+ - wmw
1707
+ - wnc
1708
+ - wnu
1709
+ - wob
1710
+ - wol
1711
+ - wos
1712
+ - wrk
1713
+ - wrs
1714
+ - wsg
1715
+ - wsk
1716
+ - wuu
1717
+ - wuv
1718
+ - wwa
1719
+ - xal
1720
+ - xav
1721
+ - xbi
1722
+ - xbr
1723
+ - xed
1724
+ - xho
1725
+ - xla
1726
+ - xmf
1727
+ - xmm
1728
+ - xmv
1729
+ - xnn
1730
+ - xog
1731
+ - xon
1732
+ - xrb
1733
+ - xsb
1734
+ - xsi
1735
+ - xsm
1736
+ - xsr
1737
+ - xsu
1738
+ - xtd
1739
+ - xtm
1740
+ - xtn
1741
+ - xuo
1742
+ - yaa
1743
+ - yad
1744
+ - yal
1745
+ - yam
1746
+ - yan
1747
+ - yao
1748
+ - yap
1749
+ - yaq
1750
+ - yat
1751
+ - yaz
1752
+ - ybb
1753
+ - yby
1754
+ - ycn
1755
+ - ydd
1756
+ - yim
1757
+ - yka
1758
+ - yle
1759
+ - yli
1760
+ - yml
1761
+ - yom
1762
+ - yon
1763
+ - yor
1764
+ - yrb
1765
+ - yre
1766
+ - yrk
1767
+ - yrl
1768
+ - yss
1769
+ - yua
1770
+ - yue
1771
+ - yuj
1772
+ - yup
1773
+ - yut
1774
+ - yuw
1775
+ - yuz
1776
+ - yva
1777
+ - zaa
1778
+ - zab
1779
+ - zac
1780
+ - zad
1781
+ - zae
1782
+ - zai
1783
+ - zam
1784
+ - zao
1785
+ - zar
1786
+ - zas
1787
+ - zat
1788
+ - zav
1789
+ - zaw
1790
+ - zca
1791
+ - zdj
1792
+ - zea
1793
+ - zgh
1794
+ - zia
1795
+ - ziw
1796
+ - zne
1797
+ - zom
1798
+ - zos
1799
+ - zpa
1800
+ - zpc
1801
+ - zpg
1802
+ - zpi
1803
+ - zpj
1804
+ - zpl
1805
+ - zpm
1806
+ - zpo
1807
+ - zpq
1808
+ - zpt
1809
+ - zpu
1810
+ - zpv
1811
+ - zpz
1812
+ - zsm
1813
+ - zsr
1814
+ - ztq
1815
+ - zty
1816
+ - zul
1817
+ - zyb
1818
+ - zyp
1819
  tags:
1820
  - model_hub_mixin
1821
  - pytorch_model_hub_mixin
1822
+ - pytorch
1823
+ - word-sense-disambiguation
1824
+ - lexical-semantics
1825
  ---
1826
 
1827
+ # Model Card for PyMUSAS Neural Multilingual Small BEM
1828
+
1829
+ A fine tuned 140 Million (140M) parameter Multilingual ModernBERT architecture semantic tagger. The tagger outputs semantic tags at the token level from the [USAS tagset](https://ucrel.lancs.ac.uk/usas/usas_guide.pdf).
1830
+
1831
+ The semantic tagger is a variation of the [Bi-Encoder Model (BEM) from Blevins and Zettlemoyer 2020](https://aclanthology.org/2020.acl-main.95.pdf) a Word Sense Disambiguation (WSD) model.
1832
+
1833
+ ## Table of contents
1834
+
1835
+ ## Quick start
1836
+
1837
+ ### Installation
1838
+
1839
+ Requires Python `3.10` or greater, it is best that you install the version of PyTorch you would like to use, e.g. CPU/GPU version etc before installing this package else you will get the default version of PyTorch for your operating system/setup, but we do require `torch>=2.2,<3.0`.
1840
+
1841
+ ``` bash
1842
+ pip install wsd-torch-models
1843
+ ```
1844
+
1845
+ ### Usage
1846
+
1847
+ ``` python
1848
+ from transformers import AutoTokenizer
1849
+ import torch
1850
+
1851
+ from wsd_torch_models.bem import BEM
1852
+
1853
+
1854
+ if __name__ == "__main__":
1855
+ wsd_model_name = "ucrelnlp/PyMUSAS-Neural-Multilingual-Small-BEM"
1856
+ wsd_model = BEM.from_pretrained(wsd_model_name)
1857
+ tokenizer = AutoTokenizer.from_pretrained(wsd_model_name, add_prefix_space=True)
1858
+
1859
+ wsd_model.eval()
1860
+ # Change this to the device you would like to use, e.g. cpu
1861
+ model_device = "cpu"
1862
+ wsd_model.to(device=model_device)
1863
+
1864
+ sentence = "The river bank was full of fish"
1865
+ sentence_tokens = sentence.split()
1866
+
1867
+ with torch.inference_mode(mode=True):
1868
+ # sub_word_tokenizer can be None when None it will download the appropriate tokenizer
1869
+ # but generally it is better to give it the tokenizer as it saves the operation
1870
+ # of checking if the tokenizer is already downloaded.
1871
+ predictions = wsd_model.predict(sentence_tokens, sub_word_tokenizer=tokenizer, top_n=5)
1872
+
1873
+ for sentence_token, semantic_tags in zip(sentence_tokens, predictions):
1874
+ print("Token: "+ sentence_token)
1875
+ print("Most likely tags: ")
1876
+ for tag in semantic_tags:
1877
+ tag_definition = wsd_model.label_to_definition[tag]
1878
+ print("\t" + tag + ":" + tag_definition)
1879
+ print()
1880
+ ```
1881
+
1882
+ ## Model Description
1883
+
1884
+ For more details about the model and how it was trained please see the [citation/technical report](#citation), as well as the links in the [model sources section.](#model-sources)
1885
+
1886
+ ### Model Sources
1887
+
1888
+ The training repository contains the code used to train this model. The inference repository contains the code used to run the model as shown in the [usage section.](#usage)
1889
+
1890
+ - Training Repository: [https://github.com/UCREL/experimental-wsd](https://github.com/UCREL/experimental-wsd)
1891
+ - Inference/Usage Repository: [https://github.com/UCREL/WSD-Torch-Models](https://github.com/UCREL/WSD-Torch-Models)
1892
+
1893
+ ### Model Architecture
1894
+
1895
+ | Parameter | 17M English | 68M English | 140M Multilingual | 307M Multilingual |
1896
+ |:----------|:----|:----|:----|:-----|
1897
+ | Layers | 7 | 19 | 22 | 22 |
1898
+ | Hidden Size | 256 | 512 | 384 | 768 |
1899
+ | Intermediate Size | 384 | 768 | 1152 | 1152 |
1900
+ | Attention Heads | 4 | 8 | 6 | 12 |
1901
+ | Total Parameters | 17M | 68M | 140M | 307M |
1902
+ | Non-embedding Parameters | 3.9M | 42.4M | 42M | 110M |
1903
+ | Max Sequence Length | 8,000 | 8,000 | 8,192 | 8,192 |
1904
+ | Vocabulary Size | 50,368 | 50,368 | 256,000 | 256,000 |
1905
+ | Tokenizer | ModernBERT | ModernBERT | Gemma 2 | Gemma 2 |
1906
+
1907
+ ## Training Data
1908
+
1909
+ The model has been trained on a portion of the [ucrelnlp/English-USAS-Mosaico](https://huggingface.co/datasets/ucrelnlp/English-USAS-Mosaico), specifically [data/wikipedia_shard_0.jsonl.gz](https://huggingface.co/datasets/ucrelnlp/English-USAS-Mosaico/blob/main/data/wikipedia_shard_0.jsonl.gz), which contains 1,083 English Wikipedia articles, with 444,880 sentences, 6.6 million tokens, with 5.3 million silver labelled tokens generated by a English rule based semantic tagger.
1910
+
1911
+ ## Evaluation
1912
+
1913
+ We have evaluated the models on 5 datasets from 5 different languages, 4 of these datasets are publicly available whereas one (the Irish data) requires permission from the data owner to access it. The results for these models using top 1 and top 5 accuracy results are shown below, for a more comprehensive comparison please see the technical report.
1914
+
1915
+ | Dataset | 17M English | 68M English | 140M Multilingual | 307M Multilingual |
1916
+ |:----------|:----|:----|:----|:-----|
1917
+ | **Top 1** | | | | |
1918
+ | Chinese | - | - | 42.2 | 47.9 |
1919
+ | English | 66.4 | 70.1 | 66.0 | 70.2 |
1920
+ | Finnish | - | - | 15.8 | 25.9 |
1921
+ | Irish | - | - | 28.5 | 35.6 |
1922
+ | Welsh | - | - | 21.7 | 42.0 |
1923
+ | **Top 5** | | | | |
1924
+ | Chinese | - | - | 66.3 | 70.4 |
1925
+ | English | 87.6 | 90.0 | 88.9 | 90.1 |
1926
+ | Finnish | - | - | 32.8 | 42.4 |
1927
+ | Irish | - | - | 47.6 | 51.6 |
1928
+ | Welsh | - | - | 40.8 | 56.4 |
1929
+
1930
+ The publicly available datasets can be found on HuggingFace Hub [ucrelnlp/USAS-WSD](https://huggingface.co/datasets/ucrelnlp/USAS-WSD).
1931
+
1932
+ **Note** the English models have not been evaluated on the non-English datasets as they are unlikely to be able to represent non-English text well or perform well on non-English data.
1933
+
1934
+ ## Citation
1935
+
1936
+ Technical report is forthcoming.
1937
+
1938
+ ## Contact Information
1939
+
1940
+ * Paul Rayson (p.rayson@lancaster.ac.uk)
1941
+ * Andrew Moore (a.p.moore@lancaster.ac.uk / andrew.p.moore94@gmail.com)
1942
+ * UCREL Research Centre (ucrel@lancaster.ac.uk) at Lancaster University.