moka-ai
/

m3e-base

sentence-transformers

Model card Files Files and versions

最长支持多少token的embedding？

#8

by cluo - opened Jul 6, 2023

请问下最长支持多少token的embedding？
是否受限于Bert的512 token限制？

Moka HR SaSS org Jul 6, 2023

是的，受限于基础模型，最大长度支持 512 个 token

谢谢回答，看介绍说这个模型比较适合答案召回的模式？
就是问题/答案这种模式，问题较短，回答较长

Moka HR SaSS org Jul 7, 2023

m3e 在召回（检索）的场景下有很大的优势，当然在相似问题检测等场景也有优势，但是没有那么大。

不过 m3e 在 ReRanking 上面表现不好... 我现在在研究如何提高这个场景的表现

请问，中文里面，每个token是对应一个字还是一个词？

Moka HR SaSS org Jul 20, 2023

一般是一个字

请问下，部署模型对硬件有什么要求

Moka HR SaSS org Jul 24, 2023

对硬件没有什么要求，看您使用的具体场景。CPU,GPU,TPU 均可。

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment