Jelena Mitrović's picture

Jelena Mitrović

Jecovit

·

https://ca-roll.github.io/

AI & ML interests

NLP, LLMs

Recent Activity

upvoted an article about 2 months ago

KV Caching Explained: Optimizing Transformer Inference Efficiency

liked a dataset 3 months ago

mteb/WebFAQRetrieval

upvoted an article 11 months ago

Binary and Scalar Embedding Quantization for Significantly Faster & Cheaper Retrieval

View all activity

Organizations

upvoted an article about 2 months ago

Article

KV Caching Explained: Optimizing Transformer Inference Efficiency

not-lain

•

Jan 30, 2025

• 347

upvoted an article 11 months ago

Article

Binary and Scalar Embedding Quantization for Significantly Faster & Cheaper Retrieval

+1

aamirshakir, tomaarsen, SeanLee97

•

Mar 22, 2024

• 135