5 54 2

Zhen Fang

CostaliyA

https://costaliya.github.io/

CostaliyA

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

GameplayQA: A Benchmarking Framework for Decision-Dense POV-Synced Multi-Video Understanding of 3D Virtual Agents

upvoted a paper 5 days ago

mSFT: Addressing Dataset Mixtures Overfiting Heterogeneously in Multi-task SFT

upvoted a paper 26 days ago

Mind-Brush: Integrating Agentic Cognitive Search and Reasoning into Image Generation

View all activity

Organizations

None yet

upvoted a paper 3 days ago

GameplayQA: A Benchmarking Framework for Decision-Dense POV-Synced Multi-Video Understanding of 3D Virtual Agents

Paper • 2603.24329 • Published 4 days ago • 17

upvoted a paper 5 days ago

mSFT: Addressing Dataset Mixtures Overfiting Heterogeneously in Multi-task SFT

Paper • 2603.21606 • Published 6 days ago • 36

upvoted a paper 26 days ago

Mind-Brush: Integrating Agentic Cognitive Search and Reasoning into Image Generation

Paper • 2602.01756 • Published Feb 2 • 23

upvoted a paper 27 days ago

OmniGAIA: Towards Native Omni-Modal AI Agents

Paper • 2602.22897 • Published Feb 26 • 53

upvoted a paper about 1 month ago

VimRAG: Navigating Massive Visual Context in Retrieval-Augmented Generation via Multimodal Memory Graph

Paper • 2602.12735 • Published Feb 13 • 4

upvoted a paper about 2 months ago

Internalizing Meta-Experience into Memory for Guided Reinforcement Learning in Large Language Models

Paper • 2602.10224 • Published Feb 10 • 19

authored 2 papers about 2 months ago

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

Paper • 2602.02185 • Published Feb 2 • 117

Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models

Paper • 2601.22060 • Published Jan 29 • 155

upvoted 3 papers about 2 months ago

GEBench: Benchmarking Image Generation Models as GUI Environments

Paper • 2602.09007 • Published Feb 9 • 39

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

Paper • 2602.02185 • Published Feb 2 • 117

Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models

Paper • 2601.22060 • Published Jan 29 • 155

upvoted 2 papers 2 months ago

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

Paper • 2601.09688 • Published Jan 14 • 127

Stochastic CHAOS: Why Deterministic Inference Kills, and Distributional Variability Is the Heartbeat of Artifical Cognition

Paper • 2601.07239 • Published Jan 12 • 3

upvoted a collection 2 months ago

VisionLM

Collection

1884 items • Updated Jan 12 • 144

updated a model 2 months ago

CostaliyA/UniCorn

Any-to-Any • Updated Jan 13 • 7 • 2

upvoted a paper 3 months ago

Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning

Paper • 2601.06943 • Published Jan 11 • 214

New activity in CostaliyA/UniCorn 3 months ago

release model

#1 opened 3 months ago by

Hungryyan

liked a model 3 months ago