Giacomo Frisoni, Lorenzo Molfetta, Mattia Buzzoni, Gianluca Moro

Graph-of-Mark: Promote Spatial Reasoning in Multimodal Language Models with Graph-Based Visual Prompting

Giacomo Frisoni, Lorenzo Molfetta, Mattia Buzzoni, Gianluca Moro / March 27, 2026

arXiv:2603.06663v2 Announce Type: replace
Abstract: Recent advances in training-free visual prompting, such as Set-of-Mark, have emerged as a promising direction for enhancing the grounding capabilities of multimodal language models (MLMs). These tech…

Author name: Giacomo Frisoni, Lorenzo Molfetta, Mattia Buzzoni, Gianluca Moro

Graph-of-Mark: Promote Spatial Reasoning in Multimodal Language Models with Graph-Based Visual Prompting