Author name: Jason Qiu, Zachary Meurer, Xavier Thomas, Deepti Ghadiyaram

Semantic Richness or Geometric Reasoning? The Fragility of VLM’s Visual Invariance

Jason Qiu, Zachary Meurer, Xavier Thomas, Deepti Ghadiyaram / April 6, 2026

arXiv:2604.01848v2 Announce Type: replace
Abstract: This work investigates the fundamental fragility of state-of-the-art Vision-Language Models (VLMs) under basic geometric transformations. While modern VLMs excel at semantic tasks such as recognizing…

cs.CV

Semantic Richness or Geometric Reasoning? The Fragility of VLM’s Visual Invariance

Jason Qiu, Zachary Meurer, Xavier Thomas, Deepti Ghadiyaram / April 3, 2026

arXiv:2604.01848v1 Announce Type: new
Abstract: This work investigates the fundamental fragility of state-of-the-art Vision-Language Models (VLMs) under basic geometric transformations. While modern VLMs excel at semantic tasks such as recognizing obj…