Alexandra Yakovleva, Henrik P\"arssinen, Harri Valpola, Juho Kannala, Alexander Ilin

Tuning Qwen2.5-VL to Improve Its Web Interaction Skills

Alexandra Yakovleva, Henrik P\"arssinen, Harri Valpola, Juho Kannala, Alexander Ilin / April 14, 2026

arXiv:2604.09571v1 Announce Type: cross
Abstract: Recent advances in vision-language models (VLMs) have sparked growing interest in using them to automate web tasks, yet their feasibility as independent agents that reason and act purely from visual in…

Author name: Alexandra Yakovleva, Henrik P\"arssinen, Harri Valpola, Juho Kannala, Alexander Ilin

Tuning Qwen2.5-VL to Improve Its Web Interaction Skills