DIVE-Doc: Downscaling foundational image visual encoder into hierarchical architecture for DocVQA

Bencharef, Rayane, Rahiche, Abderrahmane et Cheriet, Mohamed. 2025. « DIVE-Doc: Downscaling foundational image visual encoder into hierarchical architecture for DocVQA ». In IEEE/CVF International Conference on Computer Vision Workshops (ICCVW) (Honolulu, HI, USA, Oct. 19-20, 2025) pp. 7597-7606. Institute of Electrical and Electronics Engineers Inc..
Compte des citations dans Scopus : 1.

Le plein texte de ce document n'est pas hébergé sur ce serveur.

Rechercher dans Google Scholar

URL Officielle: https://doi.org/10.1109/ICCVW69036.2025.00782

Type de document:	Compte rendu de conférence
Chercheur(-euse):	Chercheur(-euse) Cheriet, Mohamed
Affiliation:	Génie des systèmes
Date de dépôt:	29 avr. 2026 15:54
Dernière modification:	29 avr. 2026 15:54
URI:	https://espace2.etsmtl.ca/id/eprint/33646

Actions (Authentification requise)

Dernière vérification avant le dépôt