ENGLISH
La vitrine de diffusion des publications et contributions des chercheurs(-euses) de l'ÉTS
RECHERCHER

DIVE-Doc: Downscaling foundational image visual encoder into hierarchical architecture for DocVQA

Bencharef, Rayane, Rahiche, Abderrahmane et Cheriet, Mohamed. 2025. « DIVE-Doc: Downscaling foundational image visual encoder into hierarchical architecture for DocVQA ». In IEEE/CVF International Conference on Computer Vision Workshops (ICCVW) (Honolulu, HI, USA, Oct. 19-20, 2025) pp. 7597-7606. Institute of Electrical and Electronics Engineers Inc..

Le plein texte de ce document n'est pas hébergé sur ce serveur.
Rechercher dans Google Scholar
Type de document: Compte rendu de conférence
Chercheur(-euse):
Chercheur(-euse)
Cheriet, Mohamed
Affiliation: Génie des systèmes
Date de dépôt: 29 avr. 2026 15:54
Dernière modification: 29 avr. 2026 15:54
URI: https://espace2.etsmtl.ca/id/eprint/33646

Actions (Authentification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt