HARM: Learning hate-aware reward model for evaluating natural language explanations of offensive content

Vecchi, Lorenzo Puppi, de Souza Britto, Alceu, Paraiso, Emerson Cabrera et Menelau Cruz, Rafael. 2026. « HARM: Learning hate-aware reward model for evaluating natural language explanations of offensive content ». In 19th Conference of the European Chapter of the Association for Computational Linguistics, Findings of EACL (Rabbat, Morocco, Mar. 2026) 4393–4431. Association for Computational Linguistics (ACL).

Le plein texte de ce document n'est pas hébergé sur ce serveur.

Rechercher dans Google Scholar

URL Officielle: https://doi.org/10.18653/v1/2026.findings-eacl.230

Type de document:	Compte rendu de conférence
Chercheur(-euse):	Chercheur(-euse) Menelau Cruz, Rafael
Affiliation:	Génie logiciel et des technologies de l'information
Date de dépôt:	03 juin 2026 18:34
Dernière modification:	03 juin 2026 18:34
URI:	https://espace2.etsmtl.ca/id/eprint/33802

Actions (Authentification requise)

Dernière vérification avant le dépôt