IA : la machine surpasse l'être humain en capacité de synthèse

Selon une étude publiée par l'Université de Pékin (*), les grands modèles de langage (#LLM) comme GPT-3.5 et GPT-4 génèrent des résumés de meilleure qualité que ceux produits par des humains.

Les chercheurs ont mené une évaluation humaine sur 5 tâches de résumé (article, dialogue, multilingue, code source et multi-documents) et ont constaté :
1- les résumés des LLM sont largement préférés par les évaluateurs humains,
2- ils présentent une meilleure cohérence factuelle et moins d'hallucinations que les résumés humains,
3- les LLM s'adaptent mieux à la longueur et au contenu à résumer.

Et ils auraient pu ajouter : la tâche est réalisée beaucoup plus vite par l'#IA ! (on parle de secondes...).

"Harder, better, faster, stronger" : nous sommes rentrés de plein pied dans la Révolution Cognitive !

Qui fera encore une synthèse ou un compte-rendu "à la main" en 2024 ?

(*) Xiao Pu, Mingqi Gao, Xiaojun Wan, "Summarization is (Almost) Dead", 18 septembre 2023