Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Sommaire
Google Books est considéré comme une ressource essentielle pour les universitaires et les chercheurs, car il répertorie une grande quantité de matériel publié, ce qui en fait une mine de trésors pour la recherche. Cependant, il semblerait qu’il y ait des inquiétudes concernant la qualité de certains contenus répertoriés sur le site.
Des informations ont fait état de l’indexation, par Google Books, de livres de qualité inférieure qui pourraient avoir été écrits par des IA. Cette situation aurait un impact sur l’exactitude de son outil de suivi du langage, Ngram. De plus, il a été découvert lors d’une recherche que certains livres indexés par Google Books sembleraient avoir été rédigés par un bot et ne traitaient pas le sujet de l’IA pertinemment. Certains des ouvrages en question comprenaient des contenus provenant de Wikipedia et des informations dépassées, ce qui suscite des préoccupations quant à la qualité et la fiabilité des travaux indexés.
Ngram est un outil de recherche qui suit l’évolution du langage à l’aide de données provenant de Google Books et pourrait être influencé par l’inclusion d’œuvres mal écrites ou non pertinentes dans sa base de données. Selon Google, les travaux récents sur Google Books n’affectent actuellement pas les résultats de Ngram, mais ils pourraient être inclus dans les mises à jour futures.
Ngram se fie à des données provenant d’ouvrages remontant au 16e siècle, la dernière actualisation datant de 2019, et est fréquemment sollicité par des linguistes et des chercheurs pour la recherche linguistique. Cependant, des inquiétudes ont été exprimées quant à l’intégrité et à l’exactitude des données contenues dans Ngram, en raison de l’inclusion éventuelle d’œuvres de faible qualité ou écrites par des IA provenant de Google Books.
Il faut donc espérer que Google prendra des mesures pour vérifier la qualité des ouvrages indexés sur Google Books, afin de conserver l’utilité et l’exactitude de son outil de suivi du langage Ngram. En attendant, il est recommandé aux chercheurs d’exercer une certaine prudence lorsqu’ils utilisent ces outils pour leurs recherches, en gardant à l’esprit que certaines données peuvent être inexactes ou peu fiables.
Google Books indexe le contenu des livres et magazines qu’il a numérisés et stockés dans sa base de données numérique à l’aide de la reconnaissance optique de caractères (OCR).
L’outil Ngram de Google est un outil de recherche qui permet de suivre l’évolution de l’usage du langage en recueillant des informations à partir de textes écrits.
Sur Google Books, les utilisateurs peuvent accéder aux vues « Full view », « Preview » et « Snippet view » en fonction des autorisations de copyright et des restrictions imposées par les éditeurs.
Certains livres indexés par Google Books semblent avoir été écrits par une intelligence artificielle en raison de leur mauvaise qualité et de leur contenu incohérent par rapport au sujet.
L’indexation de livres de mauvaise qualité par Google Books pourrait potentiellement affecter les résultats et l’analyse de l’outil Ngram en introduisant des données incorrectes dans ses analyses linguistiques.