Topic on Wikidata:Bistro/Archives des discussions structurées

Combien de fois peut on corriger une information fausse

30
Cgolds (talkcontribs)

Bonjour, J'ai supprimé hier une information fausse sur Charles Hermite (Charles Hermite (Q168401)) concernant ses prétendus directeurs de thèse. Il n'a jamais eu de directeurs de thèse, parce qu'il n'a jamais eu de thèse (oui il y a des sources pour cela). Ceci a été mis automatiquement par un bot, à partir d'une base de données non fiable (oui, j'ai aussi informé la base de données en question, mais comme ils aiment pouvoir remonter jusqu'à Euclide pour tout le monde, il y a peu de chances que cela se calme là). Aujourd'hui un autre bot a remis ces informations fausses. Je viens de les enlever à nouveau. J'ai bien sûr prévenu les dresseurs de ces bots, mais je dois dire que je suis perplexe devant ces remplissages automatiques non surveillés. Combien y en-a-t-il ? Cordialement

Jura1 (talkcontribs)

C'est une erreur de supprimer des informations référencées. Voir Help:Ranking/fr pour apprendre comment les traiter.

Cgolds (talkcontribs)

Mais elles ne sont pas référencées ! Et ce ne sont pas des informations. Une base de données amateur essaie de mettre des directeurs de thèse à toutes les périodes pour faire remonter tout le monde à Euclide. Il n'y a aucune information sourcée sérieuse qui prétend qu'Hermite a passé une thèse, c'est absurde. Vous voulez dire que dès que quelqu'un va inventer sur un site quelconque quelque chose de faux, on va le répertorier ici avec un rang ? Et qu'on ne corrige pas les données fausses sur Wikidata ? Cordialement

Jura1 (talkcontribs)

oui

Nomen ad hoc (talkcontribs)

Bonjour Cgolds,

en l'occurrence, si DeltaBot a remis les déclarations incriminées, c'est parce l'information (ou pseudo-information) est déclarée en sens inverse sur les éléments des directeurs de thèse supposés (Hermite y étant indiqué comme leur doctorant).

Cgolds (talkcontribs)

Merci, mais cela ne me dit pas comment procéder : car il y a une contradiction. Soit on enlève les informations fausses (mises automatiquement dans les deux sens...), soit non. En l'occurrence, un (autre bot) a ajouté des renseignements tirés (avec une interprétation fausse, peut-être due au problème de la langue) d'un wikipédia et de ses catégories, ou sans aucune référence. Et ce bot les a complétés. Donc il n'y avait aucune référence sérieuse au départ. Je ne parle pas ici d'informations dont deux sources sérieuses donneraient des versions différentes (cela existe et bien sûr, on laisse avec les références, éventuellement en indiquant que l'une est obsolète, on met des rangs, etc). Je parle d'erreurs causées par le fonctionnement de Wikidata. Cordialement

Nomen ad hoc (talkcontribs)

Oui, je n'ai qu'une explication de la situation à proposer. De plus : le premier ajout a semble-t-il été fait manuellement, à partir de la WP russophone.

Jura1 (talkcontribs)
Nomen ad hoc (talkcontribs)

Je ne connais pas Distributed game, mais j'imagine que cela consistait à reporter la mention qui se trouvait déjà dans l'élément d'Hermite (ajoutée deux ans auparavant, là encore manuellement, mais en se fondant sur le MGP)

Cgolds (talkcontribs)

Très amusant, parce que Math Gen se sert de Wikidata et de Wikipedia pour "compléter". Donc la référence ajoutée vient sans doute d'un double retour. Le problème est que je ne suis pas d'accord pour mettre cela en "rang désuet". Cela n'est pas désuet, vous ne trouverez cela nulle part à une autre époque dans la littérature sérieuse sur Hermite ou Catalan, c'est une pure création des échanges de bases de données. Hermite n'a jamais eu de thèse (et donc ce serait difficile de trouver une référence pour son ou ses directeurs de thèse), là on peut donner des références (!), il y a des listes de thèses au 19e siècle et des biographies. Mais je ne sais pas indiquer la propriété : n'a pas eu de thèse. Cordialement

Jura1 (talkcontribs)

"citogenesis"?

Quel autre moyen d'y mettre fin?

Simon Villeneuve (talkcontribs)
Cgolds (talkcontribs)

Super (heureusement qu'on a WP pour dire des choses raisonnables). Sérieusement : un moyen serait que les contraintes soient contraignantes, déjà (par exemple qu'on ne puisse pas attribuer à Fermat en 1623 un diplôme d'une université créée en 1966 - j'ai corrigé cela aujourd'hui en me plantant au passage à cause d'un moteur de recherche sur WD pas très efficace). Il y a un signal, mais cela ne semble pas gêner grand monde. Ici  : pas de directeur de thèse si pas de thèse, celle-ci obtenue à un endroit où on peut obtenir une thèse. Mais il faut prendre la mesure de la contradiction : il est question de corriger les wp par des données WD. Si WD ne peut éliminer des infos fausses parce qu'elles sont sourcées par un WP (ou par un site qui utilise WP comme source), euh, comment dire, on va avoir plein d'incidents citogénétiques (je connaissais pas ce terme, je l'adore, merci beaucoup). Amicalement

Bouzinac (talkcontribs)

Juste pour savoir, existe-t-il sur Wikidata un genre de règle R3R ou autre conflit d'édition répétée ?

VIGNERON (talkcontribs)

Alors : en premier lieu, non ce n'est visiblement pas un cas d'incident citogénétique, la source originelle étant cet article http://www-history.mcs.st-andrews.ac.uk/Biographies/Hermite.html du School of Mathematics and Statistics, University of St Andrews, Scotland.

Ensuite, pourquoi diable ne pas laisser ces informations avec le rang désuet, c'est exactement pour ce genre de cas que les rangs ont été mis en place. Cela évite le retour de l'information et que personne ne l'utilise plus à l'avenir, la solution idéale non ?

Jura1 (talkcontribs)

Mauvaise habitude de Wikipedia? .. plutôt que de noter une fois que c'est faux, on préfère supprimer chaque mois.

Cgolds (talkcontribs)

Ben non, le site de Saint Andrews ne dit absolument pas cela, justement. Il dit que Hermite a été "tutored" par Catalan en lien avec l'école polytechnique, cela n'a rien à voir avec une direction de thèse. Comme j'ai dit à plusieurs reprises je n'aurais pas tiqué si Hermite avait été qualifié d'élève de Catalan (propriété qui existe et est différente de "doctorant" ), avec cette source, et non de doctorant. Je n'ai rien contre le fait de noter que quelque chose est faux, comme j'ai dit, mais dans le cas présent, je ne saurai même pas quelle source mettre pour cette "information obsolète" puisque celle indiquée ne la contient pas ! Sur Wp, on peut noter que c'est faux sur la page de discussion, c'est aussi ce que j'ai fait ici quand j'ai annulé l'entrée la première fois. Si cela a fait l'objet d'un débat, avec des sources contradictoires, (exemple: date de naissance de Fermat), on en parle aussi dans l'article même, ce qui est aussi fait ici. Le fonctionnement théorique me semble donc très proche, et de fait non problématique. Encore une fois s'il y a un moyen de dire que quelque chose est faux, cela me va très bien. Mais ici cela n'a rien de désuet, comme j'ai dit, et la source de l'information n'est pas un site universitaire ou un ouvrage, etc. Cordialement

VIGNERON (talkcontribs)

Ah oui, effectivement.

Ceci dit, pour la direction de thèse il reste toujours le premier site https://www.genealogy.math.ndsu.nodak.edu/id.php?id=32960 (une référence circulaire est tout de même une référence, d'ailleurs est-ce vraiment une référence circulaire ? et je vois que le MGP est un projet universitaire géré par des mathématiciens, donc pas vraiment « base de données amateur »). Je ne vois aucune raison de ne pas remettre ces informations !

« Encore une fois s'il y a un moyen de dire que quelque chose est faux, cela me va très bien. Mais ici cela n'a rien de désuet ». Le rang désuet sert justement très exactement à dire que quelque chose est faux !

Bouzinac (talkcontribs)

N'y avait il pas un débat à un moment donné pour repréciser le libellé français du rang désuet ? je ne retrouve plus...

VIGNERON (talkcontribs)

Si, il y a eu moultes discussions sur la traduction en français, j'en avais listé certaines sur Help_talk:Ranking/fr. De toute façon quand on traduit un concept en mot, il y a forcément des imperfections (traducteur, traditeur), c'est pour cela qu'il vaut toujours mieux essayer de comprendre le concept plutôt que ses représentations.

Cgolds (talkcontribs)

Bonjour, Comme j'ai dit, le concept élève traduit bien la source ici et pas le concept "doctorant" (dont on pourrait estimer qu'il faut double emploi si on veut des propriétés aussi larges que possible). Le site Math Gen est rempli à la demande et a été créé au départ pour s'amuser, comme souvent (voir Facebook !), ces sites ont acquis un étrange statut d'autorité par le monde extérieur. C'est en l'occurrence une base de données amateur (disons comme WD), ce ne sont pas des données importées d'une manière élaborée par un groupe de personnes qui ont réfléchi au contenu du projet, en particulier pour les époques pré-20e siècle (où il faudrait des historiens, pas des mathématiciens). J'ai dû rectifier la liste de mes propres doctorants (et on parle ici de données publiques, récentes, etc) et en l'occurrence ils n'ont même pas utilisé les listes de thèses qui existent pour le 19e. Franchement, quel professionnalisme dans le fait d'attribuer des doctorants à des auteurs de l'Antiquité ? J'ai envoyé à MathGen un rectificatif pour qu'ils enlèvent l'information - nous passons pas mal de temps à cela, corriger les bases de données.

Si on veut construire une base de données fiable et solide, le ranking est très bien, etc, mais pas à partir de n'importe quel site. S'il y a un rang "faux", pourquoi pas (avec source, ici cela ne manque pas). Mais je fais remarquer qu'ici cela ne résoudra pas le problème : un ranking désuet est utile pour mettre au 3e plan une donnée devenue fausse, mais cela ne sert que si elle est remplacée par la vraie info, sinon c'est la fausse qui sera utilisée par exemple dans les infobox, ou je me trompe ?. Or là on ne pourra jamais remplir une bonne valeur de directeur de thèse (Hermite est mort en 1901, sauf voyage temporel, on ne va pas lui faire passer une thèse maintenant). Donc si vous voulez maintenir cette donnée, il faut trouver un moyen que ce ne soit pas utilisé, c'est-à-dire qu'il faut distinguer faux et obsolète, etc.

Et il faudrait imposer d'autres contraintes, pas de doctorant/directeur de thèse sans thèse (avec titre, date, institution). Même si ce n'est pas rempli, ni sourcé (puisqu'il y a des gens qui entrent les informations sans source), cela indiquera un éventuel problème.

Merci en tout cas pour toute cette discussion et votre patience, Bien cordialement

VIGNERON (talkcontribs)

« sinon c'est la fausse qui sera utilisée par exemple dans les infobox, ou je me trompe ?. » tu te trompes rien ne sera affiché dans l'infobox (ou ailleurs). « il faut distinguer faux et obsolète » si ce sont effectivement des choses différentes, c'est bien le même rang que l'on utilise.

La réalité est fort complexe et sans parler de « voyage temporel » il y a des actions posthumes bien après la mort des personnes.

« pas de doctorant/directeur de thèse sans thèse » euh sauf erreur cette affirmation est équivalente à « tout personne commençant se thèse la finit instantanément » mais à part des effets de bords (qu'il faudrait vérifier attentivement, voir aussi Property_talk:P184#Nécessité_d'une_thèse_?), oui, dans l'aboslu une telle contrainte pourrait être utile.

Pas de problème, le Bistro est là pour cela !

Alexander Doria (talkcontribs)

Je vois cette discussion en cours de route. Il y a effectivement un problème récurrent avec la plupart des sources issues du genealogy math project : hors du monde germanique la direction de thèse, même informelle, n'est pas attestée avant le 19e voire le 20e siècle dans certaines disciplines. Le problème vient probablement d'une limitation du projet qui ne renseigne à la base que des doctorats mais a entrepris d'élargir la chronologie des généalogies au-delà du 19e siècle. Sur Wikidata il n'y a pas ce problème : student of (P1066) et student (P802) font entièrement l'affaire. student of (P1066) devrait d'ailleurs être la propriété par défaut pour documenter des généalogies, student (P802) étant uniquement réservé aux "étudiants notables".

Je serai d'avis de basculer automatiquement tous les liens de doctorat antérieurs à 1800 non sourcés ou uniquement sourcés avec genealogy math en "étudiant de".

Je pense que l'on peut utiliser doctoral advisor (P184)/doctoral student (P185) avec une certaine souplesse dans la période de transition de 1800-1950. En France, les thèses n'étaient généralement pas dirigées (et pour les humanités il y avait généralement deux thèses, en français et en latin) mais les sources mentionnent parfois des mentors qui jouent un peu similaire aux directeurs de thèses aujourd'hui.


VIGNERON (talkcontribs)

Recopié les faux "directeur de thèse" en student of (P1066)/student (P802) (les deux s'utilisent toujours ensemble d'ailleurs), d'accord, pas de problème. Par contre, tant qu'il y a une source (et à moins de vouloir lutter contre les moulins que sont les bots), je laisserais les informations erronnées en indiquant clairement qu'elles le sont.

En attendant, voici déjà une requête pour les éléments avec doctoral advisor (P184) et mort avant 1500 : https://w.wiki/6BH (ceux-là au moins sont clairement à traiter en priorité et il n'y a sans doute pas de faux-positif).

Ash Crow (talkcontribs)

"(et à moins de vouloir lutter contre les moulins que sont les bots)"

Il y a un moyen très simple d'empêcher un bot de continuer à insérer une information fausse à répétition, c'est de le bloquer.

Alexander Doria (talkcontribs)

Ah merci. Je vais revérifier mais dans mon souvenir la première direction de thèse attestée remonte à 1630 en pays germanique (donc on peut y aller à la hache avant 1600 sans problème).

Pour l'utilisation en miroir de student of (P1066)/student (P802) c'est encore un autre problème : normalement student (P802) ne devait servir qu'à documenter les étudiants illustres (comme un enseignant connu peut en avoir eu beaucoup…). La mise en place d'une contrainte inversée a tout blackboulé (je ne sais même pas comment cela s'est décidé).

Nomen ad hoc (talkcontribs)

Bonne idée que de basculer plutôt en maître/étudiant.

(Au passage, je m'interroge sur la notion de "notabilité" des étudiants déclarés via élève (a-t-elle été sérieusement définie ?), mais ca sort probablement du sujet...)

Alexander Doria (talkcontribs)

J'ai retrouvé : le premier docteur attesté au sens moderne serait Erhard Weigel (Q73014) (l'un des maîtres de Leibniz). Il a soutenu deux thèses en 1652 : Dissertatio Metaphysica Prior (De Existentia) et Posterior (De Modo Existentiae, qui dicitur Duratio). Ce n'est pas clair du tout s'il y a eu également une direction de thèse (MathGen mentionne Philipp Müller (Q109091) mais sans source complémentaire je n'y mettrais pas ma main à couper) mais au moins les thèses existent. Donc tous les morts avant 1650 sont a priori hors limite.

Cgolds (talkcontribs)

Bonjour, il y a des thèses avant cela, par exemple (et je pense que c'est un exemple tardif) la Ratio studiorum des jésuites de 1599 donne les conditions de soutenance de thèses (A. Romano, La contre réforme mathématique, Ecole française de Rome, 1999, p. 498-499), mais ce sont des exercices oraux surtout, avec des placards résumés, pas grand chose à voir avec les thèses "modernes" et parfois des soutenances collectives. On pourrait envisager effectivement de ne garder que les situations impliquant un écrit, etc.

Mais la discussion ici s'est engagée autour de quelqu'un qui n'avait pas de thèse du tout et à qui on avait collé deux directeurs de thèse pour faire bonne mesure :) !

Personnellement, je n'ai rien contre le fait de garder les deux propriétés doctorant/directeur de thèse et élève/maître, à condition de garder à la première son sens bien technique (soutenance de thèse). L'intérêt est que c'est en général mieux défini que maitre/élève pour la période moderne et contemporaine. Ou alors on met doctorant/directeur de thèse en qualificatif comme un cas particulier de la situation maitre/élève ? Amicalement

VIGNERON (talkcontribs)

Je vous laisse continuer cette discussion (peut-être sur un projet spécifique ? ce serait préférable pour une bonne structuration).

En attendant, j'ai remis ces infos avec le rang désuet comme on le fait habituellement.

Reply to "Combien de fois peut on corriger une information fausse"