User:Pmartinolli/Predatory publishing and Wikidata

Indexing predatory publishers edit

Ontologies around predatory publishing edit

  • predatory publishing (Q29959533) : recommended use in Main Subject to describe the content of documents on this topic
  • Beall's list of predatory open access journals (Q56273878)

Visualizing predatory publishing in Wikidata edit

All articles of a selected publisher by a selected university author edit

See https://www.wikidata.org/wiki/User:Pmartinolli/UdeM_SPARQL


Scholia : scholarly article about Predatory Publishing edit

All scholarly articles talking about Predatory publishing edit

SELECT ?item ?itemLabel
WHERE
{
  ?item wdt:P31 wd:Q13442814.
  ?item wdt:P921 wd:Q29959533.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}
Try it!

Retrieving predatory content in Wikidata edit

  • Ethic/ legal question : the journal Anthropology could be predatory (OMICS group) but the information is only in the description, there is no statement indexed about it. What to do ? What is the risk ?

As per this query, there is 16 OMICS journals in WD (2022-02-16) :

SELECT ?revue_p WHERE {
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
  ?revue_p wdt:P123 wd:Q7072722.
}
LIMIT 100
Try it!

Query listing all the articles from an OMICS journal in WD (using a subquery) :

SELECT ?revue_p ?revue_pLabel ?article ?articleLabel WHERE {
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
  ?revue_p wdt:P123 wd:Q7072722.
  ?article wdt:P1433 ?revue_p.
  {SELECT ?article WHERE  { ?article wdt:P31 wd:Q13442814. } }
}
Try it!


Indexing annexe : Listing all articles with "predatory" in the title (ie. Label) edit

SPARQL edit

After 2007 + except the ones already indexed with Main subject = Predatory publishing

SELECT DISTINCT ?item ?itemLabel WHERE {
  ?item wdt:P31 wd:Q13442814;
    rdfs:label ?itemLabel.
  ?item wdt:P577 ?date FILTER (?date > "2007-01-01T00:00:00Z"^^xsd:dateTime) .
  MINUS{?item wdt:P921 wd:Q29959533} # not already main subject = pred publ
  FILTER(CONTAINS(LCASE(?itemLabel), "predatory"))
  FILTER((LANG(?itemLabel)) = "en")
}
LIMIT 100
Try it!

PS: ne pas ajouter d'autres filtres en plus, car ça ralentit trop la recherche et échoue. Ci-dessous une requête plus simple avec deux mots consécutifs (mais sans autres critères) :

SELECT DISTINCT ?item ?itemLabel WHERE {
  ?item wdt:P31 wd:Q13442814;
    rdfs:label ?itemLabel.
  FILTER(CONTAINS(LCASE(?itemLabel), "predatory publish"))
}
LIMIT 10
Try it!
  • How to optimize the query ?
  • Is it possible to use PetScan for a similar result ?

Temporary solutions edit

Lancer des recherches avec (résultats au 14 février 2022) :

    • "predatory journal" (11 -2:attention à ne garder que les articles)
    • puis "predatory journals" (183. Exemple)
    • puis "predatory publisher" (12 -4:attention à ne garder que les articles)
    • puis "predatory publishers" (38 -1:attention à ne garder que les articles)
    • puis "predatory publishing" (110 -2:attention à ne garder que les articles)
    • puis "predatory open" (29 -1:attention à ne garder que les articles)
    • "predatory practices" (3 -1:attention Q89140809 est sur un autre sujet)
    • "éditeurs prédateurs" (1)
    • "revues prédatrices" (3)
    • Beall list (+2 nouveaux)
    • "Open Access Predators" : 0
    • "Open Access Predator" : 1
    • "publishing predators" : 1
    • "hijacked journal" : 1
  • Puis exporter les résultats dans un fichier texte, extraire les Q et traiter le tout avec Quickstatements :
qid,P921
Q100301157,Q29959533

Retrieving vanity publishing content in WD (draft) edit

This section is based on the Vanity Press section of the Beall List.