User:Pmartinolli/Predatory publishing and Wikidata
Indexing predatory publishers edit
Ontologies around predatory publishing edit
- predatory publishing (Q29959533) : recommended use in Main Subject to describe the content of documents on this topic
- Beall's list of predatory open access journals (Q56273878)
- Tools to explore ontologies around predatory publishing (Q29959533)
Visualizing predatory publishing in Wikidata edit
All articles of a selected publisher by a selected university author edit
See https://www.wikidata.org/wiki/User:Pmartinolli/UdeM_SPARQL
Scholia : scholarly article about Predatory Publishing edit
All scholarly articles talking about Predatory publishing edit
SELECT ?item ?itemLabel
WHERE
{
?item wdt:P31 wd:Q13442814.
?item wdt:P921 wd:Q29959533.
SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}
Retrieving predatory content in Wikidata edit
- Ethic/ legal question : the journal Anthropology could be predatory (OMICS group) but the information is only in the description, there is no statement indexed about it. What to do ? What is the risk ?
As per this query, there is 16 OMICS journals in WD (2022-02-16) :
SELECT ?revue_p WHERE {
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
?revue_p wdt:P123 wd:Q7072722.
}
LIMIT 100
Query listing all the articles from an OMICS journal in WD (using a subquery) :
SELECT ?revue_p ?revue_pLabel ?article ?articleLabel WHERE {
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
?revue_p wdt:P123 wd:Q7072722.
?article wdt:P1433 ?revue_p.
{SELECT ?article WHERE { ?article wdt:P31 wd:Q13442814. } }
}
Indexing annexe : Listing all articles with "predatory" in the title (ie. Label) edit
SPARQL edit
After 2007 + except the ones already indexed with Main subject = Predatory publishing
SELECT DISTINCT ?item ?itemLabel WHERE {
?item wdt:P31 wd:Q13442814;
rdfs:label ?itemLabel.
?item wdt:P577 ?date FILTER (?date > "2007-01-01T00:00:00Z"^^xsd:dateTime) .
MINUS{?item wdt:P921 wd:Q29959533} # not already main subject = pred publ
FILTER(CONTAINS(LCASE(?itemLabel), "predatory"))
FILTER((LANG(?itemLabel)) = "en")
}
LIMIT 100
PS: ne pas ajouter d'autres filtres en plus, car ça ralentit trop la recherche et échoue. Ci-dessous une requête plus simple avec deux mots consécutifs (mais sans autres critères) :
SELECT DISTINCT ?item ?itemLabel WHERE {
?item wdt:P31 wd:Q13442814;
rdfs:label ?itemLabel.
FILTER(CONTAINS(LCASE(?itemLabel), "predatory publish"))
}
LIMIT 10
- How to optimize the query ?
- Is it possible to use PetScan for a similar result ?
Temporary solutions edit
Lancer des recherches avec (résultats au 14 février 2022) :
- "predatory journal" (11 -2:attention à ne garder que les articles)
- puis "predatory journals" (183. Exemple)
- puis "predatory publisher" (12 -4:attention à ne garder que les articles)
- puis "predatory publishers" (38 -1:attention à ne garder que les articles)
- puis "predatory publishing" (110 -2:attention à ne garder que les articles)
- puis "predatory open" (29 -1:attention à ne garder que les articles)
- "predatory practices" (3 -1:attention Q89140809 est sur un autre sujet)
- "éditeurs prédateurs" (1)
- "revues prédatrices" (3)
- Beall list (+2 nouveaux)
- "Open Access Predators" : 0
- "Open Access Predator" : 1
- "publishing predators" : 1
- "hijacked journal" : 1
- Puis exporter les résultats dans un fichier texte, extraire les Q et traiter le tout avec Quickstatements :
qid,P921
Q100301157,Q29959533
Retrieving vanity publishing content in WD (draft) edit
This section is based on the Vanity Press section of the Beall List.