User:SCIdude/Modeling

This page describes the data models existing in the molbio part of Wikidata, focusing on the most canonical one for each class. This in turn defines what is a bug, or which statements are missing on items of that class. The most detailed database for the class also should map to the canonical model (databases of subsets may be more detailed, they would define a different class however, a subclass of the more general, e.g. transporter family and peptidase family as subclasses of enzym family).

Enzymes edit

Enzymatic activity edit

Enzyme family edit

  • by searching for inst-of-enzymes without any UniProt, RefSeq, encoded, or taxon we caught >4200 enzyme families with en-WP+ sitelinks --> made them inst-of-enzyme family with description "class of enzymes". There are now 4865 enzyme families.
  • removed statements "found in taxon [P703] Homo sapiens" from 64 families
  • next is to give them all a molecular function statement to enable grouping in their own hierarchy. After assigning functions that had identical wording + "activity", 3354/4863 families had a function.
  • of the >1500 families without function 1502 had an EC, there are 3 cases:
    • the EC appears once in GO ---> function is found
    • the EC appears more than once in GO ---> function is the parent of all others in the list (CAVEAT: inconsistencies in GO, issues on Github)
    • not in GO, probably obsolete in GO, try next higher EC (e.g. 4.3.2 instead of 4.3.2.1)
  • finding >120 protein families, subclass enzyme, all enzyme families. There are now 4982 enzyme families.
  • list all items and relevant fields:
 ?p wdt:P31 wd:Q67015883 .
 OPTIONAL { ?p p:P591 ?stmt .
   ?stmt ps:P591 ?ec .
   OPTIONAL{ ?stmt pq:P4390 ?mr . }
   }
 OPTIONAL{ ?p wdt:P279 ?q . }
  • to be able to build the subclass tree we need the information which families exactly correspond to higher nodes (1., 1.2, and 1.2.3); this needs to be done manually
  • the list of higher EC nodes where we don't have a family item:
 SELECT ?p ?ec ?pLabel
 WHERE
 {
   ?p wdt:P31 wd:Q14860489 .
   ?p p:P591 ?stmt .
   ?stmt ps:P591 ?ec .
   ?stmt pq:P4390 wd:Q39893449 .
   FILTER ( STRENDS(STR(?ec), '.-') ).
   MINUS { 
     ?q wdt:P31 wd:Q67015883 .
     ?q wdt:P680 ?p .
   }
   SERVICE wikibase:label {
     bd:serviceParam wikibase:language "en" . }
 }
  • somehow we didn't count items without EC, There are now 5045 enzyme families.
  • the tree of intermediate family nodes that have an exact EC:

Root

├── 1 oxidoreductase (Q407479)
│   ├── 1 alcohol oxidoreductase (Q4713306)
│   └── 12 hydrogenase (Q424135)
├── 2 transferase (Q407355)
│   ├── 1 
│   │   ├── 1 methyltransferase (Q415875)
│   │   └── 4 amidinotransferase (Q68688747)
│   ├── 3 acyltransferases (Q2609152)
│   ├── 4 glycosyltransferases (Q67201373)
│   │   └── 1 hexosyltransferase (Q5749058)
│   ├── 6 
│   │   └── 1 transaminase (Q424288)
│   ├── 7 
│   │   └── 6 diphosphotransferase (Q5279763)
│   └── 8 
│       ├── 2 sulfotransferase subgroup (Q175950)
│       └── 3 CoA-transferase (Q68689639)
├── 3 hydrolase (Q96286)
│   ├── 1 esterase (Q418750)
│   │   ├── 1 carboxylesterase (Q409840)
│   │   ├── 3 phosphatase (Q422476)
│   │   ├── 4 phosphoric diester hydrolase (Q67202883)
│   │   └── 2 thioesterase, subgroup (Q7784664)
│   ├── 2 glycosidase (Q13527914)
│   │   └── 1 glycoside hydrolase superfamily (Q375795)
│   ├── 4 peptidase (Q212410)
│   │   ├── 22 cysteine protease (Q419343)
│   │   ├── 11 aminopeptidase (Q419527)
│   │   ├── 21 serine endopeptidase (Q420032)
│   │   ├── 24 metalloendopeptidase (Q6822865)
│   │   ├── 17 metalloexopeptidase (Q6822868)
│   │   └── 25 Threonine protease (Q7798075)
│   ├── 5 
│   │   ├── 1 amidohydrolases (Q4746164)
│   │   └── 2 amidohydrolases (Q4746164)
│   └── 6 
│       └── 4 helicase (Q138864)
├── 4 lyase (Q407727)
│   ├── 1 
│   │   └── 1 carboxy-lyases (Q417781)
│   └── 2 
│       └── 1 hydro-lyase (Q16915067)
├── 5 isomerase (Q118026)
│   └── 2 cis-trans isomerase (Q5122112)
├── 6 ligases (Q410221)
└── 7 transport protein (Q2449730)
  • Script used to create hierarchy: https://gist.github.com/rwst/84b43461de6105dc4e0eda3bd1e0bd1c
  • from the queries in Protein_bugs#Stubs_from_early_days we collected more. There are now 5,197 enzyme families.
  • using IPR family GO annotations, name comparisons, and manual inspection lead to marking InterPro protein families as enzyme families. There are now 8,728 enzyme families. 8,721 of them have at least one molecular function link with mapping relation type broad/exact. 5,144 of these have an EC value, most without mapping relation type.

Membrane transporter family edit

  ?p wdt:P31 wd:Q67101749 .
  ?p p:P7260 ?stmt .
  ?stmt ps:P7260 ?tc .
  ?stmt pq:P4390 wd:Q39893449 .
  ?p wdt:P703 wd:Q15978631 .
  ?p wdt:P352 ?u .
  ?p wdt:P31 wd:Q8054 .
  ?p wdt:P279 wd:Q2449730 .
  MINUS { 
    ?p wdt:P7260 ?tc
  }

we blasted human proteins annotated as transporter but without TCDB against TCDB to get their classification, and to add their InterPro families as transporter families (>400 proteins)

  • there are now 659 membrane transporter families, 554 exactly corresponding to TCDB nodes
  • from the queries in Protein_bugs#Stubs_from_early_days we collected more. There are now 687 membrane transporter families.
  • Ideas
    • check all TCDB:8 proteins with transport annotation
    • if there is an enwiki article check for missing InterPro ID (P2926) links
    • TCDB overview of human transporters

Protein complexes et al edit

Reactants/products/cargo edit

GO data has the following types of mixin (in field intersection_of):

has_end_location
has_input*
has_intermediate*
has_output*
has_part
has_participant*
has_primary_input*
has_primary_input_or_output*
has_primary_output*
has_start_location
has_target_end_location
has_target_start_location

The starred ones can have CHEBI ids as argument.

input/output of GO processes edit

chemical GO complex parts edit

  • GO complexes can refer to ChEBI items

process descriptions (starts/ends with, has part) edit

Protein families associated with domain edit

  • Goal is to have a family item for every domain item. Which have none?
SELECT DISTINCT ?item1 ?ipr ?item1Label
{
	?item1 wdt:P31 wd:Q898273 .
    ?item1 wdt:P2926 ?ipr .
  MINUS {
    ?item2 wdt:P31 wd:Q81505329 .
    ?item2 p:P31 ?stmt .
    ?stmt pq:P642 ?item1
    }
  	SERVICE wikibase:label { bd:serviceParam wikibase:language "en" } .
}
Try it!

Inhibitors, enzyme inhibitors edit

  • in May 2020 there are x items in WD

Request: move sitelinks gene-->protein edit

Simplified subset property for reasoning edit

Chemical ontology edit

Definition edit

The goal is to have a chemical ontology consisting of class items that are linked via P279 (subclass) statements, and all statements are fully sourced, i.e. they have references or have a heuristic by which the statement can be deduced.
Comment: All the statements in the chemistry part of Wikidata are not worth much if they don't have a reference. Moreover, having references on chemical class statements other than to online databases makes the classes and their statements untouchable by database copyright lawsuits from other databases. Actually with this, Wikidata is better sourced than ChEBI because ChEBI nowhere gives sources for their classes/definitions, despite having them copied straight from IUPAC.

The last "reference" denotes that the statement can be deduced just from the class names. Example: that organic peroxide (Q20986117) is a compound class can easily be deduced from the (sourced) fact that peroxide (Q107429) is a compound class, just by looking at the name.

Procedure edit

We have added reference claims to all classes (their P31/P279) that were also found in one of the defining references (see above). This does not mean all IUPAC classes are in Wikidata, or will be eventually. After that we connected all of these by searching for references that supported those classes that didn't have them but were necessary as superclasses to connect the disconnected classes.

Visualization edit

├──Q43460564 chemical entity
│    ├──Q79529 chemical substance
│    │    ├──Q11344 chemical element
│    │    ├──Q185744 gel
│    │    │    ├──Q898925 hydrogel
│    │    │    ├──Q455333 xerogel
│    │    ├──Q169336 mixture
│    │    │    ├──Q21177113 equimolar mixture
│    │    │    │    ├──Q467717 racemate
│    │    │    ├──Q236139 fly ash
│    │    │    ├──Q60668107 mixture of isomers
│    │    │    │    ├──Q60982909 stereoisomers mixture
│    │    │    │    │    ├──Q1339942 enantiomers mixture
│    │    │    │    │    │    ╞══Q467717 racemate
│    │    │    ├──Q81163 polymer
│    │    │    │    ├──Q98203276 branched polymer
│    │    │    │    │    ├──Q98203124 polymer network
│    │    │    │    ├──Q499932 homopolymer
│    │    │    │    ├──Q2468248 inorganic polymer
│    │    │    │    ├──Q145153 liquid crystal polymer
│    │    │    │    ├──Q5951249 polysiloxanes
│    │    │    │    │    ├──Q146439 silicone
│    │    ├──Q578779 pure substance
│    │    │    ├──Q11173 chemical compound
│    │    │    │    ├──Q424673 Autacoid
│    │    │    │    ├──Q344942 acyclic compound
│    │    │    │    │    ├──Q41581 alkane
│    │    │    │    │    ├──Q81406 alkene
│    │    │    │    │    ├──Q159226 alkyne
│    │    │    │    │    ├──Q4832226 azane
│    │    │    │    ├──Q66392 binary compound
│    │    │    │    │    ├──Q425094 fluorocarbon
│    │    │    │    │    ├──Q43648 hydrocarbon
│    │    │    │    │    │    ├──Q47165582 aliphatic hydrocarbon
│    │    │    │    │    │    │    ╞══Q41581 alkane
│    │    │    │    │    │    │    ╞══Q81406 alkene
│    │    │    │    │    │    │    ╞══Q159226 alkyne
│    │    │    │    │    │    ├──Q418744 catenanes
│    │    │    │    │    │    ├──Q419411 cumulene
│    │    │    │    │    │    │    ├──Q1616204 heterocumulene
│    │    │    │    │    │    ├──Q73356527 cyclic hydrocarbon
│    │    │    │    │    │    │    ├──Q416633 aryne
│    │    │    │    │    │    │    ├──Q188862 cycloalkane
│    │    │    │    │    │    │    ├──Q73356757 polycyclic hydrocarbon
│    │    │    │    │    │    │    │    ├──Q7226906 polyquinane
│    │    │    │    │    │    │    │    ├──Q417471 propellane
│    │    │    │    │    │    ├──Q539847 paddlane
│    │    │    │    │    │    ├──Q965478 unsaturated hydrocarbon
│    │    │    │    │    │    │    ├──Q9138795 acetylene
│    │    │    │    │    │    │    │    ╞══Q159226 alkyne
│    │    │    │    │    │    │    ├──Q230731 aromatic hydrocarbon
│    │    │    │    │    │    │    │    ├──Q407212 polycyclic aromatic hydrocarbons
│    │    │    │    │    │    │    │    │    ├──Q418207 acene
│    │    │    │    │    │    │    │    │    ├──Q901562 helicene
│    │    │    │    │    │    │    ╞══Q416633 aryne
│    │    │    │    │    │    │    ├──Q11797724 olefin
│    │    │    │    │    │    │    │    ╞══Q81406 alkene
│    │    │    │    │    │    │    │    ├──Q425083 annulene
│    │    │    │    │    │    │    │    ├──Q192678 diene
│    │    │    │    │    │    │    │    │    ├──Q411369 allene
│    │    │    │    │    │    │    │    ├──Q212364 terpene
│    │    │    │    │    │    │    │    │    ├──Q59447 diterpene
│    │    │    │    │    │    │    │    │    ├──Q32528 monoterpene
│    │    │    │    │    │    │    │    │    ├──Q80218 sesquiterpene
│    │    │    │    │    │    │    │    │    ├──Q7706759 tetraterpene
│    │    │    │    │    │    │    │    │    ├──Q2915788 triterpene
│    │    │    │    │    ├──Q1327815 hydrogen compound
│    │    │    │    │    │    ├──Q704193 arsane
│    │    │    │    │    │    ├──Q106520 hydride
│    │    │    │    │    │    ├──Q7515021 silicon-hydrogen compound
│    │    │    │    │    │    │    ├──Q47457972 saturated silicon hydride
│    │    │    │    │    │    │    │    ├──Q2476769 silanes
│    │    │    │    │    ├──Q1778613 oxocarbon
│    │    │    │    │    ├──Q7227008 polysulfane
│    │    │    │    ├──Q49851249 boron compound
│    │    │    │    │    ├──Q413945 carborane
│    │    │    │    │    ├──Q421158 organoboron compound
│    │    │    │    │    │    ├──Q17162861 borinic acid
│    │    │    │    │    │    ├──Q335768 boronic acid
│    │    │    │    │    │    ├──Q39087941 borylene
│    │    │    │    ├──Q107124490 chiral compound
│    │    │    │    │    ╞══Q901562 helicene
│    │    │    │    ├──Q2901852 compound of carbon
│    │    │    │    │    ╞══Q413945 carborane
│    │    │    │    │    ├──Q843438 cyanate
│    │    │    │    │    │    ├──Q5197389 cyanate ester
│    │    │    │    │    ├──Q55076544 cyanide
│    │    │    │    │    ├──Q408365 isocyanate
│    │    │    │    │    │    ├──Q55664098 isocyanate ester
│    │    │    │    │    ├──Q174211 organic compound
│    │    │    │    │    │    ├──Q192596 aliphatic compound
│    │    │    │    │    │    │    ├──Q155368 alicyclic compound
│    │    │    │    │    │    │    ╞══Q47165582 aliphatic hydrocarbon
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    ├──Q20901727 alkynols
│    │    │    │    │    │    │    │    ├──Q3077184 ynol
│    │    │    │    │    │    │    ├──Q61476 fatty acid
│    │    │    │    │    │    │    │    ├──Q407680 icosanoid
│    │    │    │    │    │    │    │    │    ├──Q424190 leukotriene
│    │    │    │    │    │    │    │    │    ├──Q962217 prostanoids
│    │    │    │    │    │    │    │    │    │    ├──Q209717 prostaglandins
│    │    │    │    │    │    │    ├──Q6985085 glycol
│    │    │    │    │    │    │    ├──Q4138039 hydrazines
│    │    │    │    │    │    │    ╞══Q11797724 olefin
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    ├──Q419257 carbene
│    │    │    │    │    │    ├──Q4214615 carbocyclic compound
│    │    │    │    │    │    │    ╞══Q155368 alicyclic compound
│    │    │    │    │    │    │    ╞══Q73356527 cyclic hydrocarbon
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    ├──Q3008453 cyclitol
│    │    │    │    │    │    │    │    ├──Q407997 inositol
│    │    │    │    │    │    │    ├──Q865893 fenestrane
│    │    │    │    │    │    │    ├──Q21007588 fulvalene
│    │    │    │    │    │    │    ├──Q21004545 fulvenes
│    │    │    │    │    │    ╞══Q43648 hydrocarbon
│    │    │    │    │    │    ... see above
│    │    │    │    │    │    ├──Q71271159 olefinic compound
│    │    │    │    │    │    │    ├──Q19834818 aromatic compound
│    │    │    │    │    │    │    │    ╞══Q230731 aromatic hydrocarbon
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ├──Q222174 flavonoid
│    │    │    │    │    │    │    │    │    ├──Q1073242 anthocyanidins
│    │    │    │    │    │    │    │    │    ├──Q262547 anthocyanins
│    │    │    │    │    │    │    │    ├──Q907447 heteroarene
│    │    │    │    │    │    │    │    │    ├──Q419639 azole
│    │    │    │    │    │    │    │    │    │    ├──Q67954132 pyrrole
│    │    │    │    │    │    │    │    │    ├──Q415828 diazine
│    │    │    │    │    │    │    │    │    │    ├──Q47069735 pyrimidines
│    │    │    │    │    │    │    │    │    │    │    ├──Q206348 barbiturates
│    │    │    │    │    │    │    │    │    │    │    ├──Q4363318 pyrimidine base
│    │    │    │    │    │    │    │    │    ├──Q72083965 imidazopyrimidine
│    │    │    │    │    │    │    │    │    │    ├──Q3360898 purines
│    │    │    │    │    │    │    │    │    │    │    ├──Q4383874 purine base
│    │    │    │    │    │    │    │    │    ├──Q422399 tetrapyrrole
│    │    │    │    │    │    │    │    │    │    ├──Q71273451 cyclic tetrapyrrole
│    │    │    │    │    │    │    │    │    │    │    ├──Q2618336 corrinoid
│    │    │    │    │    │    │    │    │    │    │    ├──Q422926 porphyrins
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q5999892 metalloporphyrins
│    │    │    │    │    │    │    │    │    │    │    │    │    ├──Q189621 heme
│    │    │    │    │    │    │    │    ├──Q3234924 isoflavonoid
│    │    │    │    │    │    │    │    ├──Q3874670 neoflavonoid
│    │    │    │    │    │    │    │    ├──Q3381798 phthalein dyes
│    │    │    │    │    │    │    │    ├──Q22158401 polycyclic aromatic compound
│    │    │    │    │    │    │    │    │    ╞══Q407212 polycyclic aromatic hydrocarbons
│    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ├──Q57842052 substituted benzene
│    │    │    │    │    │    │    │    │    ├──Q4066270 anilides
│    │    │    │    │    │    │    │    │    ├──Q407142 phenols
│    │    │    │    │    │    │    │    │    │    ├──Q424197 bisphenol
│    │    │    │    │    │    │    │    │    │    ├──Q271663 catecholamine
│    │    │    │    │    │    │    │    │    │    ├──Q75712837 cresol
│    │    │    │    │    │    │    │    │    ├──Q9258922 phenoxide
│    │    │    │    │    │    │    │    │    ├──Q417181 phenylpropanoid
│    │    │    │    │    │    │    │    │    │    ├──Q424634 lignan
│    │    │    │    │    │    │    │    │    │    ├──Q184817 lignin
│    │    │    │    │    │    │    │    │    ├──Q2443455 picrate
│    │    │    │    │    │    │    ├──Q408018 enamine
│    │    │    │    │    │    │    ├──Q408053 enol
│    │    │    │    │    │    │    │    ├──Q1347057 reductone
│    │    │    │    │    │    │    ├──Q99603944 enolate
│    │    │    │    │    │    │    ├──Q2918932 enose
│    │    │    │    │    │    │    │    ├──Q4139724 glycals
│    │    │    │    │    │    │    ╞══Q21007588 fulvalene
│    │    │    │    │    │    │    ╞══Q21004545 fulvenes
│    │    │    │    │    │    │    ╞══Q407680 icosanoid
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    ├──Q1674528 isoprenoid
│    │    │    │    │    │    │    │    ├──Q74692533 prenol
│    │    │    │    │    │    │    │    ╞══Q212364 terpene
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ├──Q426694 terpenoid
│    │    │    │    │    │    │    │    │    ├──Q47006367 diterpenoid
│    │    │    │    │    │    │    │    │    │    ├──Q420418 retinoid
│    │    │    │    │    │    │    │    │    ├──Q47006360 monoterpenoid
│    │    │    │    │    │    │    │    │    │    ├──Q416840 iridoid
│    │    │    │    │    │    │    │    │    ├──Q47006373 sesquiterpenoid
│    │    │    │    │    │    │    │    │    ├──Q107363222 sesterterpenoid
│    │    │    │    │    │    │    │    │    ├──Q47006386 tetraterpenoid
│    │    │    │    │    │    │    │    │    │    ├──Q191907 carotenoid
│    │    │    │    │    │    │    │    │    │    │    ├──Q216208 xanthophylls
│    │    │    │    │    │    │    │    │    ├──Q7844276 triterpenoid
│    │    │    │    │    │    │    ├──Q368158 ketene
│    │    │    │    │    │    │    ├──Q3010558 ketenimine
│    │    │    │    │    │    │    ├──Q72054273 mancude-ring compound
│    │    │    │    │    │    │    ╞══Q11797724 olefin
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    ├──Q423118 organic acid anhydride
│    │    │    │    │    │    │    ├──Q107265282 cyclic anhydride
│    │    │    │    │    │    ├──Q21060412 organic arsenic compounds
│    │    │    │    │    │    │    ├──Q2477421 organoarsenic compound
│    │    │    │    │    │    │    │    ├──Q704945 arsine
│    │    │    │    │    │    │    │    ├──Q11751652 arsinic acid
│    │    │    │    │    │    │    │    ├──Q11751650 arsinous acid
│    │    │    │    │    │    │    │    ├──Q11751651 arsonic acid
│    │    │    │    │    │    │    │    ├──Q11751648 arsonous acid
│    │    │    │    │    │    ├──Q24577828 organic cyclic compound
│    │    │    │    │    │    │    ├──Q423666 lactol
│    │    │    │    │    │    │    ├──Q72840159 organic polycyclic compound
│    │    │    │    │    │    │    │    ├──Q7370371 Rotenoid
│    │    │    │    │    │    │    │    ├──Q177911 steroid
│    │    │    │    │    │    │    │    │    ├──Q143623 sterol
│    │    │    │    │    │    ├──Q71573704 organic heterocyclic compound
│    │    │    │    │    │    │    ╞══Q907447 heteroarene
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    ├──Q72084374 organonitrogen heterocyclic compound
│    │    │    │    │    │    │    │    ╞══Q419639 azole
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ├──Q71655701 benzopteridine
│    │    │    │    │    │    │    │    │    ├──Q71655527 flavin
│    │    │    │    │    │    │    │    ├──Q3010262 cephem antibiotic
│    │    │    │    │    │    │    │    │    ├──Q271021 cephalosporin antibiotic
│    │    │    │    │    │    │    │    ╞══Q415828 diazine
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ├──Q74569152 dipyrrins
│    │    │    │    │    │    │    │    ├──Q174337 flavin
│    │    │    │    │    │    │    │    ├──Q3149007 imidazopyridine
│    │    │    │    │    │    │    │    ╞══Q72083965 imidazopyrimidine
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ├──Q106313238 imidine
│    │    │    │    │    │    │    │    ├──Q251124 lactam
│    │    │    │    │    │    │    │    │    ├──Q41873 β-lactam
│    │    │    │    │    │    │    │    │    │    ├──Q107264728 cepham
│    │    │    │    │    │    │    │    ├──Q18213339 lactim
│    │    │    │    │    │    │    │    ├──Q1227206 oxadiazole
│    │    │    │    │    │    │    │    │    ├──Q7660250 sydnone imine
│    │    │    │    │    │    │    │    │    ├──Q1298067 sydnones
│    │    │    │    │    │    │    │    ├──Q62010421 penams
│    │    │    │    │    │    │    │    │    ├──Q12190 penicillin
│    │    │    │    │    │    │    │    ├──Q7162597 penem antibiotic
│    │    │    │    │    │    │    │    ├──Q1492134 sultam
│    │    │    │    │    │    │    ├──Q73727502 organosulfur heterocyclic compound
│    │    │    │    │    │    │    │    ╞══Q107264728 cepham
│    │    │    │    │    │    │    │    ╞══Q3010262 cephem antibiotic
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ╞══Q62010421 penams
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ╞══Q7162597 penem antibiotic
│    │    │    │    │    │    │    │    ╞══Q1492134 sultam
│    │    │    │    │    │    │    ├──Q71573538 oxacycle
│    │    │    │    │    │    │    │    ╞══Q7370371 Rotenoid
│    │    │    │    │    │    │    │    ├──Q75005797 cyclic ether
│    │    │    │    │    │    │    │    │    ├──Q100992704 epoxy compounds
│    │    │    │    │    │    │    │    │    │    ├──Q408028 epoxide
│    │    │    │    │    │    │    │    │    │    │    ├──Q15783904 arene epoxides
│    │    │    │    │    │    │    │    ╞══Q222174 flavonoid
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ├──Q414774 furanocoumarin
│    │    │    │    │    │    │    │    ╞══Q3234924 isoflavonoid
│    │    │    │    │    │    │    │    ├──Q59078 lactone
│    │    │    │    │    │    │    │    │    ├──Q20986771 coumarin
│    │    │    │    │    │    │    │    │    │    ├──Q73605636 isocoumarins
│    │    │    │    │    │    │    │    │    ├──Q422687 macrolides
│    │    │    │    │    │    │    │    ╞══Q3874670 neoflavonoid
│    │    │    │    │    │    │    │    ├──Q2364934 sultine
│    │    │    │    │    │    │    │    ├──Q204947 sultone
│    │    │    │    │    │    │    │    ├──Q107383055 trioxolane
│    │    │    │    │    │    │    │    │    ├──Q2624323 molozonide
│    │    │    │    │    │    │    │    │    ├──Q107352181 ozonide
│    │    │    │    │    │    ├──Q77899525 organic nitrogen compound
│    │    │    │    │    │    │    ├──Q423088 amidines
│    │    │    │    │    │    │    │    ├──Q103856106 carboxamidine
│    │    │    │    │    │    │    ├──Q419637 hydrazide
│    │    │    │    │    │    │    ├──Q6004000 imidic acid
│    │    │    │    │    │    │    ├──Q422772 nitro compound
│    │    │    │    │    │    │    │    ├──Q27046687 nitrolic acid
│    │    │    │    │    │    │    │    ╞══Q2443455 picrate
│    │    │    │    │    │    │    ├──Q55739694 organonitrogen compound
│    │    │    │    │    │    │    │    ├──Q470910 amidrazone
│    │    │    │    │    │    │    │    ├──Q167198 amine
│    │    │    │    │    │    │    │    │    ├──Q414083 amino sugar
│    │    │    │    │    │    │    │    │    │    ├──Q202043 hexosamines
│    │    │    │    │    │    │    │    │    │    │    ├──Q66589591 galactosamine
│    │    │    │    │    │    │    │    │    │    │    ├──Q66589596 glucosamine
│    │    │    │    │    │    │    │    │    ├──Q56440222 carbamide
│    │    │    │    │    │    │    │    │    │    ├──Q9367030 Acylurea
│    │    │    │    │    │    │    │    │    ├──Q2500485 diamine
│    │    │    │    │    │    │    │    │    │    ├──Q2457238 aminal
│    │    │    │    │    │    │    │    │    ╞══Q408018 enamine
│    │    │    │    │    │    │    │    │    ├──Q3109359 glycosylamine
│    │    │    │    │    │    │    │    │    │    ├──Q28734 nucleoside
│    │    │    │    │    │    │    │    │    │    ├──Q71238850 nucleoside phosphate
│    │    │    │    │    │    │    │    │    │    │    ├──Q28745 nucleotides
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q422484 ribonucleotide
│    │    │    │    │    │    │    │    │    ├──Q424620 hemiaminal
│    │    │    │    │    │    │    │    │    ├──Q107327795 organic hydroxylamine
│    │    │    │    │    │    │    │    │    │    ├──Q420327 hydroxamic acid
│    │    │    │    │    │    │    │    ├──Q48999272 aminoxyl radical
│    │    │    │    │    │    │    │    ├──Q15149231 azine
│    │    │    │    │    │    │    │    │    ├──Q55693496 aldazine
│    │    │    │    │    │    │    │    │    ├──Q55693557 ketazine
│    │    │    │    │    │    │    │    ├──Q322251 azo compound
│    │    │    │    │    │    │    │    │    ├──Q2324668 formazan
│    │    │    │    │    │    │    │    ├──Q17014682 azomethine ylide
│    │    │    │    │    │    │    │    ├──Q2448093 azoxy compounds
│    │    │    │    │    │    │    │    ├──Q422899 carbamate
│    │    │    │    │    │    │    │    ├──Q420241 carbodiimide
│    │    │    │    │    │    │    │    ├──Q9189940 chloramines
│    │    │    │    │    │    │    │    ├──Q424424 diazo compound
│    │    │    │    │    │    │    │    │    ├──Q416105 semicarbazones
│    │    │    │    │    │    │    │    ├──Q410255 diazonium compound
│    │    │    │    │    │    │    │    ╞══Q4138039 hydrazines
│    │    │    │    │    │    │    │    ├──Q416007 hydrazones
│    │    │    │    │    │    │    │    │    ├──Q282677 osazone
│    │    │    │    │    │    │    │    ├──Q408057 imine
│    │    │    │    │    │    │    │    │    ├──Q2602701 Schiff base
│    │    │    │    │    │    │    │    │    ├──Q496058 aldimine
│    │    │    │    │    │    │    │    │    ├──Q1318069 imino acids
│    │    │    │    │    │    │    │    │    ├──Q1074416 quinone imine
│    │    │    │    │    │    │    │    │    ╞══Q7660250 sydnone imine
│    │    │    │    │    │    │    │    ├──Q421897 isocyanide
│    │    │    │    │    │    │    │    ├──Q60869351 isodiazene
│    │    │    │    │    │    │    │    ├──Q1147064 isoselenocyanate
│    │    │    │    │    │    │    │    ╞══Q3010558 ketenimine
│    │    │    │    │    │    │    │    ├──Q413110 nitrene
│    │    │    │    │    │    │    │    ├──Q333936 nitrile
│    │    │    │    │    │    │    │    │    ├──Q416814 cyanohydrin
│    │    │    │    │    │    │    │    ├──Q17130695 nitrile ylide
│    │    │    │    │    │    │    │    ├──Q17123701 nitrilium salt
│    │    │    │    │    │    │    │    ├──Q276843 nitroso compound
│    │    │    │    │    │    │    │    │    ├──Q3342221 N-nitrosamide
│    │    │    │    │    │    │    │    ╞══Q72084374 organonitrogen heterocyclic compound
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ├──Q182738 oxime
│    │    │    │    │    │    │    │    │    ├──Q72577641 aldoxime
│    │    │    │    │    │    │    │    │    ├──Q72592750 ketoxime
│    │    │    │    │    │    │    │    ├──Q3565831 phosphazene
│    │    │    │    │    │    │    │    ├──Q72087444 quaternary ammonium salt
│    │    │    │    │    │    │    │    ├──Q3483798 silazane
│    │    │    │    │    │    │    │    ├──Q7636193 sulfenamide
│    │    │    │    │    │    │    │    ├──Q281166 sulfilimine
│    │    │    │    │    │    │    │    ├──Q97360410 sulfinylamine
│    │    │    │    │    │    │    │    ├──Q25323761 sulfur diimide
│    │    │    │    │    │    │    │    ├──Q33035232 triazene
│    │    │    │    │    │    ├──Q107344349 organic oxygen compound
│    │    │    │    │    │    │    ╞══Q276843 nitroso compound
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    ├──Q71419357 organic hydroxy compound
│    │    │    │    │    │    │    │    ├──Q156 alcohols
│    │    │    │    │    │    │    │    │    ╞══Q20901727 alkynols
│    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    ├──Q72191493 alpha-hydroxy ketone
│    │    │    │    │    │    │    │    │    │    ├──Q345024 acyloin
│    │    │    │    │    │    │    │    │    ╞══Q416814 cyanohydrin
│    │    │    │    │    │    │    │    │    ╞══Q408053 enol
│    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    ├──Q421086 halohydrin
│    │    │    │    │    │    │    │    │    │    ├──Q9189973 chlorohydrin
│    │    │    │    │    │    │    │    │    ├──Q414939 hemiacetal
│    │    │    │    │    │    │    │    │    │    ├──Q9002676 hemiketal
│    │    │    │    │    │    │    │    │    │    ╞══Q423666 lactol
│    │    │    │    │    │    │    │    │    ╞══Q424620 hemiaminal
│    │    │    │    │    │    │    │    │    ├──Q10528967 hydroxy acid
│    │    │    │    │    │    │    │    │    │    ├──Q2272566 aldonic acid
│    │    │    │    │    │    │    │    │    ├──Q415812 polyol
│    │    │    │    │    │    │    │    │    │    ├──Q4625944 alditol
│    │    │    │    │    │    │    │    │    │    │    ├──Q71381967 hexitol
│    │    │    │    │    │    │    │    │    │    │    ├──Q74705706 pentitol
│    │    │    │    │    │    │    │    │    │    ├──Q11358 carbohydrate
│    │    │    │    │    │    │    │    │    │    │    ├──Q133516 monosaccharide
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q409079 aldose
│    │    │    │    │    │    │    │    │    │    │    │    │    ├──Q1077067 aldohexose
│    │    │    │    │    │    │    │    │    │    │    │    ╞══Q2918932 enose
│    │    │    │    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q264492 furanose
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q424182 heptose
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q339725 hexose
│    │    │    │    │    │    │    │    │    │    │    │    │    ╞══Q1077067 aldohexose
│    │    │    │    │    │    │    │    │    │    │    │    │    ├──Q1616877 ketohexose
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q409108 ketose
│    │    │    │    │    │    │    │    │    │    │    │    │    ╞══Q1616877 ketohexose
│    │    │    │    │    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    │    │    │    │    ├──Q23015676 ketopentose
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q205654 pentose
│    │    │    │    │    │    │    │    │    │    │    │    │    ╞══Q23015676 ketopentose
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q424248 pyranose
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q414128 tetrose
│    │    │    │    │    │    │    │    │    │    │    ├──Q320607 oligosaccharide
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q40417805 cyclodextrin
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q173600 disaccharide
│    │    │    │    │    │    │    │    │    │    │    ├──Q134219 polysaccharides
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q2553138 glycan
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q407553 glycosaminoglycan
│    │    │    │    │    │    │    │    │    │    │    │    │    ├──Q74512578 mucopolysaccharide
│    │    │    │    │    │    │    │    │    │    │    │    │    ├──Q206920 peptidoglycan
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q904092 homopolysaccharide
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q188154 pectin
│    │    │    │    │    │    │    │    │    │    │    ├──Q73883738 sugars
│    │    │    │    │    │    │    │    │    │    ├──Q64698788 carbohydrate derivative
│    │    │    │    │    │    │    │    │    │    │    ╞══Q4625944 alditol
│    │    │    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    │    │    ├──Q15855809 anhydrosugar
│    │    │    │    │    │    │    │    │    │    │    ╞══Q11358 carbohydrate
│    │    │    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    │    │    ├──Q71577209 carbohydrate acid
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q2365017 aldaric acid
│    │    │    │    │    │    │    │    │    │    │    │    ╞══Q2272566 aldonic acid
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q228106 sugar acid
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q412056 uronic acid
│    │    │    │    │    │    │    │    │    │    │    ├──Q73148865 carbohydrate acid derivative
│    │    │    │    │    │    │    │    │    │    │    ├──Q541769 deoxy sugar
│    │    │    │    │    │    │    │    │    │    │    ├──Q65947648 dialdose
│    │    │    │    │    │    │    │    │    │    │    ├──Q100609981 glycerol derivative
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q71379339 glycosylglycerol
│    │    │    │    │    │    │    │    │    │    │    ├──Q416019 glycoconjugate
│    │    │    │    │    │    │    │    │    │    │    ├──Q71152995 glycosyl compound
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q192639 glycoside
│    │    │    │    │    │    │    │    │    │    │    │    │    ╞══Q262547 anthocyanins
│    │    │    │    │    │    │    │    │    │    │    │    ╞══Q3109359 glycosylamine
│    │    │    │    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    │    │    ├──Q72078616 liposaccharide
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q422882 glycolipid
│    │    │    │    │    │    │    │    │    │    │    │    │    ├──Q66589604 glycoglycerolipid
│    │    │    │    │    │    │    │    │    │    │    │    │    ├──Q418892 glycosphingolipid
│    │    │    │    │    │    │    │    │    │    │    ├──Q107542613 monosaccharide derivative
│    │    │    │    │    │    │    │    │    │    │    │    ╞══Q414083 amino sugar
│    │    │    │    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    │    │    │    ╞══Q228106 sugar acid
│    │    │    │    │    │    │    │    │    │    │    ╞══Q282677 osazone
│    │    │    │    │    │    │    │    │    │    │    ├──Q74634720 polysaccharide derivative
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q421804 lipopolysaccharide
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q407976 proteoglycans
│    │    │    │    │    │    │    │    │    │    │    ├──Q879954 sugar phosphates
│    │    │    │    │    │    │    │    │    │    │    ├──Q77033769 thioglycoside
│    │    │    │    │    │    │    │    │    │    │    ├──Q72183752 thiosugar
│    │    │    │    │    │    │    │    │    │    ╞══Q3008453 cyclitol
│    │    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    │    ├──Q421916 diol
│    │    │    │    │    │    │    │    │    │    │    ╞══Q6985085 glycol
│    │    │    │    │    │    │    │    │    │    │    ├──Q4362942 pinacols
│    │    │    │    │    │    │    │    │    │    ├──Q107328895 hexol
│    │    │    │    │    │    │    │    │    │    │    ╞══Q407997 inositol
│    │    │    │    │    │    │    │    │    ╞══Q74692533 prenol
│    │    │    │    │    │    │    │    │    ├──Q2832211 secondary alcohol
│    │    │    │    │    │    │    │    │    │    ╞══Q345024 acyloin
│    │    │    │    │    │    │    │    │    ╞══Q143623 sterol
│    │    │    │    │    │    │    │    │    ├──Q416558 tropolone
│    │    │    │    │    │    │    │    ╞══Q6004000 imidic acid
│    │    │    │    │    │    │    │    ╞══Q18213339 lactim
│    │    │    │    │    │    │    │    ╞══Q107327795 organic hydroxylamine
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ╞══Q407142 phenols
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    ├──Q71574018 organooxygen compound
│    │    │    │    │    │    │    │    ├──Q2664257 Bunte salt
│    │    │    │    │    │    │    │    ╞══Q156 alcohols
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ╞══Q2448093 azoxy compounds
│    │    │    │    │    │    │    │    ╞══Q422899 carbamate
│    │    │    │    │    │    │    │    ├──Q9392635 carbonyl compound
│    │    │    │    │    │    │    │    │    ├──Q101497 aldehydes
│    │    │    │    │    │    │    │    │    │    ╞══Q409079 aldose
│    │    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    │    ╞══Q65947648 dialdose
│    │    │    │    │    │    │    │    │    ╞══Q56440222 carbamide
│    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    ├──Q355679 carboxamides
│    │    │    │    │    │    │    │    │    │    ╞══Q251124 lactam
│    │    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    │    ├──Q172847 peptide
│    │    │    │    │    │    │    │    │    │    │    ├──Q2157266 oligopeptides
│    │    │    │    │    │    │    │    │    │    │    ├──Q3084232 polypeptide
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q8054 protein
│    │    │    │    │    │    │    │    │    │    │    │    │    ├──Q2621150 conjugated protein
│    │    │    │    │    │    │    │    │    │    │    │    │    ├──Q78574842 flavoprotein
│    │    │    │    │    │    │    │    │    │    │    │    │    ├──Q419245 nucleoprotein
│    │    │    │    │    │    │    │    │    ├──Q355518 carboxylate ester
│    │    │    │    │    │    │    │    │    │    ├──Q407758 glyceride
│    │    │    │    │    │    │    │    │    │    ├──Q100705011 lactide
│    │    │    │    │    │    │    │    │    │    ╞══Q59078 lactone
│    │    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    ├──Q134856 carboxylic acid
│    │    │    │    │    │    │    │    │    │    ╞══Q71577209 carbohydrate acid
│    │    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    │    ├──Q47147773 monocarboxylic acid
│    │    │    │    │    │    │    │    │    │    │    ╞══Q61476 fatty acid
│    │    │    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    │    │    ╞══Q412056 uronic acid
│    │    │    │    │    │    │    │    │    ├──Q407944 imide
│    │    │    │    │    │    │    │    │    ╞══Q368158 ketene
│    │    │    │    │    │    │    │    │    ├──Q170744 ketone
│    │    │    │    │    │    │    │    │    │    ╞══Q72191493 alpha-hydroxy ketone
│    │    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    │    ├──Q40208401 chalconoid
│    │    │    │    │    │    │    │    │    │    ├──Q73232281 cyclic ketone
│    │    │    │    │    │    │    │    │    │    │    ╞══Q222174 flavonoid
│    │    │    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    │    │    ╞══Q3234924 isoflavonoid
│    │    │    │    │    │    │    │    │    │    │    ╞══Q3874670 neoflavonoid
│    │    │    │    │    │    │    │    │    │    │    ├──Q412382 quinone
│    │    │    │    │    │    │    │    │    │    │    ├──Q77740213 tropone
│    │    │    │    │    │    │    │    │    │    │    │    ╞══Q416558 tropolone
│    │    │    │    │    │    │    │    │    │    ├──Q426296 diketone
│    │    │    │    │    │    │    │    │    │    │    ╞══Q412382 quinone
│    │    │    │    │    │    │    │    │    │    ╞══Q419637 hydrazide
│    │    │    │    │    │    │    │    │    │    ╞══Q420327 hydroxamic acid
│    │    │    │    │    │    │    │    │    │    ├──Q516751 polyketide
│    │    │    │    │    │    │    │    │    │    │    ╞══Q422687 macrolides
│    │    │    │    │    │    │    │    │    │    │    ├──Q422676 tetracycline antibiotic
│    │    │    │    │    │    │    │    │    │    ╞══Q1347057 reductone
│    │    │    │    │    │    │    │    ╞══Q99603944 enolate
│    │    │    │    │    │    │    │    ├──Q101487 ester
│    │    │    │    │    │    │    │    │    ├──Q2506457 acylal
│    │    │    │    │    │    │    │    │    ╞══Q355518 carboxylate ester
│    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    ├──Q408611 depside
│    │    │    │    │    │    │    │    │    ├──Q413248 depsipeptide
│    │    │    │    │    │    │    │    │    ╞══Q55664098 isocyanate ester
│    │    │    │    │    │    │    │    │    ├──Q64694492 organophosphorus ester
│    │    │    │    │    │    │    │    │    │    ├──Q411097 organophosphate
│    │    │    │    │    │    │    │    │    │    │    ╞══Q71238850 nucleoside phosphate
│    │    │    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    │    │    ├──Q186915 phospholipids
│    │    │    │    │    │    │    │    │    │    │    │    ├──Q420004 glycerophospholipids
│    │    │    │    │    │    │    │    │    │    │    │    │    ├──Q66000256 phosphatidic acid
│    │    │    │    │    │    │    │    │    │    │    ╞══Q879954 sugar phosphates
│    │    │    │    │    │    │    │    │    ├──Q1072576 sulfate ester
│    │    │    │    │    │    │    │    │    │    ├──Q3503468 sulfolipid
│    │    │    │    │    │    │    │    ├──Q103230 ethers
│    │    │    │    │    │    │    │    │    ├──Q421103 acetals
│    │    │    │    │    │    │    │    │    │    ├──Q4673280 acetonide
│    │    │    │    │    │    │    │    │    │    ├──Q426579 ketals
│    │    │    │    │    │    │    │    │    ╞══Q75005797 cyclic ether
│    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    │    ╞══Q414939 hemiacetal
│    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ├──Q253817 organic peroxide
│    │    │    │    │    │    │    │    ├──Q414475 orthoester
│    │    │    │    │    │    │    │    ╞══Q426694 terpenoid
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ├──Q3666421 trioxide
│    │    │    │    │    │    │    │    ╞══Q107383055 trioxolane
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ├──Q65684228 xanthene derivatives
│    │    │    │    │    │    │    │    │    ├──Q1718523 xanthene dyes
│    │    │    │    │    │    │    │    ╞══Q216208 xanthophylls
│    │    │    │    │    │    │    ╞══Q71573538 oxacycle
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    ╞══Q1227206 oxadiazole
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    ├──Q3270838 phosphine oxide
│    │    │    │    │    │    │    ├──Q15847183 selenone
│    │    │    │    │    │    ├──Q64692900 organic phosphorus compound
│    │    │    │    │    │    │    ├──Q2182492 organic compound, having C-P covalent bound
│    │    │    │    │    │    │    │    ├──Q71427927 phosphate ester
│    │    │    │    │    │    │    │    │    ╞══Q411097 organophosphate
│    │    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ╞══Q3565831 phosphazene
│    │    │    │    │    │    │    │    ├──Q681805 phosphine
│    │    │    │    │    │    │    │    ╞══Q3270838 phosphine oxide
│    │    │    │    │    │    │    │    ├──Q76817747 phosphinic acids
│    │    │    │    │    │    │    │    ├──Q97359662 phosphinous acid
│    │    │    │    │    │    │    │    ├──Q64699467 phosphonic acid
│    │    │    │    │    │    │    │    ├──Q425041 phosphonium salt
│    │    │    │    │    │    │    │    ├──Q3572321 phosphonium ylide
│    │    │    │    │    │    │    │    ├──Q413172 phosphorane
│    │    │    │    │    │    │    ╞══Q64694492 organophosphorus ester
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    ├──Q12270111 organic salt
│    │    │    │    │    │    │    ├──Q410450 Meisenheimer complex
│    │    │    │    │    │    │    ├──Q278540 alkoxide
│    │    │    │    │    │    │    ╞══Q99603944 enolate
│    │    │    │    │    │    │    ╞══Q17123701 nitrilium salt
│    │    │    │    │    │    │    ╞══Q9258922 phenoxide
│    │    │    │    │    │    │    ╞══Q72087444 quaternary ammonium salt
│    │    │    │    │    │    │    ├──Q426584 thiolate
│    │    │    │    │    │    │    ├──Q845218 viologens
│    │    │    │    │    │    ├──Q107392144 organic sulfur compound
│    │    │    │    │    │    │    ├──Q422785 organosulfur compound
│    │    │    │    │    │    │    │    ╞══Q2664257 Bunte salt
│    │    │    │    │    │    │    │    ╞══Q73727502 organosulfur heterocyclic compound
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    │    ╞══Q7636193 sulfenamide
│    │    │    │    │    │    │    │    ├──Q411721 sulfenic acid
│    │    │    │    │    │    │    │    ╞══Q281166 sulfilimine
│    │    │    │    │    │    │    │    ├──Q420304 sulfinic acid
│    │    │    │    │    │    │    │    │    ╞══Q2364934 sultine
│    │    │    │    │    │    │    │    ╞══Q97360410 sulfinylamine
│    │    │    │    │    │    │    │    ├──Q411193 sulfone
│    │    │    │    │    │    │    │    ├──Q250437 sulfonic acid
│    │    │    │    │    │    │    │    ├──Q56398535 sulfonium compound
│    │    │    │    │    │    │    │    ├──Q408395 sulfoxide
│    │    │    │    │    │    │    │    ├──Q1088212 thial
│    │    │    │    │    │    │    │    ├──Q909901 thioacetal
│    │    │    │    │    │    │    │    ├──Q1379491 thiocarboxylic acid
│    │    │    │    │    │    │    │    ├──Q727732 thioether
│    │    │    │    │    │    │    │    ╞══Q77033769 thioglycoside
│    │    │    │    │    │    │    │    ├──Q420244 thioketone
│    │    │    │    │    │    │    │    ├──Q220410 thiol
│    │    │    │    │    │    │    │    ╞══Q426584 thiolate
│    │    │    │    │    │    │    │    ╞══Q72183752 thiosugar
│    │    │    │    │    │    │    ╞══Q25323761 sulfur diimide
│    │    │    │    │    │    ╞══Q421158 organoboron compound
│    │    │    │    │    │    ... see above
│    │    │    │    │    │    ├──Q387914 organohalogen compound
│    │    │    │    │    │    │    ├──Q408688 acyl halide
│    │    │    │    │    │    │    ├──Q12018894 haloform
│    │    │    │    │    │    │    ╞══Q421086 halohydrin
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    ├──Q25416371 mustard
│    │    │    │    │    │    │    ├──Q2200141 organofluorine
│    │    │    │    │    │    │    │    ╞══Q425094 fluorocarbon
│    │    │    │    │    │    │    ├──Q127488 trihalomethane
│    │    │    │    │    │    ├──Q2642710 organometallic compound
│    │    │    │    │    │    │    ├──Q415602 acetylide
│    │    │    │    │    │    │    ├──Q3130623 organobismuth compound
│    │    │    │    │    │    │    │    ├──Q15726362 bismuthane
│    │    │    │    │    │    │    ├──Q56422995 organomagnesium compound
│    │    │    │    │    │    │    │    ├──Q1238028 Grignard reagent
│    │    │    │    │    │    │    ├──Q416937 sandwich compound
│    │    │    │    │    │    │    │    ├──Q413676 metallocene
│    │    │    │    │    │    │    │    │    ├──Q21042433 ferrocenophane
│    │    │    │    │    │    ├──Q4386156 organoselenium compound
│    │    │    │    │    │    │    ╞══Q1147064 isoselenocyanate
│    │    │    │    │    │    │    ├──Q7447861 selenenic acid
│    │    │    │    │    │    │    ├──Q25098715 seleninic acid
│    │    │    │    │    │    │    ├──Q130764 selenol
│    │    │    │    │    │    │    ╞══Q15847183 selenone
│    │    │    │    │    │    │    ├──Q3612269 selenonic acid
│    │    │    │    │    │    │    ├──Q15847184 selenoxide
│    │    │    │    │    │    │    ├──Q2437006 selone
│    │    │    │    │    ╞══Q1778613 oxocarbon
│    │    │    │    │    ├──Q2268086 selenocyanate
│    │    │    │    │    ├──Q77747995 thiocyanate
│    │    │    │    │    ├──Q417615 xanthate
│    │    │    │    ├──Q66194 cyclic compound
│    │    │    │    │    ├──Q25600821 antiaromatic compound
│    │    │    │    │    ╞══Q19834818 aromatic compound
│    │    │    │    │    ... see above
│    │    │    │    │    ╞══Q73232281 cyclic ketone
│    │    │    │    │    ... see above
│    │    │    │    │    ├──Q193430 heterocyclic compound
│    │    │    │    │    │    ├──Q71244067 heterobicyclic compound
│    │    │    │    │    │    │    ╞══Q107264728 cepham
│    │    │    │    │    │    │    ╞══Q20986771 coumarin
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    ├──Q72840867 heteropolycyclic compound
│    │    │    │    │    │    │    ├──Q65684240 heterotricyclic compound
│    │    │    │    │    │    │    │    ╞══Q174337 flavin
│    │    │    │    │    │    │    │    ╞══Q414774 furanocoumarin
│    │    │    │    │    │    │    │    ╞══Q65684228 xanthene derivatives
│    │    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    ├──Q6821509 mesoionic compound
│    │    │    │    │    │    ├──Q2758348 nitrogen heterocycle
│    │    │    │    │    │    │    ╞══Q72084374 organonitrogen heterocyclic compound
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    ╞══Q71573704 organic heterocyclic compound
│    │    │    │    │    │    ... see above
│    │    │    │    │    ├──Q47457841 homocyclic compound
│    │    │    │    │    │    ╞══Q4214615 carbocyclic compound
│    │    │    │    │    │    ... see above
│    │    │    │    │    ╞══Q416840 iridoid
│    │    │    │    │    ╞══Q100705011 lactide
│    │    │    │    │    ├──Q419178 macrocycle
│    │    │    │    │    │    ├──Q423503 calixarene
│    │    │    │    │    │    ├──Q76504279 crown compounds
│    │    │    │    │    │    ├──Q596999 cryptand
│    │    │    │    │    │    ├──Q419024 cyclophane
│    │    │    │    │    ╞══Q72054273 mancude-ring compound
│    │    │    │    │    ╞══Q24577828 organic cyclic compound
│    │    │    │    │    ... see above
│    │    │    │    │    ├──Q426145 polycyclic compound
│    │    │    │    │    │    ╞══Q72840867 heteropolycyclic compound
│    │    │    │    │    │    ... see above
│    │    │    │    │    │    ╞══Q72840159 organic polycyclic compound
│    │    │    │    │    │    ... see above
│    │    │    │    │    │    ╞══Q22158401 polycyclic aromatic compound
│    │    │    │    │    │    ... see above
│    │    │    │    │    │    ╞══Q73356757 polycyclic hydrocarbon
│    │    │    │    │    │    ... see above
│    │    │    │    │    │    ├──Q424180 spiro compound
│    │    │    │    │    │    ├──Q3539074 tricyclic compound
│    │    │    │    │    │    │    ╞══Q71655701 benzopteridine
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    ╞══Q65684240 heterotricyclic compound
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    ╞══Q539847 paddlane
│    │    │    │    ├──Q905978 dipolar compound
│    │    │    │    │    ├──Q420686 ylide
│    │    │    │    │    │    ╞══Q17014682 azomethine ylide
│    │    │    │    │    │    ╞══Q17130695 nitrile ylide
│    │    │    │    │    │    ├──Q3342206 nitrilimine
│    │    │    │    │    │    ╞══Q3572321 phosphonium ylide
│    │    │    │    │    ├──Q245115 zwitterion
│    │    │    │    │    │    ├──Q181466 amine oxide
│    │    │    │    │    │    │    ├──Q415778 nitrone
│    │    │    │    │    │    ├──Q74172408 amino acid zwitterion
│    │    │    │    │    │    ├──Q72052841 onium betaine
│    │    │    │    │    │    │    ╞══Q6821509 mesoionic compound
│    │    │    │    ╞══Q1327815 hydrogen compound
│    │    │    │    ... see above
│    │    │    │    ├──Q2366155 ionic compound
│    │    │    │    │    ├──Q12370 salt
│    │    │    │    │    │    ╞══Q2664257 Bunte salt
│    │    │    │    │    │    ╞══Q55076544 cyanide
│    │    │    │    │    │    ╞══Q410255 diazonium compound
│    │    │    │    │    │    ├──Q2732101 fulminate salt
│    │    │    │    │    │    ╞══Q12270111 organic salt
│    │    │    │    │    │    ... see above
│    │    │    │    │    │    ╞══Q425041 phosphonium salt
│    │    │    │    │    │    ├──Q56250626 sulfide salt
│    │    │    │    │    │    ├──Q9356590 telluride salt
│    │    │    │    ├──Q56283350 iron compounds
│    │    │    │    │    ╞══Q21042433 ferrocenophane
│    │    │    │    │    ├──Q72176380 iron coordination entity
│    │    │    │    │    │    ├──Q312085 Iron-sulfur cluster
│    │    │    │    ├──Q56398233 magnesium compound
│    │    │    │    │    ╞══Q56422995 organomagnesium compound
│    │    │    │    │    ... see above
│    │    │    │    ├──Q5156940 oxygen compound
│    │    │    │    │    ╞══Q48999272 aminoxyl radical
│    │    │    │    │    ╞══Q843438 cyanate
│    │    │    │    │    ... see above
│    │    │    │    │    ├──Q71421787 hydroxy compound
│    │    │    │    │    │    ╞══Q335768 boronic acid
│    │    │    │    │    │    ╞══Q71419357 organic hydroxy compound
│    │    │    │    │    │    ... see above
│    │    │    │    │    │    ├──Q497173 oxoacid
│    │    │    │    │    │    │    ╞══Q11751652 arsinic acid
│    │    │    │    │    │    │    ╞══Q11751650 arsinous acid
│    │    │    │    │    │    │    ╞══Q11751651 arsonic acid
│    │    │    │    │    │    │    ╞══Q11751648 arsonous acid
│    │    │    │    │    │    │    ╞══Q134856 carboxylic acid
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    ├──Q415838 peroxy acid
│    │    │    │    │    │    │    ╞══Q76817747 phosphinic acids
│    │    │    │    │    │    │    ╞══Q64699467 phosphonic acid
│    │    │    │    │    │    │    ╞══Q25098715 seleninic acid
│    │    │    │    │    │    │    ╞══Q3612269 selenonic acid
│    │    │    │    │    │    │    ╞══Q420304 sulfinic acid
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    ╞══Q250437 sulfonic acid
│    │    │    │    │    │    ╞══Q97359662 phosphinous acid
│    │    │    │    │    │    ╞══Q7447861 selenenic acid
│    │    │    │    │    │    ├──Q77743902 silanol
│    │    │    │    │    │    ╞══Q411721 sulfenic acid
│    │    │    │    │    ╞══Q408365 isocyanate
│    │    │    │    │    ... see above
│    │    │    │    │    ╞══Q422772 nitro compound
│    │    │    │    │    ... see above
│    │    │    │    │    ╞══Q107344349 organic oxygen compound
│    │    │    │    │    ... see above
│    │    │    │    │    ╞══Q182738 oxime
│    │    │    │    │    ... see above
│    │    │    │    │    ├──Q19885597 oxo compound
│    │    │    │    │    │    ├──Q188777 amide
│    │    │    │    │    │    │    ├──Q74562064 aromatic amide
│    │    │    │    │    │    │    │    ╞══Q4066270 anilides
│    │    │    │    │    │    │    ╞══Q355679 carboxamides
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    │    ╞══Q407944 imide
│    │    │    │    │    │    │    ├──Q57698981 phosphoramide
│    │    │    │    │    │    │    ╞══Q416105 semicarbazones
│    │    │    │    │    │    │    ├──Q7636199 sulfinamide
│    │    │    │    │    │    │    ├──Q3208529 sulfonamide
│    │    │    │    │    │    │    │    ╞══Q1492134 sultam
│    │    │    │    │    │    ╞══Q9392635 carbonyl compound
│    │    │    │    │    │    ... see above
│    │    │    │    │    │    ╞══Q101487 ester
│    │    │    │    │    │    ... see above
│    │    │    │    │    │    ╞══Q15847184 selenoxide
│    │    │    │    │    │    ╞══Q97360410 sulfinylamine
│    │    │    │    │    │    ╞══Q408395 sulfoxide
│    │    │    │    │    ╞══Q1778613 oxocarbon
│    │    │    │    │    ├──Q107429 peroxide
│    │    │    │    │    │    ├──Q20986117 organic peroxide
│    │    │    │    │    │    │    ├──Q20986115 organic hydroperoxide
│    │    │    │    │    │    │    ╞══Q3666421 trioxide
│    │    │    │    │    │    │    ╞══Q107383055 trioxolane
│    │    │    │    │    │    │    ... see above
│    │    │    │    │    │    ╞══Q415838 peroxy acid
│    │    │    │    │    ├──Q46220103 phosphates
│    │    │    │    │    │    ╞══Q71427927 phosphate ester
│    │    │    │    │    │    ... see above
│    │    │    │    │    ╞══Q5951249 polysiloxanes
│    │    │    │    │    ... see above
│    │    │    │    │    ├──Q426680 siloxane
│    │    │    │    │    ├──Q19903024 stannoxane
│    │    │    │    │    ╞══Q417615 xanthate
│    │    │    │    ├──Q64692893 phosphorus compound
│    │    │    │    │    ╞══Q64692900 organic phosphorus compound
│    │    │    │    │    ... see above
│    │    │    │    │    ╞══Q46220103 phosphates
│    │    │    │    │    ... see above
│    │    │    │    │    ╞══Q57698981 phosphoramide
│    │    │    │    ├──Q71782942 pnictogen compound
│    │    │    │    │    ├──Q3685323 nitrogen compound
│    │    │    │    │    │    ├──Q407627 azide
│    │    │    │    │    │    ╞══Q843438 cyanate
│    │    │    │    │    │    ... see above
│    │    │    │    │    │    ╞══Q55076544 cyanide
│    │    │    │    │    │    ╞══Q408365 isocyanate
│    │    │    │    │    │    ... see above
│    │    │    │    │    │    ├──Q416049 isothiocyanate
│    │    │    │    │    │    ╞══Q2758348 nitrogen heterocycle
│    │    │    │    │    │    ... see above
│    │    │    │    │    │    ╞══Q77899525 organic nitrogen compound
│    │    │    │    │    │    ... see above
│    │    │    │    │    │    ╞══Q2268086 selenocyanate
│    │    │    │    │    │    ╞══Q77747995 thiocyanate
│    │    │    │    ├──Q419067 pseudohalogen
│    │    │    │    ├──Q67457558 selenium compounds
│    │    │    │    │    ╞══Q4386156 organoselenium compound
│    │    │    │    │    ... see above
│    │    │    │    │    ├──Q425269 selenide
│    │    │    │    │    ╞══Q2268086 selenocyanate
│    │    │    │    ├──Q12550003 silicon compound
│    │    │    │    │    ├──Q422789 organosilicon compound
│    │    │    │    │    │    ├──Q10371457 silanol
│    │    │    │    │    │    ╞══Q3483798 silazane
│    │    │    │    │    │    ├──Q107379815 silylene
│    │    │    │    │    ╞══Q5951249 polysiloxanes
│    │    │    │    │    ... see above
│    │    │    │    │    ╞══Q77743902 silanol
│    │    │    │    │    ╞══Q7515021 silicon-hydrogen compound
│    │    │    │    │    ... see above
│    │    │    │    │    ╞══Q426680 siloxane
│    │    │    │    ├──Q72073013 sulfur compound
│    │    │    │    │    ╞══Q416049 isothiocyanate
│    │    │    │    │    ╞══Q107392144 organic sulfur compound
│    │    │    │    │    ... see above
│    │    │    │    │    ╞══Q7227008 polysulfane
│    │    │    │    │    ├──Q81043 polysulfide
│    │    │    │    │    ├──Q221205 sulfide
│    │    │    │    │    │    ╞══Q727732 thioether
│    │    │    │    │    ╞══Q77747995 thiocyanate
│    │    │    │    │    ╞══Q417615 xanthate
│    │    │    │    ├──Q899851 unsaturated compound
│    │    │    │    │    ╞══Q20901727 alkynols
│    │    │    │    │    ... see above
│    │    │    │    │    ╞══Q25600821 antiaromatic compound
│    │    │    │    │    ╞══Q40208401 chalconoid
│    │    │    │    │    ╞══Q71271159 olefinic compound
│    │    │    │    │    ... see above
│    │    │    │    │    ╞══Q965478 unsaturated hydrocarbon
│    │    │    │    │    ... see above
│    │    │    ├──Q2512777 simple substance
│    │    │    │    ├──Q21198401 allotrope
│    │    │    │    │    ├──Q622460 allotrope of carbon
│    │    │    │    │    │    ├──Q178026 fullerene
│    │    ├──Q3482890 sialon
├──Q36496 ion
│    ├──Q107968 anion
│    │    ├──Q55524005 dianion
│    │    ├──Q55523986 monoanion
│    │    │    ├──Q6707113 lyate ion
│    │    ├──Q43457632 organic anion
│    │    │    ├──Q898552 carbanion
│    ├──Q326277 cation
│    │    ├──Q55523831 monocation
│    │    │    ├──Q6709746 lyonium ion
│    │    ├──Q43457636 organic cation
│    │    │    ├──Q642076 arenium ion
│    │    │    ├──Q212270 carbocation
│    │    │    │    ├──Q201324 carbenium ion
│    │    │    ├──Q420401 quaternary ammonium cation
│    │    │    │    ├──Q412922 cyanine
│    │    ├──Q55511472 polyatomic cation
│    │    │    ├──Q74244141 ammonium ion derivative
│    │    │    │    ╞══Q420401 quaternary ammonium cation
│    │    │    │    ... see above
│    │    │    ├──Q341409 onium ion
│    │    │    ├──Q132187 oxonium
│    ├──Q43456933 organic ion
│    │    ├──Q5643431 halonium ion
│    │    ╞══Q43457632 organic anion
│    │    ... see above
│    │    ╞══Q43457636 organic cation
│    │    ... see above
│    ├──Q1993452 radical ion
│    ├──Q3955012 semiquinone

Patterns edit

four types of patterns that can be used for matching:

  1. canonical SMILES (P233), isomeric SMILES (P2017), SMARTS notation (P8533) --> SMILES without asterisk, substructure search matches whole pattern
  2. canonical SMILES (P233), isomeric SMILES (P2017) --> SMILES with asterisk, substructure search matches a SMARTS pattern exclusively that can be derived from the SMILES, by replacing the non-asterisk atoms with an explicitly bound SMARTS atom
  3. SMARTS notation (P8533) --> SMARTS
  4. SMARTS notation (P8533) --> SMARTS with proposed extension, substructure search matches exclusively, optionally using given quantifiers