Nieuws

Chemie volgens het boekje

Arjen Dijkgraaf | maandag 5 oktober 2020

Molecuul nodig? Een zoekrobot vindt zelfstandig het juiste recept in de wetenschappelijke literatuur en vertaalt het automatisch naar een formaat dat elke syntheserobot kan begrijpen. Het werkt nu al, claimen Lee Cronin en collega’s van de University of Glasgow.

In Science introduceerden ze zojuist hun Chemical Description Language, afgekort XDL waarbij je X moet lezen als de Griekse letter chi. XDL is losjes gebaseerd op de internetstandaard XML en net zo eenduidig: elke computer moet het foutloos kunnen begrijpen. Dus ook alle syntheserobots die momenteel als paddenstoelen uit de zuurkast schieten en elkaars machinetaal zelden of nooit verstaan.

Er hoort een algoritme bij dat SynthReader heet. Het doorploegt de chemische literatuur en zoekt in elke publicatie het hoofdstuk ‛Methods’ op, om dat vervolgens te scannen op zinnen die op een recept lijken. Via een combinatie van zinsontleding en woordherkenning worden die omgezet in XDL-instructies. In de publicatie dient de zin ‛Triethylamine (5 mL) was added dropwise over 30 min.’ als voorbeeld; in XDL wordt dat <Add reagent=”triethylamine” volume=‟5 mL” vessel=‟reactor” time=”30min” />.

Voor wie het wil proberen is een bètaversie van een online-vertaler beschikbaar.

Voorwaarde is wel dat de teksten Engelstalig zijn en zo formeel mogelijk. Zoiets als ‛We added triethylamine’ leest voor mensen prettiger maar het algoritme snapt het niet. En bij ‛dried thoroughly’ hoort op zijn minst een concrete droogtijd.

Controle achteraf door een menselijke chemicus kan sowieso geen kwaad. Cronins groep heeft een userinterface ontwikkeld, genaamd ChemIDE, dat XDL terugvertaalt naar een blokschema in leesbaar Engels. Ook zonder programmeerervaring kun je daarin wijzigingen aanbrengen.

Vervolgens is het aan de ontwerper van de syntheserobot om een vertaalprogramma te maken dat XDL-files omzet in de machinetaal van die robot. Die heeft daarna alleen nog voldoende lab-hardware en reagentia nodig om het recept volgens het boekje uit te voeren.

Om hun punt te maken hebben Cronin en collega’s de laatste twintig jaargangen van het tijdschrift Organic Syntheses laten inlezen door SynthReader. Ze claimen dat alle 523 recepten correct werden vertaald naar XDL. Daarvan hebben ze er twaalf met succes laten uitvoeren door hun eigen syntheserobot, de Chemputer (zie foto hieronder), en één op een andere high-throughputrobot van de groep.

Cronin droomt al van een chemische Spotify met miljoenen XDL-recepten voor moleculen die je snel nodig hebt, ook al zit je op Mars. Op de vraag hoe je dan moet omgaan met de copyrights, gaat hij wijselijk niet in.

Mehr, S.H.M. et al. (2020) Science 370(6512)

© Cronin Group, School of Chemistry, Glasgow