Reihe 2024 – Superkonvergenz Biorevolution: Vorboten von AlphaFold 3
Die wichtigsten Erkenntnisse
- ChatGPT hat der Idee, KI zur Vorhersage von Text zu verwenden, viel Aufmerksamkeit verschafft, und die Vorhersage von Text führte natürlich zur Vorhersage von Bildern oder sogar Videos auf der Grundlage verschiedener Prompts. Können wir diese Konzepte nutzen, um vorherzusagen, wie Proteine und Moleküle in Zellen interagieren könnten?
- Die Faltung und Struktur von Proteinen ist ein faszinierendes Problem. Ein einzelnes Protein kann auf etwa 10300 verschiedene Arten gefaltet werden - viel zu viele, als dass ein System versuchen könnte, eine Lösung nach der anderen zu finden.
- Es ist bemerkenswert, wenn man bedenkt, dass die Frage der Proteinfaltung seit etwa 50 Jahren ungelöst ist und wir nun einen stetigen Strom von Fortschritten sehen, wie z.B. AlphaFold, AlphaFold 2, AlphaFold 3… Es ist erstaunlich, wie die Konvergenz von KI, Rechenleistung und biotechnologischem Verständnis diese Fragen recht schnell vorantreibt.
- Verbundene Produkte WisdomTree BioRevolution UCITS ETF – USD Acc, WisdomTree Artificial Intelligence UCITS ETF – USD Acc Mehr erfahren
Bei der Entwicklung unserer Strategie zur Biorevolution arbeiteten wir mit dem Zukunftsforscher Dr Jamie Metzl zusammen, einem Mitglied des Expertenausschusses der Weltgesundheitsorganisation für Genome Editing am Menschen. Wir befinden uns an der Schwelle zu einer bemerkenswerten Phase, die mehrere Jahrzehnte dauern könnte und in der wir unsere Arbeitsweise hinterfragen und letztlich weiterentwickeln werden. Dazu zählt:
- Wie wir die menschliche Gesundheitsversorgung handhaben
- Wie wir Lebensmittel für eine wachsende Weltbevölkerung anbauen
- Wie wir neue Materialien, Chemikalien und Energie aus biologischen Quellen gewinnen
- Wie wir riesige Datenmengen mit höherer Dichte und Genauigkeit als in der Vergangenheit speichern
Dr. Metzl veröffentlichte vor Kurzem das Buch Superconvergence: How the Genetics, Biotech, and AI Revolutions will Transform our Lives, Work and World. (Zu Deutsch: Superkonvergenz: Wie die Revolutionen in Genetik, Biotechnologie und KI unser Leben, unsere Arbeit und unsere Welt verändern werden). Im Laufe des Sommers werden wir verschiedene Blogs veröffentlichen, in denen wir auf einige der im Buch vorgestellten Ideen eingehen.
Das Fazit
Bei thematischen Anlagen geht es in gewisser Weise um das Erzählen von Geschichten. Superkonvergenz ist ein hervorragender Ansatz zur Darstellung der Geschichte hinter dem WisdomTree BioRevolution ESG Screened Index.
Danke ChatGPT
Meiner Meinung nach ist das Beste an ChatGPT, dass es das Konzept der generativen künstlichen Intelligenz (KI) für fast jeden zugänglich gemacht hat. In der Anfangsphase konzentrierte sich die Popularität der generativen KI auf die Generierung von Text, aber inzwischen hat sich das Interesse auch auf die Generierung von Bildern, Tönen und Videos ausgeweitet. Es macht Sinn, sich vorzustellen, dass alles, was ein System und eine Struktur hat und wo ein System auf die verschiedenen Regeln und Beziehungen trainiert werden kann, für eine Vorhersage geeignet ist.
Die Stärke dieser Systeme liegt in der Tatsache, dass sie ständig Vorhersagen treffen können, die zum Nachdenken anregen, und weniger darin, ob eine dieser Vorhersagen immer zu 100 % zutreffend ist. Wenn wir unseren Blick auf die Biotechnologie richten, geht es nicht darum, ein Heilmittel vorherzusagen, sondern einen neuen Forschungspfad vorherzusagen, der Forschende zu einem interessanten therapeutischen Ergebnis führen kann.
Können generative KI-Systeme nützliche Proteinstrukturen vorhersagen?
Die Vorhersage verschiedener Wortfolgen, die anhand eines Prompts oder der Position von Pixeln in einem Bild Sinn ergeben, ist eine Sache – die Vorhersage von Zusammenhängen zwischen Molekülen in einem biologischen System eine ganz andere.
Wir zeigen Abbildung 1, um allen, die keinen Hintergrund in Molekularbiologie haben (zu denen ich mich selbst zähle), eine Vorstellung von der visuellen Komplexität eines einzelnen Proteins zu vermitteln - in diesem Fall der menschlichen Speichelamylase aus der europäischen Protein Data Bank. Es ist unmöglich, nicht davon beeindruckt zu sein, wie in der Wissenschaft tätige Menschen die Röntgenkristallographie physisch durchführen und damit die Grundlage für die Bestimmung der Proteinstruktur geschaffen haben.
Abbildung 1: Struktur des menschlichen Speichelproteins

Quelle: https://www.ebi.ac.uk/pdbe/entry/pdb/1smd
Ankündigung von AlphaFold im Jahr 2020
Professor John Moult, Mitgründer und Lehrstuhlinhaber des Critical Assessment of Protein Structure Prediction (CASP) von der University of Maryland, sagte1:
Wir haben uns fast 50 Jahre lang mit dem Problem beschäftigt, wie Proteine gefaltet werden können. Zu sehen, dass DeepMind eine Lösung für dieses Problem gefunden hat, nachdem ich persönlich so lange daran gearbeitet habe und nach so vielen Zwischenstopps und Anläufen, bei denen ich mich fragte, ob wir jemals ankommen würden, ist ein ganz besonderer Moment.
Die CASP-Experimente zielen darauf ab, den aktuellen Stand der Technik bei der Vorhersage von Proteinstrukturen zu ermitteln, Fortschritte zu identifizieren und hervorzuheben, worauf sich künftige Bemühungen konzentrieren könnten. Sie finden alle zwei Jahre statt, die erste davon im Jahr 19942.
Als man im Jahr 1969 die Herausforderung annahm, die dreidimensionale Struktur eines Proteins vorherzusagen, schätzte man, dass ein typisches Protein etwa 10.000 mögliche Konfigurationen haben könnte. Dies zeigt uns, dass ein „Brute-Force“-Ansatz, bei dem ein System alle Möglichkeiten prüft, nicht machbar ist3.
Simulation einer Zelle
Wir können viel von besseren, detaillierteren Simulationen lernen. Am 18. März 2024 kündigte Nvidia einen digitalen Zwilling des Erdklimas an. Das Konzept: Wenn wir das Klima und das Wetter mit zunehmender Detailgenauigkeit simulieren können, können wir dies nutzen, um Veränderungen des Wetters und des Klimas besser zu verstehen und letztendlich vorherzusagen4. Die Idee scheint einfach zu sein, aber es ist nicht einfach, genügend Daten zu sammeln und zu verarbeiten, um auch nur eine halbwegs gute Chance zu haben, genau genug zu sein, um von Bedeutung zu sein.
In Anbetracht der Schwierigkeiten und Kosten, die mit der Organisation klinischer Studien zur Erprobung verschiedener möglicher Therapien verbunden sind, liegt der Gedanke nahe, dass wir eine Menge lernen könnten, wenn wir den menschlichen Körper und die ihm zugrunde liegenden Systeme lediglich simulieren könnten, und somit weniger auf die Organisation klinischer Studien am Menschen angewiesen wären.
Es ist interessant, einen Schritt zurückzutreten und zu erkennen, dass wir im Laufe der Zeit bereits DNA, rRNA, Aminosäuren und Proteine analysiert haben. Wir bauen unser Verständnis Stück für Stück auf. Die Komplexität, die mit jedem dieser Schritte verbunden ist, ist atemberaubend.
Aus Superkonvergenz:
DeepMind-Gründer Demis Hassabis sagte Eric Topol im Jahr 2022:
Einer meiner Träume für die nächsten 10 Jahre ist es, eine virtuelle Zelle herzustellen. Was ich mit virtueller Zelle meine, ist, dass man die gesamte Funktion der Zelle mit einem KI-System modelliert. Man könnte virtuelle Experimente mit dieser Zelle durchführen, und die Vorhersagen, die sich daraus ergeben, würden sich bestätigen, wenn man sie im Nasslabor überprüft. Wenn man so etwas hätte, könnten Sie sich dann vorstellen, wie viel schneller und effizienter der gesamte Prozess der Arzneimittelentdeckung und der klinischen Studien wäre?… Man kann das, was wir mit AlphaFold gemacht haben, als die erste Stufe der Leiter betrachten… Darauf baut man dann langsam auf, vielleicht bis zu den Bahnen und schließlich zu den Zellen und schließlich vielleicht zum ganzen Organismus. Das ist der Traum5.
Vorstellung von AlphaFold 3
Das Witzige an der Veröffentlichung von Texten im Internet oder an Vorträgen in verschiedenen Podcasts ist, dass man, wenn man weiß, wie man danach zu suchen hat, alle möglichen Vorhersagen finden kann, die Menschen gemacht haben, oder Hoffnungen, die sie in diesem Moment eingefroren hatten. Es ist interessant, dieses Zitat von Demis Hassabis im Juli 2024 zu lesen, wenn wir wissen, dass AlphaFold 3 vor kurzem freigegeben wurde.
Am 8. Mai 2024 wurde Folgendes veröffentlicht6:
Vorstellung von AlphaFold 3, einem neuen KI-Modell, das von Google DeepMind und Isomorphic Labs entwickelt wurde. Wir hoffen, dass die genaue Vorhersage der Struktur von Proteinen, DNA, RNA, Liganden und mehr, sowie deren Interaktion, unser Verständnis der biologischen Welt und die Entwicklung von Medikamenten verändern wird.
Meiner zugegebenermaßen laienhaften Lesart nach hätten sie dies geschrieben, wenn AlphaFold 3 eine ganze Zelle simuliert hätte. Meine Interpretation ist daher, dass dies ein wichtiger Schritt auf diesem Weg ist und dass wir mehr und mehr Versionen erwarten sollten, die eine immer größere Auflösung von Zellen und schließlich von lebenden Organismen einbeziehen können. Es ist faszinierend, dass selbst als das Buch Superconvergence veröffentlicht wurde, der Stand der Technik bei der Vorhersage von Proteinstrukturen in Richtung Zellsimulation weiter voranschritt. Wir konnten das Genom sequenzieren, wir haben vorhergesagt, wie sich verschiedene Proteine falten würden, und jetzt beginnen wir damit, vorherzusagen, wie verschiedene Moleküle und Proteine interagieren werden. Es scheint, dass diese Fortschritte immer schneller vonstatten gehen. Wenn man sich die Zeitachse vor Augen führt, wird deutlich, dass das Humangenomprojekt im Jahr 20037 abgeschlossen wurde, AlphaFold im Jahr 20208 und AlphaFold 3 im Jahr 20249 angekündigt wurde. Mit den Fortschritten der Computerhardware und der KI sollten auch die Dinge, die in der Biotechnologie möglich sind, das gleiche Potenzial haben. Das Aufeinandertreffen dieser verschiedenen Megatrends könnte die kommenden Jahre sehr spannend machen.
1 Quelle: https://deepmind.google/discover/blog/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology/
2 Quelle: https://predictioncenter.org/index.cgi
3 Quelle: Levinthal, Cyrus (Anmerkungen von A. Rawitch). 1969 How to fold graciously. In Mössbauer Spectroscopy in Biological Systems, Herausg. P. Debrunner, J. C. M. Tsibris und E. Münck. Protokoll eines Treffens im Allerton House, 17. und 18. März 1969, Monticello, Illinois. Urbana, Ill.: University of Illinois Press.
4 Quelle: https://nvidianews.nvidia.com/news/nvidia-announces-earth-climate-digital-twin#:~:text=GTC%E2%80%94To%20accelerate%20efforts%20to,and%20climate%20at%20unprecedented%20scale.
5 Quelle: Metzl, Jamie. Superconvergence: How the Genetics, Biotech, and AI Revolutions will Transform our Lives, Work and World. Timber Press: 2024.
6 Quelle: https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/#life-molecules
7 Quelle: https://www.genome.gov/human-genome-project/timeline#:~:text=More%20%2B-,2003,two%20years%20ahead%20of%20schedule.
8 Quelle: https://deepmind.google/discover/blog/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology/
9 Quelle: https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/#life-molecules
Verbundene Produkte
