TU München | KI für die biomedizinische Forschung
Plattform zur Beschleunigung der biomedizinischen Forschung

Das Wichtigste in Kürze

Biocentral macht komplexe KI-Modelle für die biomedizinische Forschung erstmals zentral zugänglich und einfach nutzbar – ohne Programmierkenntnisse, aber mit maximalem Impact für Wissenschaft und Lehre.

Wie aus verstreuten Modellen eine zentrale Plattform für bessere Forschung wurde

In der biomedizinischen Forschung treffen zwei Entwicklungen aufeinander: Die verfügbaren Datenmengen wachsen rasant. Gleichzeitig sind die bestehenden Technologien und Werkzeuge, um diese Daten zu analysieren oft zu fragmentiert, technisch komplex oder nur eingeschränkt nutzbar. Forschende verbringen dadurch viel Zeit, Modelle zu suchen, technische Abhängigkeiten zu lösen oder Software manuell an ihre Bedürfnisse anzupassen.

Gerade im Bereich der KI-gestützten Analyse biomedizinischer Daten gibt es zwar viele leistungsfähige Modelle, doch diese sind verstreut über verschiedene Repositorien, in unterschiedlichen Programmiersprachen geschrieben und häufig nicht wartbar. Die Folge: enormes Potenzial, das ungenutzt bleibt, um beispielsweise schnell medizinische Wirkstoffe zu entwickeln.

Gemeinsam mit der Technischen Universität München hat iteratec dieses Problem gezielt adressiert und die bestehende offene Plattform Biocentral weiter aufgebaut. Ziel war eine skalierbare, intuitive und zukunftsfähige Lösung, die biomedizinische Datenanalyse zugänglicher und leistungsfähiger macht.

Biocentral macht KI für alle nutzbar

Das gemeinsame Team aus Forschenden der TU München und KI-Expert:innen von iteratec entwickelte Biocentral als offene Plattform, auf der leistungsstarke KI-Modelle für die biomedizinische Forschung einfach zugänglich gemacht werden. Ein Beispiel dafür ist das SETH-Modell, das ungeordnete Regionen in Proteinstrukturen in kurzer Zeit erkennen kann und u. a. für die Alzheimer-Forschung relevant ist. Im Zentrum stehen modernste Deep-Learning-Verfahren, insbesondere sogenannte Protein-Language-Models. Diese Modelle – inspiriert von Entwicklungen wie AlphaFold, das 2024 mit dem Nobelpreis gewürdigt wurde – ermöglichen eine neue Qualität in der Vorhersage und Analyse biologischer Strukturen.

Biocentral vereint diese hochspezialisierten Modelle in einer benutzerfreundlichen Umgebung, die sowohl in der Forschung als auch in der Lehre eingesetzt werden kann. Ziel war nicht nur die technische Zusammenführung, sondern eine echte Vereinfachung des Zugangs zu KI, ohne notwendige Programmierkenntnisse, ohne versteckte Abhängigkeiten.

Ein Meilenstein für offene, KI-gestützte Wissenschaft

Ein zentrales Element bei der Umsetzung war die Standardisierung der KI-Modelle: Ursprünglich mit PyTorch entwickelt, also einer Machine-Learning-Bibliothek, die in produktiven Umgebungen aufwendig zu warten ist, wurden sie von den iteratec Kolleg:innen konsequent in das offene ONNX-Format überführt. Das gewährleistet nicht nur Unabhängigkeit von proprietären Frameworks, sondern auch langfristige Wartbarkeit und Interoperabilität.

Dieser Schritt erforderte tiefgreifende technische Eingriffe – teilweise mussten PyTorch-Funktionalitäten neu programmiert werden, um ONNX-Kompatibilität herzustellen. Gemeinsam mit der TU München entwickelten unsere Kolleg:innen individuelle Lösungen. Neben der Modellstandardisierung übernahmen wir die entsprechenden Teile der Backendentwicklung der Plattform. Alle Modelle wurden nach höchsten Standards wissenschaftlicher Software eingebettet, sodass Reproduzierbarkeit, Validierung und Transparenz durchgängig gewährleistet sind.

Die Veröffentlichung als Open-Source-Plattform auf GitHub stellt sicher, dass die wissenschaftliche Community weltweit von der Lösung profitieren und sie weiterentwickeln kann. Biocentral ist somit nicht nur Forschungsprojekt, sondern eine Einladung zur Kollaboration und ein Katalysator für offene Wissenschaft.

Zum GitHub von Biocentral

Biocentral Datenvisualisierung

KI einsetzen ohne Code: Ein echter Gamechanger für Labore

Mit Biocentral erhalten Forschende erstmals einen zentralen Ort, an dem sie mit verschiedenen KI-Modellen arbeiten können, ohne sich in deren technische Funktionsweise einarbeiten oder sie selbst betreiben zu müssen. Die Plattform abstrahiert technische Komplexität und macht damit das Potenzial moderner KI tatsächlich nutzbar, auch für kleinere Forschungseinheiten oder universitäre Arbeitsgruppen.

Wissenschaftler:innen können bestehende Modelle direkt anwenden, Daten analysieren, Hypothesen validieren und neue Erkenntnisse generieren – schneller, zuverlässiger und standardisiert. Dabei profitieren insbesondere biochemische, pharmazeutische und medizinische Forschungsteams, die bislang mangels Ressourcen oder Know-how Machine Learning nicht anwenden konnten.

Benutzeroberfläche der Biocentral Datenbank

Biocentral wächst und mit ihr die Möglichkeiten

Die Entwicklung von Biocentral steht erst am Anfang: In Zukunft soll die Plattform um weitere biologische Datenquellen und Analysefunktionen erweitert werden. Die langfristige Vision ist eine zentrale, interdisziplinäre Arbeitsplattform, die nicht nur den wissenschaftlichen Austausch beschleunigt, sondern auch die Entwicklung neuer Wirkstoffe und die Planung präklinischer Studien unterstützt.

Die Zusammenarbeit mit der iteratec GmbH war sehr angenehm – es wurden zuverlässig und zielstrebig Lösungen für unangenehme Probleme entwickelt, was uns am Lehrstuhl viel Zeit gespart hat. Wir freuen uns über das Interesse an unserem Forschungsbereich der Bioinformatik und sind fest davon überzeugt, dass innovative Technologie gepaart mit aktueller Forschung optimale Synergien für beide Seiten freisetzt. Daher gerne wieder! 

Sebastian Franz TU München

Eingesetzte Technologien & Methoden

Python, PyTorch, ONNX, Flask, Jupyter Notebook

Unsere Leistungen im Überblick

  • Konvertieren existierender Open-Source-PyTorch-Modelle zu ONNX-Modellen, teilweise Reimplementierung PyTorch nativer Funktionalitäten, Sicherstellen konsistenter Modelergebnisse
  • Pull Requests an die Repositories der verwendeten Modelle, um den Code öffentlich verfügbar und nachvollziehbar zu machen
  • Entwurf einer Architektur, wie die vielen Modelle mit ihren unterschiedlichen Anforderungen an Ein- und Ausgabe so in den existierenden Server-Code eingebettet werden können, damit höchste Wartbarkeit gewährleistet ist
  • Implementierung entsprechend der vorgeschlagenen Architektur

Über Kunden

  • Die Technische Universität München (TUM) ist mit über 52.500 Student:innen die nach Studentenanzahl größte Technische Universität in Deutschland. Ihre Schwerpunkte liegen im Bereich der Ingenieurwissenschaften, Technologie, Medizin und angewandter Naturwissenschaften.
    Mehr zur TU München
     
  • Das Rostlab (TUM I12 – Lehrstuhl für Bioinformatik), benannt nach seinem Gründer Prof. Dr. Burkhard Rost, ist seit über 30 Jahren aktiv an den aktuellsten methodischen Entwicklungen im Bereich der Bioinformatik beteiligt. Unter anderem entwickelte es die Protein-Language-Modelle ProtT5 und ProstT5 und erstellt mittels neuster KI-Methoden Vorhersagemodelle für Proteineigenschaften. 

Ihr Ansprechpartner

Sie haben ein konkretes Anliegen oder Fragen zu möglichen AI- und Data Analytics-Projekten für Ihr Unternehmen? Senden Sie eine Anfrage und ich melde mich bei Ihnen.

Dr. Felix Böhmer, Director Al & Data Analytics