Unstrukturierte Informationsquellen wie wissenschafltiche Publikationen, elektronische Patientenakten, aber auch Patente, liegen in sehr großer Zahl vor. Die automatisierte Analyse dieser unstrukturierten Wissensquellen erfordert substanzielle Compute-Ressourcen; skalierende Systeme für die Informationsextraktion müssen jedoch für HPC-Umgebungen optimiert werden und beispielsweise mit den existierenden Middlewares für die Verteilung rechenintensiver Aufgaben harmonisieren. Fraunhofer SCAI macht komplexe Text-Mining-Workflows auf HPC-Umgebungen lauffähig und demonstriert den wissenschaftlichen Einsatz von Hochleistungsrechnern für die Informationsextraktion. Die angebotenen Leistungen konzentrieren sich hierbei auf die kostengünstige Indexierung von Firmenarchiven mit dem Schwerpunkt Chemie sowie auf die Erschließung klinischer Routinedaten für Zwecke der Forschung und für Studien in der Gesundheitsökonomie.