Transcript: Python in der Wissenschaft
Full episode transcript. Timestamps refer to the audio playback.
Ja, hallo liebe Hörerinnen und Hörer, willkommen zum Python-Podcast.
Wir haben die elfte Episode heute und sind heute wieder in Jochens Winter-Sommergarten.
Wir haben gerade Sommer.
Ja, hey Jochen, und wir haben heute wieder einen tollen Gast dabei, das ist der Gerrit.
Heute ist unser Thema Scientific Python.
Ja, vielleicht dachte ich erst mal hallo Gerrit kurz und dann...
Oder so Python in der Wissenschaft.
Hallo, Python in der Wissenschaft.
Genau, weil Scientific Python ist ja ein Paket und das wollen wir nicht verwechseln.
Wir reden eventuell auch über Scientific Python, aber...
Ja, vielleicht sag doch kurz auch deinen Hörern, wer du bist.
Ja, ich bin Gerrit. Ich bin von Haus aus Physiker und beschäftige mich hauptsächlich mit komplexen Systemen und deren Anwendung auf diverse Fachgebiete, Neurophysik, zum Teil auch Wirtschaft und zurzeit Biologie und Ökosysteme aus Mikroben.
Mikrobeller-Analyst habe ich mir aufgeschrieben.
Das hast du dir aber ausgedacht.
Wenn überhaupt Mikrobiell.
Okay, Mikrobieller-Analytiker.
Ja, alles klar.
Und ja, nutze dafür Python, um Sachen zu simulieren, um Daten zu analysieren
und manchmal auch, um ganz komische Sachen mit symbolischem Rechnen zu machen.
Und du spielst Golf.
Und ich spiele, ja, also zurzeit eigentlich nicht mehr so viel, aber ich habe Golf gespielt.
Da reden wir, also keine Ahnung, wollen wir direkt darüber, über Golf reden?
Die Code-Golf, ja, kommen wir gleich noch dran.
Wir machen einmal kurz ein bisschen News, wie wir das irgendwie so kennen und dann kommen wir irgendwie zum Topic.
Ja, auf jeden Fall. Dann mache ich hier schon mal die
erste News-Kapitelmarke.
Alles klar.
Ja, was gab es denn so?
Irgendwas wie PyOxidizer
oder sowas vorgestern, so eine News raus.
Ja, das genau.
PyOxidizer ist irgendwie so
eine Software, mit der es möglich
sein soll,
so eine Python-Applikation
ein Standalone-Executable
zu verwandeln, dass man dann einfach irgendwo hinschütten
kann und dann läuft das da. Und das halt
auch auf unterschiedlichen Plattformen, das heißt auf
Unix ganz genauso wie auf
Windows und
das ganze Ding ist irgendwie so Rust-basiert,
also das packt den Python-Interpreter
halt irgendwie in
in
ein Rust-Programm, also das ganze Ding ist
sozusagen irgendwie hinterher das, was auch
dabei rausfallen würde, wenn man einfach ein Rust-Programm
kompiliert
und ja, man kann alle möglichen
Dinge noch mit dazu, man kann auch Rust-Node mit dazu
So kann man tatsächlich Python irgendwo mithin shippen, also man braucht halt
Python mehr mitmachen, wenn man irgendwo
was deliveren will, beendable oder sowas,
auf den Server gehen, hat man das dabei und dann läuft
das einfach direkt oder auf Windows oder sowas,
für irgendwelche Nutzer, die halt damit nichts zu tun haben wollen,
die füllen dann die SpyOxygen aus und sind dann direkt...
Ja, also das hatten wir letztes Mal auch schon
und darauf nimmt
auch quasi dieses
Announcement, der Announcement-Blog-Post,
den ich da heute gesehen habe,
Bezug, dass es für
Python keine so richtig konsistente
Story
dazu gibt, wie das denn jetzt
irgendwie installiert wird auf einer Maschine.
Das wäre wie so ein Black Swan, also eine der
großen Bedrohungen, die so der Python-Community
vorstellt. Das ist tatsächlich genau. Und da gab es
einen Vortrag, also das war
die Keynote von der diesjährigen
PyCon US
von Russell
Keith McGee, der sagte, naja, das
ist halt eine potenziell fatale
Bedrohung eigentlich für Python als
Sprache, dass das irgendwann mal den
Zugang halt abschneiden kann zu allem.
Also auf mobilen Geräten
ist es ja jetzt schon im Grunde so. Da kommt man halt mit Python
nicht drauf. Und
ja, wenn man
keine solche Story hat, dann ist das halt echt
blöd unter Umständen. Also es macht für Entwickler nicht so
einen Unterschied. Das ist ja auch die Hauptzielgruppe,
da ist es dann egal. Da macht man sich sein
Virtual Environment und
benutzt Pip und vielleicht noch ein paar
andere Tools und so und hat damit kein Problem.
Aber wenn man jetzt einen Endanwender hätte
draußen, der... Ja, der will vielleicht gar nicht wissen,
was für eine Sprache dahinter steckt. Genau, dem interessiert
das nicht, ob das Python ist oder C.
Genau, genau. Der möchte einfach
nur irgendein Problem gelöst haben und gar nicht
ein Problem bekommen zusätzlich.
Und das ist natürlich momentan
so ein bisschen doof, gerade für Windows.
Also für Unix gibt es da ja schon was.
Also ehrlich
gesagt weiß ich davon auch nur, weil
derjenige, der das
entwickelt hat, hier auch
in Düsseldorf oder die
Düsseldorfer Python User Group
irgendwie
gegründet hat oder betreut
irgendwie
Markentree Lemberg und
der hat, genau, das ist uralt,
das ist irgendwie schon 20 Jahre alt oder so.
Ja, ist schon ein 90er schon.
Python 1, was war das?
Ja, ich weiß es nicht mehr genau, aber es ist auf jeden Fall schon
sehr alt und war halt,
er hatte das irgendwann mal geschrieben, um
damals
die ganzen Hoster konnten nur
Perl, irgendwie da Perl war davor installiert
und, aber man konnte mit
CGI auch beliebige
Programme sozusagen hochladen
per FTP irgendwie auf seinen Webspace
und wenn das halt ausführbar war, dann
hat das halt auch funktioniert
und er hat dann halt ein ganzes Python
und seine komplette Applikation halt
in ein Executable reingepackt
und das dann halt als CGI-Ding laufen
lassen können und konnte dann halt auch
auf einem Hoster, der eigentlich nur ein Perl konnte
oder so, halt sein Python
seine Python-Skripte hosten und
ja, das
hat auf Unix schon immer super funktioniert
ist jetzt auch inzwischen irgendwie
läuft das auf aktuellen Python-Versionen
Also ich glaube, seit dem letzten PyTDF-Sprint auch auf 3.7.
Und das ist ziemlich nett, das Ganze.
Man kann da sogar noch so nette Dinge machen wie,
da das, es beruht irgendwie darauf,
dass man, glaube ich, das Modul,
das irgendwie ausgeführt wird,
oder der Entry Point ist halt irgendwie in einem Zip-File,
das halt...
Das hört sich jetzt gerade ein bisschen kompliziert an.
Also was man tun kann, ist, man kann halt
eigene Sachen per ZIP irgendwie
einpacken, dann per Cut hinten an das
Binary dranhängen und dann wird das halt ausgeführt zum Beispiel.
Ah ja, cool, also eigene Pakete
und so. Ja, weil das
Binary irgendwie selbst hinten dran
schon ZIP ist oder ich weiß es nicht mehr genau.
Also man kann damit sehr, sehr lustige Dinge tun
und von der Größe her,
wenn man das
irgendwie so ein bisschen optimiert, dann
ist das, glaube ich, irgendwie so knapp 5 MB
groß oder so, was dabei rausfällt normalerweise
und da ist halt die Standard-Bibliothek nicht komplett drin,
aber zum großen Teil.
Ja, und ich weiß
jetzt nicht, hab jetzt... Ja, aber jetzt kriegst du eine nette Alternative,
das hört sich ganz nett an, ne?
Genau, der Vorteil bei PyAxidizer
ist halt, dass das auf Windows halt auch funktioniert,
was mit PyRun halt nicht geht.
Hat jemand von euch von der PyCon
2019 irgendwelche Talks gehört,
Talks gesehen, irgendwas Interessantes noch mitgebracht?
Also ich hatte einige Sachen gesehen, die ich mir natürlich
wieder interessierte, war irgendwie, dass ein bisschen Musik wieder
was dabei war mit Foxtrot von Jessica Garson,
war ganz nett.
Den hast du aber dann gesehen quasi tatsächlich.
Ja, ja, ich habe irgendwie aber nur kurz reingeguckt.
Ich muss das immer noch auf meiner Liste zu Ende schauen.
Das gibt es ja da irgendwie auf YouTube so ein bisschen.
Ja, und ich habe gehört, Pinterest ist jetzt bald Python 3 oder so.
Ach, ich dachte, die wären schon längst irgendwie umgestiegen.
Aber das war dann wahrscheinlich irgendwie Instagram oder so.
Da gab es so eine Riesendamme, die auch viel zu veröffentlicht, glaube ich,
wie sie da umgestiegen sind.
Aber bei Pinterest, dass die auf Python 3 umsteigen,
ist natürlich jetzt irgendwie so ein bisschen...
So wirklich angeben kann man damit jetzt nicht.
Die letzten, die so umsteigen.
Ja, ich habe gehört, also
der Python-Fu, also der Niklas, der war
jetzt auch schon einmal bei uns hier.
Die haben jetzt ein Tutorial für Python 2.7
und der Python 3 veröffentlicht. Das fand ich
sehr lustig.
Ja, und auch diese Woche.
Ja. Nee, aber ansonsten
habe ich auch tatsächlich im Grunde nichts
wirklich, was irgendwie an tollen Dingen
passiert wäre.
Aber immerhin ist ja schon so ein bisschen
was. Ja, so ein kleines bisschen.
Sonst machen wir dann nächstes Mal einfach wieder eine große News-Section und
fangen jetzt einfach an mit unserem Scientific-Thema.
Oder wollen wir erst mal mit dem Golf spielen?
Also spielst du auch richtig Golf oder nur Code-Golf?
Nee, ich spiele, wenn überhaupt, Code-Golf.
Zurzeit auch ehrlich gesagt nicht mehr so viel.
Irgendwann, wenn man das so ein paar Jahre
gemacht hat, hat man alles gesehen, was es
zu sehen ist. Jetzt erst mal für die
ungebeten Hörer, was ist das denn überhaupt?
Code-Golf. Also Code-Golf ist die
Aufgabe, dass man versucht, irgendeine
Programmieraufgabe, zum Beispiel programmiere die
Fakultät oder was auch immer,
mit möglichst wenig Zeichen zu lösen
in einer gegebenen Programmiersprache in der Regel.
Oder man kann es auch allgemein machen,
aber da wir jetzt über Python reden
und für die meisten Leute das Interessante ist,
in einer Programmiersprache zu machen.
Und ja, ohne Rücksicht auf irgendwelche Regeln.
Und das kann Spaß machen, offensichtlicherweise,
dass man einfach mal alle Regeln fallen lassen kann
und wild böse programmieren kann.
Ich kann mich noch daran erinnern,
ich saß mal in so einem Talk von dir,
da war ich immer noch ein absoluter Anfänger
weil ich habe nichts verstanden von dem, was du da erzählst.
Irgendwas funktionierte da, aber dann irgendwie, ja,
okay, warum machen wir das jetzt? Keine Ahnung.
Und ja, also die zweite Sache, warum man es macht,
wenn wir mal dabei bleiben, ist,
dass man auch wirklich was über die Programmiersprache lernt
oder über das Programmieren im Allgemeinen,
weil man eben auch darüber nachdenkt,
gewisse Probleme mit ganz neuen Algorithmen zu lösen,
zum Beispiel rekursive Algorithmen
statt irgendwelchen Schleifen oder, oder, oder.
Und ja, das macht einfach sehr viel Spaß,
wenn man das ab und zu macht und man lernt auch viel.
Da gibt es auch so Wettbewerbe oder sowas, ne?
Ist das so richtig mit 18 Löchern oder wie spielt man das?
Ne, also es gibt natürlich Webseiten,
wo man dann seine Lösung veröffentlichen kann und dann sagen,
okay, ich habe das jetzt kürzer gelöst als alle anderen
oder zumindest kürzer in dieser Programmiersprache gelöst
als alle anderen.
Hast du da eine Shownote für uns, für eine Webseite?
Es gibt eine Stack-Exchange-Seite zum Thema CodeGolf.
Das ist auch die, wo ich hauptsächlich aktiv bin oder war.
Ja.
Es gibt andere Seiten, aber da muss ich ehrlich gesagt sagen,
weiß ich gar nicht so viel drüber.
Okay.
Und
jetzt schau doch mal mit Stecken-Change vorbei für
Kotgolfen. Ja, wie gesagt, ich packe
den Link dann einfach dazu. Und was sind
so deine, hast du vielleicht Lieblingsaufgaben
oder so, oder was besonders
irgendwie interessante, einen interessanten
Lösungsweg hatte? Also, ja, also
interessante Lösungswege,
ja gut, ich bin,
komme aus der Physik-Mathematik-Ecke, also kann man,
finde ich immer froh, wenn ich Sachen mit
komplexen Zahlen oder so lösen kann.
Also klassisch sind irgendwelche
Aufgaben, wie irgendein Objekt bewegt sich in irgendeinem Raum oder irgendein Robot oder was auch immer und man muss den steuern und das kann man natürlich machen, indem man zweidimensionale Koordinaten speichert. Das ist in der Regel aber kürzer, wenn man das Ganze in komplexen Zahlen löst und ja, da gibt es dann einige Aufgaben, wo man das sehr lustig lösen kann und am Ende natürlich überhaupt nicht mehr, wenn man nicht eingeweiht ist, versteht, was da eigentlich passiert.
und
ja, also ansonsten
ich kann, keine Ahnung, ich glaube das Interessanteste
was man jetzt so auf dem
diesem Medium überhaupt kommunizieren kann
sind dann vielleicht so ein paar Tricks
die man nutzen kann
also ein klassisches Beispiel
ist natürlich, wenn ich irgendwas habe, muss ich irgendwas in einer
Schleife lösen, das kann man natürlich auch so machen
häufig ist es dann aber so, dass diese Schleife
vielleicht nicht so
spannend ist, also dass da jetzt nicht so viele
komplizierte Dinge passieren und dann könnte es
zum Beispiel einfacher sein
den Befehl, den man in der Schleife ausführt,
in einen String zu packen,
diesen String zu multiplizieren,
also mit Semikola getrennt, mal
fünf oder so, weil ich das fünfmal ausführen möchte
und dann ein Exek darüber zu jagen.
Also genau,
die ersten
Jochen
hingen sich schon die Fußnägel hoch
und ja,
das ist dann, genau solche Sachen
passieren dann andauernd, dass man irgendwie
feststellt, wie wenig Leerzeichen man
eigentlichen Python braucht, wenn man denn
unbedingt möchte. Also es gibt so Späßchen,
dass man, wenn man
hinter irgendwo
eine Klammer aufhört oder dahinter kommt ein
Keyword oder so, dann kann man die einfach direkt
aneinander schreiben
oder zahlen oder
eigentlich irgendwas. Ich glaube, das ist der einzige Unterschied. Man muss immer aufpassen,
wenn es mit e anfängt, weil das könnte ja 1
e 8 wäre dann 10 hoch 8.
Das darf man dann nicht machen, aber alles andere kann man
einfach wild aneinander klatschen
in vielen Fällen und es wird richtig interpretiert.
Dann gibt es, ich glaube in Python 3 funktioniert das nicht mehr, in Python 2 funktioniert das noch, dass man verschiedene Eindrückungsebenen mit Tab und Leerzeichen hat. Also die erste Eindrückungsebene wäre ein Leerzeichen, die zweite Eindrückungsebene war ein Tab und dann kam irgendwie ein Tab und ein Leerzeichen als Eindrückung und so weiter. Aber gut, wenn man dreimal einrücken muss, dann ist es in der Regel kein CodeGolf mehr.
Ja, genau. Muss man denn überhaupt einrücken?
Ich meine, es gibt doch Semikolon, das ist doch auch gut.
Man muss es manchmal schon machen.
Also manchmal ist es schon das Beste,
aber zwei Einrückungsebenen sind schon sehr,
das sind dann schon, wie ich ausgefallen habe, Programme.
Da kann man dann schon die ganze Fakultät mit abwenden.
Und ich meine jetzt nicht das mathematische Problem,
sondern das, was man in der Uni dann so besucht.
Ja, okay.
Und das heißt, du machst dann sowieso nur ein Name.
Also lesen kann man das dann wahrscheinlich nicht mehr?
Sondern es geht tatsächlich darum, in wie viel Byte
passt denn dann so ein Algorithmus? Genau, also
lesen ist die eine Sache, die man nicht mehr kann. Manchmal
hört das auch gar nicht auf. Also auch so die
klassischen Ansätze für viele Sachen sind, dass man
jetzt sagen kann, okay, ich kann jetzt
meine Daten,
ich kann jetzt einen interessanten
Algorithmus entwickeln, der die richtige
Lösung für irgendwas findet.
Ich kann aber auch,
jetzt weiß ich gar nicht, ob es Bogosort oder Stupid Sort
oder, ja, ist auch egal, es gibt diesen klassischen
Sortieralgorithmus. Ich
nehme meine Daten, ich mische sie,
ich gucke, ob sie sortiert sind, wenn nicht, wische ich sie nochmal.
Ja, ja, ja. Solche Ansätze
und, ja, wenn
dann die Aufgabe nicht vorgibt, dass man das
Ganze in einer endlichen Zeit lösen möchte, geht
das natürlich.
Das ist auch immer eine, ja,
ein Lieblingsansatz, dass man sagt, okay,
wir versuchen das jetzt schön
in Brute Force
zu lösen, statt, weil
an der gewissen Wahrscheinlichkeit ist
das dann sofort fertig.
Ja, ich habe letztens auch
irgendwo neun, es gibt ja diverse
lustige Sortierverfahren. Ich habe
letztens eins gesehen, das fand ich auch wieder sehr cool.
Sehr schön. Das besteht einfach
darin, ich glaube, das nennt sich irgendwie Sleepsort.
Und wenn man halt
Zahlen hat, dann macht man das mit
Async
Await-Notation.
Man awaitet einfach die Zahl.
das ist dann halt sortiert, weil
naja, je größer die Zahl, desto länger
wartet man halt.
Das ist auch
sehr, sehr cool.
Mein Lieblings-Sortiere-Algorithmus ist der LSD-Radix.
Das ist so schön.
Der hört sich auch besonders toll an, wenn man den so visualisiert.
Äh, audifiziliert, wie nennt man das?
Wenn man so einen Algorithmus...
Es gibt ja so einen...
Vertont.
Ja, ja, ja, wahrscheinlich.
Vertont.
Gut.
Ja, wir vertonen für euch ja wieder heute eine neue Folge.
Ja, jetzt habe ich keine Ahnung, was LSD-Radix macht, aber gut.
Der baut so Buckets auf und sortiert dann die ganzen Sachen immer in so Buckets rein
und gibt die dann immer wieder auseinander.
Okay.
Ja, also von 0 bis 1.9 oder sowas.
Und dann kippt er die auseinander.
Und dann funktioniert das für mich ganz gut.
Eine Sache, die mir jetzt noch gerade eingefallen ist,
man muss sagen, wir warten auf die Eingabe und wie lange es dauert.
Also auf CodeGolf StackExchange gab es dann auch zwischendrin mal
so eine Kategorie von Fragen,
die haben wir uns auch ganz schnell ausgedruckt und abgeschafft.
Wir versuchen jetzt mal eine Programmieraufgabe
möglichst schlecht zu lösen.
Also nicht schnell oder kurz oder was auch immer,
sondern einfach schlecht.
Und dann die Aufgabe, einen Zufallszahlengenerator zu bauen.
Und ja, meine Lösung war dann, wir nehmen, wir speichern einfach mal irgendwo ein Bit ab, lassen einen Zähler hochlaufen und überprüfen nach jeder Zahl, ob das Bit sich eventuell geändert hat.
Und wenn sich das Bit ändert, durch Höhenstrahlung oder was auch immer, dann nehmen wir die Zeit und dann haben wir unsere Zufallszahl.
Das erinnert mich so ein bisschen an deinen Wartsortier-Algorithmus.
Ja, das klingt gut.
in einer besonders chaotischen Umgebung könnte das
relativ schnell passieren.
Wie ist das eigentlich bei so
Code-Golf-Community? Macht die nur
Code-Golf? Es gibt ja noch so andere lustige
Programmier, weiß ich nicht,
ich soll mal sagen, so, ja,
Knubelecken. Ja, also die machen
auch andere Sachen. So Quines zum Beispiel
oder Programme, die sich selbst
ausgeben. Oder auch Code-Golf mit Einschränkungen.
Also man kann natürlich immer Code-Golf machen, aber
auch so lustige Sachen war es noch eine Aufgabe.
Multipliziere jetzt mal bitte zwei
Zahlen, aber verwende im ganzen Code keine
einzige Zahl.
Dann muss man
erstmal die Zahlen irgendwie in römische Zahlen darstellen,
also so i, i, i, i, i, ja, ist dann halt
5 und dann kann man da
auf Basis, basiert natürlich multiplizieren und
am Ende kommt dann halt wieder eine Zahl raus.
Man muss halt irgendwie auch gucken, wie
man das mit der Darstellung macht, dass man das dann
regelkonform macht, aber
i, i, i, i, i, i ist 5,
i, i, i, i.
Ja, römische Ziffern, Rechner mit
römischen Ziffern, sehr, sehr böse.
Ja, ja, x, x, x.
Ich habe irgendwann mal auch, glaube ich,
im Blogpost dazu gesehen, wie jemand irgendwie mit römischen
Ziffern schriftlich dividiert hat und das war echt so.
Also, sagen wir mal so,
es ist nicht so unmittelbar einleuchten,
wie das funktioniert.
Ja.
Aber, ja.
Ja, so Kotkolben
ist im Prinzip so eine Absatzionsebene, um
mit der Sprache Schabernack zu treiben, also um
die Komplexität von Algorithmen zu ergründen
und um vielleicht so ein bisschen die Geschwindigkeit
da so rauszuholen und vielleicht auch sowas
Ja, oder auch die gerade, also sich einfach so Gedanken zu machen, also sowas wie SlowSort oder SleepSort oder was auch immer sind ja Sachen, die einfach existieren, dass man sich, dass man überhaupt erstmal sieht, wie gut man es hat und wenn so echten Sortieralgorithmen und auch einfach das Konzept eines Algorithmus besser versteht und ja, also man, genau, man, es ist natürlich einfach, ja, also wie du schon sagst, man beschäftigt sich mit den Dingen und es ist einfach eine Möglichkeit, sich selbst dazu zu treiben, sich mit den Dingen zu beschäftigen und ja, man lernt einiges über Algorithmen und ähnlichem.
Ich habe tatsächlich einen Algorithmus, den ich
begegnet bin, auch tatsächlich später eingesetzt
in echter wissenschaftlicher Arbeit
und war dann sehr froh, dass ich
ihn kannte, weil
ja, also man
Ja,
du hast das Thema tatsächlich direkt fast
schon wieder mit aufgemacht und ich glaube, es ist Zeit für den nächsten
Chapter, Marc. Wenn du das sagst,
du hast ihn jetzt scientific in der wissenschaftlichen Arbeit
eingesetzt. Was ist denn jetzt
Scientific Python? Also das ist nicht SciPy
oder was du eben gesagt hast, sondern
was bedeutet das und warum
macht man das, was macht man da und warum
ist das so nett oder doch nicht?
Also erstmal natürlich als Wissenschaftler
hat man in der Regel, oder nicht in der Regel,
also viele Wissenschaftler müssen
programmieren, zwangsläufig, weil
sie sichern, simulieren oder Daten
analysieren in großen Mengen und
das nicht per Hand machen möchten, aus gutem Grund.
Also quantitative Analyse und
keine qualitative Analyse, würdest du jetzt sagen,
ist die wahre Kunst der Wissenschaft?
Ja, also
ich glaube, gibt es so richtig
qualitative, rein
qualitative Arbeit gibt es
zumindest in meinem Bereich kaum.
Ich kenne noch die alte
Philosophische Fakultät an meiner Universität.
Die hat sich durchaus damit hervorgetan.
Ja, ja gut, aber das ist
ja auch nicht mein Bereich.
Also klar, es gibt natürlich
Bereiche, in denen das
gibt und es auch sinnvoll ist und schön und gut, aber
also ich habe, ich glaube
nicht, dass ich jemals hier irgendwas
beruflich begegnet bin, das
rein qualitativ war. Okay, also ein
ZDF, Scientific Price, also Zahlen, Daten, Fakten.
Ja.
Es geht nicht nur darum, Zahlen auseinanderzunehmen.
Manchmal geht es auch um Zahlen zu produzieren
oder irgendwie einfach etwas,
was man mathematisch, theoretisch zumindest,
theoretisch aber, beweisen könnte oder verstehen könnte,
aber zu kompliziert ist,
dass man es mathematisch zerdröseln kann,
zu simulieren und dann auf die Weise zu verstehen.
Also viele Sachen, die ich gemacht habe,
würde ich als Experimentalmathematik bezeichnen.
Also ich stelle experimentell mathematische Aussagen fest.
Ja, und dazu muss man natürlich programmieren
und das macht man natürlich gerne in Python,
also zumindest ich, anderen natürlich nicht.
Das muss man so ein bisschen Überzeugungsarbeit leisten,
weil es zum einen häufig nicht um Geschwindigkeit geht,
sondern eben darum geht, die Sachen möglichst schnell
und anschaulich zu programmieren und zu verstehen,
was man eigentlich tut.
Zum anderen natürlich, manchmal geht es auch um Geschwindigkeit und da sind viele, viele Aufgaben, die man hat mit solchen Tools wie NumPy lösbar, die die entscheidenden Sachen, die dann wirklich schnell laufen müssen, in einer hartgecodeten, schnell laufenden Variante machen. In einigen Fällen gibt es da nicht und das war dann auch bei mir der Grund, warum ich so eine Sache dann selbst geschrieben habe, um nochmal irgendwie so eine Überleitung in den Raum zu einem gewissen Thema zu schmeißen.
Ja, ja, ich wollte gerade noch auf die experimentale Mathematik, also ich weiß nicht genau, ob ich das jetzt irgendwie falsch assoziiere, wenn ich, experimentelle Mathematik fand ich auch immer sehr interessant, weil ich fand, das war immer so eines der besten Argumente dafür, dass Mathematik unabhängig davon existiert, also nicht wirklich erfunden wird von demjenigen, der sie betreibt, sondern eher so auch entdeckt wird, dass man da halt, also wenn man jetzt einen Computer losrennen lässt und der würfelt halt so lange Gleichungen durcheinander, also bis er halt einen Pfad gefunden hat von dem, was man,
irgendwie zeigen möchte
zu irgendwie einfachen Sachen, die schon
bewiesen sind, also das
kenne ich jedenfalls, oder habe ich mal gehört, dass
Leute so experimentelle Mathematik
nennen, also man
sucht halt einfach quasi
in dem Baum
aller, oder in dem Graphen aller Umformungen,
die man halt irgendwie machen kann, halt
nach einem Pfad von Sachen, die man schon
bewiesen hat, zu einer Geschichte, die man halt beweisen
möchte oder so, dann sieht es halt dann doch eher so aus,
als ob man das entdeckt, halt
wie mit einem Mikroskop oder so und nicht so sehr
irgendwie konstruiert.
Aber...
Das fällt dann unter Computerbeweise.
Das ist manchmal das, was ich jetzt...
Also das ist wahrscheinlich
auch nicht unzutreffend. Der Begriff
Experimentalmathematik ist nicht
kopiergeschützt oder
getrademarkt von irgendwem, der sagt, das ist jetzt genau
das.
Die Sachen, die ich mache, sind da schon
gemacht habe oder auch noch mache, sind auch schon anders.
Da geht es dann eben um die Frage,
wie verhält sich jetzt
dieses Modell, wenn ich das lange
laufen lasse und dann hat man eben
also so klassische Beispiele für
wie Modelle, die meisten
Modelle, Aufstellung oder die
kann man als Gleichung formulieren, das ist eine
Differenzialgleichung in der Regel oder
ähnliche Sachen, also für die Leute, denen es was sagt, man hat
eine Gleichung und die Lösung ist
dann, wie verhält sich mein
Objekt, mein System
über die Zeit. Das wäre die Lösung für meine
Gleichung. Und diese Lösung
kann man in aller Regel nicht
mit Stift und Papier finden, so wie was
Leute normalerweise tun. Also man kann es schon
machen, aber... Dauert dann ein bisschen.
Also auch das ist dann nur eine Annäherung.
Man braucht die richtige Intuition für die Bewegung
der Funktion. Nee, also das
in Zeitfall geht es wirklich nicht.
Wir haben zumindest seit 100 Jahren
keinen Weg gefunden, das zu machen. Man kann eben
höchstens eine näherungsweise Lösung machen und auch das will man nicht
mit Stift und Papier machen. Das ist dann sehr automatisiert.
Das macht man dann mit dem Computer und natürlich
dann wieder mit Programmierung.
Und ja, dann kann
man eben herausfinden, okay, wenn ich diese Sachen
habe, dann verhält sich
dieses System so und so.
Ich kriege so eine Lösung raus, das ist
ein klassisches Beispiel, das ist chaotisch.
Und das ist meine Aussage. Und die habe ich dann
experimentell gefunden,
in gewissem Maße, über Simulationen.
Und diese Aussage ist auch nicht
so in Stein gemeißelt, wie es
normale mathematische Aussagen sind, sondern
das kann immer noch schiefgegangen sein, weil
ich gerade ganz komisch
meinen
Programmlauf in der Sache habe, mit genau den falschen
Startbedingungen oder was auch immer und mein Algorithmus.
Ja, weil man in irgendwelche numerischen
Geschichteninstabilitäten gelaufen ist
oder weil...
Also gut, das kann man sogar noch lösen,
aber weil man einfach
ganz, ganz viel
Pech hatte zum Beispiel. Natürlich, also
die meisten Aussagen, wenn man sagt, das ist jetzt
Chaos, sind schon
sehr, sehr hieb- und stichfest, aber
es ist kein formeller Beweis, wie
Mathematiker ihn führen.
In den meisten Fällen. Natürlich gibt es dann auch die Leute,
die sich hingesetzt haben und das mal für einen Fall wirklich
bewiesen haben.
Das war dann auch eine Sensation oder so, hat auch ein paar Jahre gedauert, aber das ist nichts, was man praktisch machen kann und das war auch dann nur für die einfachsten Systeme, die man schon vorher sehr gut verstanden hat.
Ich habe jetzt diesen ganzen Absatzionslayer
noch nicht so ganz begriffen.
Also man hat jetzt ganz komplexe, große, komplizierte Systeme.
Und wenn ich mir das jetzt irgendwie vorstelle,
du sagst irgendwas von Chaos,
du sagst sowas über Zeitstrahlen und Funktionen,
die da irgendwie durchläuft,
da denke ich irgendwie immer an sowas wie eine Häufigkeitsverteilung
oder sowas, was da irgendwie rauskommt.
Was hat das, also wie kann ich das so real beschreiben,
wenn ich jetzt irgendwie jetzt Mikrobialen ...
Machen wir mal ein Beispiel.
Also ich habe, genau, ich habe Bakterien zum Beispiel.
Also ja, ich mache mal ein bakterielles Ökosystem.
also ich habe meinen Topf,
da schmeiße ich, da habe ich Nährstoffe drin, das heißt
Bakterien können da leben und da schmeiße ich
jetzt, was weiß ich was,
fünf Escherichia coli
oder zehn Pneumokokken
oder was auch immer mir einfällt rein.
Irgendwelches ungesunde Zeug, genau.
Haben wir aber übrigens überall
nebenbei, also wir tragen mehrere
Kilo Bakterien mit uns im Darm rum.
Und noch dreimal Karies.
Ich weiß gar nicht, ob das ein Bakterium ist,
oder was das ist.
Pulbactus? Ich habe keine Ahnung.
Das sah einmal beim Zahnarzt früher so aus.
Da gab es dann diese Psyche.
Die liefen dann irgendwelche Dinge.
Die sahen so aus, wie ich mir Bakterien vorstelle.
Genau. Also die laufen dann auf jeden Fall
da rum und
jetzt kann ich natürlich das einfach
hinstellen und warten und gucken, aber
das kann ich nur begrenzt
häufig machen, da das Zeit kostet und ich
kann auch, habe dann Messfehler
und Rauschen und so weiter und so fort. Aber ich möchte
das eventuell einfach mal allgemein verstehen.
Wie entwickeln sich solche Bakterienpopulationen?
Hört sich jetzt doof an, also du hast es gerade gesagt, es gibt irgendwie so Sachen im Darm, das heißt ihr macht dann so einen Auszug und stellt das in so ein Glas auf den Balkon in die Hitze und guckt, was da so passiert.
Ja, das wäre so die Karikatur des Ganzen, aber es ist gar nicht so falsch, also viel ist wirklich, wir haben einen Topf Flüssigkeit, da sind Nährstoffe drin, da schieben wir ein paar Bakterien rein, das rühren wir dauerhaft um und dann gucken wir mal, was passiert.
Also das ist schon sehr, sehr häufig.
Und danach macht ihr irgendeine Analyse mit,
ich weiß nicht, ihr kippt das Ganze auf Papier,
kommt euch die Farbe an oder zählt irgendwas mit irgendwelchen Sensoren
und packt das in eine Datenbank
und daraus schmeißt ihr dann einen Algorithmus.
Nein, das wäre das, was wir eigentlich modellieren wollen.
Also das ist unser reales System.
Da wissen wir, was passiert, da können wir das messen.
Das Problem ist, das hat natürlich diverse Nachteile.
Wie gesagt, wir können nicht alles messen.
Das ist nur ein Glas und nicht eine echte Haut oder sowas.
Ja, das ist der andere Nachteil.
Aber der Nachteil ist,
wir müssen eben wirklich dieses Glas auf die Fensterbank stellen.
Und im Computer können wir das eventuell in einer halben Sekunde einfach mal durchrechnen und dann können wir das noch schnell 10.000 Mal machen und besser verstehen.
Virtuelle Bakteriengläser, schön.
Genau.
Das heißt, wir haben die ganzen Bugs hergekommen.
Ja, genau. Deswegen, ich bastle virtuelle Bakteriengläser und diese virtuellen Bakteriengläser werden dann beschrieben durch Gleichung.
die zum Beispiel bei Differenzialgleichen
wäre die Frage, okay, ich habe jetzt meine Bakterien,
mein Zustand, mein Zustand ist dann
fünf von der Sorte, sechs von der Sorte, sieben von der Sorte,
so viele Nährstoffe und so weiter und so fort.
Und die Frage ist, wenn ich jetzt eine Sekunde
in die Zukunft gehe, wie sieht mein Zustand aus?
Vermehren sich einige von diesen Bakterien, werden
einige Nährstoffe gefressen und so weiter? Das kann ich
dann machen oder
ausrechnen und dann mache ich das noch mal
und noch mal und noch mal und noch mal und
die Frage, wie man das richtig macht, ist
ja, da haben sich Menschen schon
hundert Jahre lang mit beschäftigt und
gute Wege herausgefunden, das zu machen
und die kann man dann natürlich auch implementieren und das nutzen.
Also die haben quasi das Rezept, den Algorithmus
schon entwickelt und den wird dann
in Python irgendwie übertragen, auf das Modell
angewandt und dann gibt es eine zufällige
Verteilung, die rauskommt. Oder hast du dann immer konkrete
Ergebnisse? Das könnte zum Beispiel
rauskommen, okay, diese Population stirbt
aus und diese Population geht
auf genau diesen Wert und bleibt da.
Und du hast eine Zeit, in der das passiert ist. Und ich habe die Zeit,
in der das passiert ist. Ja, das ist in vielen Fällen
gar nicht mal so das Interessante, aber es ist auch
interessant. Die andere
Sache, die halt rauskommen kann, ist zum Beispiel, okay, es geht
nicht einfach auf irgendeinen festen Wert, sondern es
oszilliert wild rum, zum Beispiel
chaotisch.
Und dann
können wir eben das feststellen, okay, es
oszilliert rum. Das ist eine
Antwort. Oder es ist was anderes, als wenn es
konstant bleiben würde.
Und ja,
wir können uns dann die Frage stellen, okay,
unter welchen Bedingungen oszilliert es rum? Welch viele
Bakterien, Spezies überleben?
Unter welchen Bedingungen? Wovon hängt
das ab? Wie beeinflussen die Bakterien,
Spezies einander? Und
ja, wie verhalten sich eben solche
Systeme im Allgemeinen?
So ein geschlossener Game-of-Life-Kreislauf.
Ja, und ein bisschen realistischer.
Aber ja, Game-of-Life ist auch durch.
Echte zelluläre Automaten.
Ja, nur dass wir halt nicht mehr, ja, also zelluläre
Automaten sind halt ein Typ von Simulation,
Differenzialgleichungen sind ein anderer Typ, dann können wir noch
ja, diverse andere
Typen durchsprechen,
wie wir es lösen können, aber ja.
Und dann kann ich
am Ende sagen, ich weiß, wenn ich
Bakterien so und so zusammen packe,
dann passiert wahrscheinlich sowas.
Das ist das Fernziel dieser
ganzen Forschung, dass man eben
besser versteht, wie sich solche Systeme
entwickeln und dann natürlich auch die Frage, wie reagieren
sie auf Aumwelteinflüsse. Eine häufige Frage ist
zum Beispiel Antibiotika. Ich habe
ein klassischer Fall, wo wir
kein Ökosystem haben im Körper. Was die Ausnahme
ist, ist die Blase. Das ist
normalerweise bakterienfrei,
soweit man das bisher weiß. Steril.
Steril, ja, genau.
Aber wenn da was reinkommt,
hat man ein Problem. Und manchmal kommen da mehrere
Dinge rein und dann ist die Frage, begünstigen die einander?
Bekämpfen die einander?
Sind da verschiedene Bakterien,
die Fressfeinde oder was auch immer sind?
Fressfeinde hat sich toll angefragt.
Befressfeind ist in dem Fall das falsche Wort eigentlich.
Also die ungleichen Nährstoffe konkurrieren.
Und die Frage ist jetzt,
wenn ich ein Antibiotikum dazu kippe, was passiert?
Kann ich natürlich wieder im Reagenzglas austesten.
Dauert dann genauso lange wie im echten Menschen.
Ist ein Problem.
Also ein Fernseher der Anwendung wäre zum Beispiel,
dass man eben eine Probe hat,
feststellt, welche Spezies sind da drin,
wie verhalten die sich und dann direkt simuliert,
welches Antibiotikum muss ich geben
oder in welchem Takt, mit welchen Bedingungen,
damit ich diese Handwerksinfektion
möglichst effektiv wegkriege.
Also das heißt, ihr könnt tatsächlich auch sowas, chemische Verbindungen
tatsächlich simulieren, da reinschießen und dann
sagen, hey, vielleicht kommt da was raus. Also wir simulieren
nicht die chemische Verbindung in dem Sinne,
sondern wir wissen halt, dass das
Antibiotikum hat die Auswirkungen auf das
Bakterium, ganz grob.
Aber auch das ist alles nur das
Fernsehen. Also wir sind eben, solche
Ökosysteme zum Beispiel zu simulieren ist
verdammt schwierig.
Hört sich sehr nützlich an. Also mal so.
Ja, deswegen versuchen wir es ja auch. Und deswegen gibt es
hoffentlich Leute, die uns dafür bezahlen, das zu machen.
Ja, und das ist so eine...
Hier wieder die große Sponsorenaufrufe.
Naja, aber ich meine, das klingt halt schon so ein bisschen
danach, wie man hat irgendwo einen umgekippten Weiher
und dann geht man da halt mit drei Gläsern
unterschiedliche Bakteriensocken hin, schüttet das da rein, wartet zwei Tage
und dann hat man eine Blümchenwiese da. Oder so, das wäre schon gut.
Ja, das wäre schon nicht schlecht.
Wenn man das ausfinden könnte, wie das geht.
Und das geht alles mit Python, das ist ja wie das
sollte, also mit der schönen Schlange und der Abenteuer.
Naja.
Also, und wie?
Genau, also
Also entweder sagt man, ich habe eine Simulation und Zeit stört mich nicht, also Laufzeit, das kann schon mal sehr häufig passieren, dann kann man es einfach wirklich rein in Python simulieren in vielen Fällen.
Ich habe auch Simulationswerkzeuge mal gebaut aus so Nebenkriegsschauplätzen, die wirklich rein in Python laufen und auch da einigermaßen effizient sind noch.
Ein Hauptproblem mit vielen komplexen Simulationen und jetzt mache ich jetzt wieder eine eigensinnige Überleitung zu dem, was ich wirklich gemacht habe.
ist, dass es
nicht so einfach und schnell
in Python geht und dass es insbesondere auch nicht
so schnell und einfach mit NumPy geht, weil es nicht
vektorisierbar ist. Jetzt muss ich wahrscheinlich kurz
erklären, was vektorisierbar heißt.
Das heißt, ich habe, ein klassisches
Beispiel ist, ich addiere zwei
Vektoren. Ich habe
ein großes Array mit Zahlen
oder Liste oder was auch immer man sich vorstellen möchte. Ich habe
eine andere, genauso lange Liste mit Zahlen.
Wenn ich jetzt sage, addiere bitte mal
die ersten beiden Elemente von jeder
Liste und füge das als erstes
neues Element in eine neue Liste und dann macht das
mit dem zweiten Element und so weiter und so fort,
dann ist das eine vektorisierbare Option,
Operation. Ich glaube, das hat
niemand verstanden, der nicht wusste, was vorher eine Vektor-Operation
ist. Verdammt.
Wenn du zwei Vektoren addierst, dann machst du
irgendwie sowas, du erklärst irgendwie
den Weg, den du per Luftlinie kennst
und dem erzählst du, ja, musst du links,
dann musst du rechts und dann kommst du irgendwann...
Das ist nicht so sehr das, was es tut, sondern die Art, wie es passiert.
Also es ist immer das Gleiche.
Also das auch gleich für viele Sachen
ist das so, Moment, jetzt muss ich es gerade
richtig hinkriegen.
Multiple Data,
Multiple Input, Single
Operation, Single
Operation, Multiple Data.
Also ich mache... Single Input,
7D, irgendwas. Genau, also
das Konzept ist auf jeden Fall
klar. Der Begriff ist nicht der
übliche wahrscheinlich, aber
alle, die es kennen, wissen, worum es geht.
Also ich habe einen Datensatz
und ich mache damit
5000 Mal das Gleiche.
wenn ich jetzt 5000 Elemente in meinem Datensatz habe.
Oder der Datensatz
wäre halt ein Array.
Das ist ein Problem, was in vielen, vielen
Simulationen auftaucht und das ist auch alles schön und gut.
Und das kann man
dann natürlich effizient mit solchen Sachen wie
NumPy gut lösen. Also nicht 100%
effizient, aber schon sehr nah dran.
Da ich dann eben,
wenn ich mit NumPy zwei Arrays addiere,
funktioniert es eben so, dass
der sagt, okay, ich erkenne, das ist jetzt eine Addition
und dann geht er jetzt nicht für jedes einzelne Element
dieses Arrays hin oder diese paarweisen
Arrays und
überlegt sich, oh, guck mal, was ist das
für ein Objekt? Ist das eine Zahl?
Aha, eine Zahl kann ich jetzt multiplizieren
mit einer Zahl. Was passiert denn da? Ah, da kommt wieder
eine Zahl raus. Und unter der Haube
findet dann die tatsächliche Multiplikation statt.
Das ist ja das, was im normalen Python passieren würde.
Sondern
der sagt, okay, ah, das ist ein Array.
Das ist aus Zahlen. Das ist noch ein Array aus Zahlen.
Und jetzt gehe ich mal
unter der Haube hin, lasse eine effiziente
Schleife da durchlaufen, die in C oder was
auch immer geschrieben ist, multipliziert die
alle elementweise miteinander oder addiert sie
elementweise miteinander und da kriege ich das Ergebnis.
Und das ist schnell. Und
wenn ich jetzt mein Problem ausschließlich
aus solchen Operationen beschreiben kann,
dann kann ich das auch
schnell mit NumPy und Python
lösen, ohne dass ich da irgendwie selbst
in C programmieren muss oder so.
Ja, ich glaube, also
ich weiß jetzt auch nicht, ob ich mich da ganz
komplett korrekt dran erinnere, aber ich meine,
ich glaube, der Witz bei dem Vektorisieren ist eigentlich, dass man
man hat ja mehrere Register irgendwie
und dann kann man das halt sozusagen in gewisser Weise
parallelisieren,
diese Addition oder Multiplikation von
Arrays, indem man das halt in
so viele Teile zeigt und das dann halt alles irgendwie gleichzeitig
macht. Oder diese Dinger sind irgendwie
oder man kann mehrere Dinger in einen Register packen.
Ja, das ist noch ein
Vorteil bei Grafikkarten und irgendwie könnte ich das dann
tatsächlich parallelisieren. Stimmt.
Also gerade dieses Rechnen auf
Grafikkarten, wenn man das immer, was man
immer wieder hört, das ist genau solche Sachen,
wo man eben mehrfach die gleiche Operation rechnet.
Aber das ist auch schon eine Sache,
die, wenn ich jetzt mit reinem Python arbeiten möchte
oder nicht irgendwas Neues programmieren möchte in Python,
mir mein Leben deutlich einfacher mache,
wenn ich sowas benutze wie NumPy.
Denn das Hauptkonzept von NumPy ist eigentlich,
wir haben vektorisierbare Operationen
und stellen sie dem Python-Nutzer zur Verfügung,
ohne dass der sich darüber kümmern muss.
Also wir stellen sie zur Verfügung,
wir stellen sie in effizienter Form zur Verfügung,
ohne dass der Nutzer sich darum kümmern muss,
da irgendwie in C, Fortran oder
was auch immer von niedrigeren Sprachen das
zu machen.
Ja, ich glaube
auch, ich habe mal gehört, dass das halt irgendwie der
Grund ist, warum Fortran immer noch so eine große Rolle
spielt, weil bei
Fortran diese Geschichten halt
die Schleifen, glaube ich, auch automatisch
vektorisierbar sind, bei C halt nicht. Und das ist halt
ein Problem, also man muss es dem Compiler halt sagen,
weil man da so Seiteneffekte
haben kann, dass das Ergebnis
der, eine Addition von
zum Beispiel zwei Vektoren kann halt wieder
irgendwie Einfluss nehmen auf was davor
und es ist halt
ja, sozusagen nicht garantiert,
dass man das halt
vektorisieren kann oder dass man es irgendwie parallelisieren kann,
sondern es kann halt an einem
die Programmlogik kaputt machen, wenn man das halt nicht
weiß, dass das geht und in Vortragen geht das
halt nur so und daher, aber ja, keine Ahnung.
Also mittlerweile stimmt das glaube ich nicht mehr,
oder nicht mittlerweile, ich glaube seit 15,
20 Jahren. Oh, das kann sein.
Gibt es in C das... Man kann dem
Compiler sagen. Restrict Keyword?
Ich hoffe, ich mache es jetzt richtig.
muss ich wahrscheinlich schämen, dass ich das nicht kenne, was eben genau
das sagt, okay, also das klassische Problem
ist ja, wenn ich
oder um das, was du vorhin beschrieben hast, nochmal
in anderen Worten zu beschreiben, dass
der Compiler nicht weiß, wenn ich
A und B addiere,
dass eventuell
das B, was ich da addiere, vorher
schon in einem vorigen Durchlauf
anders beschrieben wurde, an einem vorigen
Element der eigentlichen Schleife, also ich habe irgendwie
mein, nehmen wir wieder Vektoren,
es könnte sein, dass ich die erste Komponente zur ersten Komponente addiere
und dann kriege ich eine Komponente raus. Es könnte aber sein, dass ich das
in die zweite Komponente des Vektors
schreibe und das auch tatsächlich möchte, warum auch immer.
Wenn ich C programmieren möchte, ist das anscheinend.
Und
der Compiler geht davon aus, dass er das nicht weiß und
dass er sich das möchte und deswegen optimiert er es nicht weg.
Wenn ich jetzt aber sage,
dieses Array ist restricted oder
restrict, dann
passiert das nicht.
Also man kann das mittlerweile in C lösen.
Ja, genau, natürlich.
Aber das ist auch wieder eine Wissenschaft für
sich, wie man das dann genau
was man alles optimieren kann und wenn man es richtig schnell
haben will, dann muss man sowieso ein Assembly schreiben
und
immer mit GoTo-Schleifen immer hin und her springen.
Ja, aber
Assembly doch.
Nee, Assembly ist glaube ich noch schlimmer,
da gibt es keine GoTo-Schleife, da gibt es
Ja, da springst du zur Adresse oder sowas.
Genau.
Ja.
Also auf jeden Fall,
das ist ein,
Ja, also auf die Weise kann man dann Python in vielen Sachen
nutzen und jetzt
wieder gesagt, die schamlose Überleitung, nächster Versuch
zu meinen eigentlichen Sachen, die ich gemacht
habe.
Oder zu Sachen, die ich selbst gemacht habe, ist, dass
es in vielen solchen Simulationssachen
das Problem ist,
dass man es eben nicht vektorisierbar
machen kann. Also, was
in meiner vorigen Arbeit
sehr häufig aufgetaucht ist, ist zum Beispiel, dass
wir uns komplizierte Netzwerke von
man kann sich jetzt Neuronen vorstellen
angeguckt haben, die irgendwie miteinander
verknüpft sind und dann
hat man das Problem, dass die Verbindungen
zwischen diesen Knoten zufällig sind und dann
ab dem Punkt kann ich es nicht mehr sinnvoll vektorisieren.
Oder man kann sich
auch vorstellen, man hat komplexe
metabolische Modelle, wie irgendwelche
Spezies irgendwelche Stoffe in
andere Stoffe überführen und so weiter und das ist
eben auch komplex und
nicht vektorisierbar in vielen Fällen und das
muss man dann,
möchte man natürlich auch irgendwie effizient
haben und das Interessante ist, nebenbei
ist auch
viele Leute haben sich vorher immer
die vektorisierbaren Fälle angeguckt,
weil sie ja so schön einfach anzugucken
sind, weil man sie ja schön einfach
programmieren kann und viele
Phänomene zeigen sich eben erst, wenn es nicht vektorisierbar
ist oder wenn eben diese interessanten Fälle passieren
und da habe ich dann eine Software
geschrieben, die gerade das
für den Nutzer macht, dass man
irgendwelche komplizierten Gleichungen hinschreiben
kann, die das System beschreiben und die werden
dann für den Nutzer unter der Haube kompiliert,
nicht vektorisiert
und, oder nicht vektorisierbar und
trotzdem schnell in Python.
Ja, das
kam irgendwie...
Wo gibt es das zu finden? Oder ist das alles
private? Das gibt es zu finden,
das ist schöne, freie Software. Ich habe sie,
also es ist eigentlich drei
Software. Das erste ist JIT-Code,
das steht für Just-in-Time-Compilation
for Ordinary Differential Equations.
Also Ordinary Differential Equations
sind gewöhnliche Differenzialgleichungen. Just-in-Time-Compilation
sagt eventuell dem neigten Hörer was.
Das ist dieser Aspekt, dass
man irgendeine Eingabe
hat und die wird dann unter der Haube für den Nutzer
kompiliert. Und das
gibt es dann auch mal für sogenannte Delay-Differential
Equations und Stochastic-Differential
Equations, aber ich glaube, das ist
ein Detail, auf den wir jetzt nicht rumreiten müssen.
Ja, und
das ist ein Werkzeug, was dann
sich herausgestellt hat,
gut, ich habe es, als ich
das gemacht habe, konnte ich das natürlich schon irgendwo absehen,
dass das für viele Leute sehr nützlich ist.
Insbesondere, da wir uns damals
auch in der Forschung damit beschäftigt haben,
genau solche Probleme zu lösen.
Und
ja, eine Sache, die vielleicht auch noch
interessant ist, also man kann jetzt natürlich sagen,
der Nutzer gibt mir irgendwelche Gleichungen und die werden
umgesetzt. Das ist in Python
auch mit
SymPy, also das ist jetzt Symbolic Python,
das wird jetzt wahrscheinlich noch ein Exkurs,
eine schöne Möglichkeit gibt es, die Gleichung
einzugeben. Also SymPy macht
was denn? Also das ist jetzt wieder tatsächlich spannend, was
für die Heure, die das noch nie gehört haben?
Also normales Rechnen
im Computer macht man ja klassischerweise mit Zahlen.
Eins plus zwei
ist drei, genau. Aber
SymPy rechnet mit
Symbolen, also ganz abstrakten
Objekten wie X. Und das
Schöne an SymPy ist, dass es,
oder auch generell an symbolischen Rechnen, das hat jetzt
SymPy nicht erfunden,
aber das Schöne ist, dass es
dann exakt gewisse Sachen lösen kann.
Zum Beispiel, wenn man sagt X plus X,
steht da nicht X plus X, sondern
da steht da 2x. Oder wenn man sagt
x minus x, dann steht da
nicht 10 hoch minus 16 oder so,
sondern 0.
Und das ist dann auch exakt 0.
Und
ja, es hat sich herausgestellt, dass
diese Library gibt es und die hat auch direkt
Interfaces, um Sachen in
C-Code zu übersetzen, wenn man wirklich Sachen schnell
machen muss, was genau das ist, was ich brauchte.
Und sie
kann auch viele Sachen, die ihnen jetzt noch
für mich wichtig waren, automatisieren,
solche Ausdrücke analysieren, welche Symbole
tauchen da eigentlich auf. Damit
rechnen natürlich und eventuell sogar
Gleichungen lösen, wobei das eine Sache ist, die ich
interessanterweise kaum mache.
Auch wenn man sich irgendwie viele Leute vorstellt, dass das
wichtigste ist, wenn man so ein symbolisches Rechnen
hat, dass man tatsächlich...
Ja, genau. Man kann irgendwelche komplizierten
Gleichungen lösen. Ja, kann man.
Aber man kann es auch als Werkzeug nutzen, um
ganz stumpfe
Routineaufgaben durchzurechnen
und
es einfach als Eingabemaske zu nutzen
oder einfach
auch solche Ausdrücke zu analysieren und zu gucken,
okay, ja, welche Variablen tauchen denn eigentlich
auf? Also nichts, was ein Mensch nicht auch
könnte, aber eben automatisiert.
Kann man die auch, ich meine, wenn man das,
wenn es eine gute Methode gibt, die anzugeben, ich, das ist auch
vielleicht ein bisschen, kann man
dann auch irgendwie sowas sagen wie
printe mal das nett raus oder
latech dafür oder so,
das wäre natürlich auch, weil das
mache ich nämlich sonst immer total mühselig von Hand
und muss mir den Syntax zusammenklauben irgendwoher.
Nee, ich weiß nicht, ob ich sowas sagen würde,
der x plus x gleich x Quadrat
oder sowas, dass man
dann tatsächlich einen LaTeX-Direktor irgendwie kriegt?
Ja, der hat einen LaTeX-Printer.
Ich habe
damit noch nicht viel gearbeitet, insofern kann ich dazu nicht so viel
sagen. Also existiert definitiv.
Was man halt aufpassen muss, ist
die Frage, ob man das dann wirklich
so dem geneigten Leser
verkaufen möchte, wie es da ausgegeben wird.
Die Sachen sind halt so sortiert,
wie Sympa das gerade für richtig hält.
Also man kann das
wahrscheinlich modifizieren, aber dann
macht man sich mehr Arbeit, als es selbst zu schreiben.
Aber auch solche Sachen
gehen ja. Man kann es auch ausgeben, wenn man
unbedingt möchte.
Aber was natürlich so die Sachen sind, die in vielen
Anwendungen gar nicht auftauchen.
In dem Zusammenhang von diesem
Gleichung, da würde ich mich irgendwann mal über so ein Programm
beschauen, das heißt irgendwie LP-Solver oder so was?
Linear Programming oder so was?
Achso, ja, lineare Optimierung.
Da gibt es einige
Software zum...
Aber ich glaube, ich meine, da bin ich jetzt
wenig der Experte, ich glaube, das ist dann wieder ein Fall, wo es
numerisch gelöst wird, also mit Zahlen.
Das Interessante hier ist, dass wir wirklich mit
abstrakten Symbolen rechnen. Das ist ein bisschen was anderes.
Also natürlich, ja.
Okay, ja, vielleicht könnte man
das dann kombinieren oder sowas.
Ich weiß nicht, ich glaube, das Standardpaket
so für so konvexe Optimierung ist CVX-Opt
oder so, damit habe ich schon mal
ein bisschen was gemacht.
Es gibt dann noch so ein paar mehr Pakete, ja.
Also, aber ich glaube, das ist
nochmal eine andere
Richtung wahrscheinlich,
obwohl das auch wahrscheinlich alles in dem Scientific
Umfeld irgendwie so
existiert.
Es gibt sehr viele Standardprobleme mit sehr vielen Lösungen dafür
und schon allein die ganzen Probleme alle mit Namen
hinzuführen, da ist man dann eine ganze
Karriere mit beschäftigt.
Ich weiß nicht, ob das
bei dir noch eine Rolle spielt, aber ich habe da so mal früher,
da gab es irgendwie sowas wie Sage oder so,
das war so eine Distribution von ganz vielen Dingen.
Ob das das heute noch gibt? Ich habe keine Ahnung.
Es gibt es, glaube ich, noch. Ich habe auch damit gearbeitet.
Also, ja, also was ist
Sage? Ich kann sowas, also das ist,
es ist sehr komisch.
Es ist weitestgehend Python
und
ist speziell dafür gemacht, so ein Ersatz
für so Sachen wie, ja,
ich glaube, Mathematiker hauptsächlich.
Mathematik und so weiter zu sein. Es ist
ein großer Klotz, den man
sich kompilieren oder runterladen
muss. Der ist dann
600 Megabyte groß oder so
und funktioniert weitestgehend
wie Python, aber nicht
ganz. Also es gibt so
eigenwillige
Modifikationen, sage ich mal,
die dazu dienen, das ansprechender zu machen.
Ob das jetzt gut ist oder nicht,
sei dahingestellt. Also zum Beispiel ist
das, der Zirkum-Flex-Operator
Potenzierung macht, statt
Sternchen, Sternchen. Also Sternchen, Sternchen macht auch noch
Potenzierung, aber man kann es jetzt auch
mit... Okay, das wusste ich gar nicht, dass sie das geändert haben.
Also solche
Änderungen sind da drin. Es sind viele Sachen automatisch
geladen als Pakete.
Ähm, in so einem Standard-Namensraum, also es macht so ein paar Sachen, ja, wie soll ich sagen, komisch kaputt, die, nicht kaputt, aber so Sachen, die in Python eigentlich ganz gut sind, dass man den Standard-Namensraum eben nicht mit 10.000 Dingen vollgemüllt hat und die nicht einfach aus Versehen überschreiben kann und, ähm, weiß, wo die Dinge kommen, ähm, äh, wurden dann wieder zu nicht gemacht.
warum man jetzt den
Zirkum-Flex-Operator unbedingt brauchte,
dafür, ja, ob das so
wichtig ist, gut, ja.
Weiß ich nicht. Also ich habe damit
gearbeitet, es kann ein bisschen
mehr, oder konnte zu dem Zeitpunkt ein bisschen mehr als
simpel, andererseits eben
Sachen Gleichung lösen.
Was wie gesagt die Sache ist, die ich nicht mache, auch wenn
sie irgendwie alle warten, sondern ich nutze es wirklich eben
um Gleichung zu verarbeiten und damit
einfache Sachen zu machen. Deswegen habe ich das
letzten Endes nicht gebraucht.
Und es ist wie gesagt dieser
große monolithische Klotz, den man dann immer
auch komplett updaten muss oder wo man
ja, es war nicht sehr
handhabbar,
aber nicht schön, fand ich.
Aber noch ein kurzer Rückbezug, ist super zum
Code-Golfen, wie gesagt, alles wird in die,
viele Dinge sind im Standard-Namensraum,
das heißt, eine Lösung, ein Python-Programm
kompakter zu machen in Code-Golfen
ist dann, mach es in Sage.
Auch nicht schlecht, ja.
Ist natürlich keine Python-Lösung mehr, aber ja.
Ja,
Interessant. Also okay, aber SymPy scheint auf jeden Fall dann, wenn man irgendwie so Gleichungen symbolisch verarbeiten möchte, dann halt so das Mittel der Wahl zu sein. Was gibt es denn noch an Bibliotheken oder Software, die so regelmäßig benutzt werden und da eine wichtige Rolle spielen?
Also ich glaube, NumPy ist
klar, SciPy ist,
stellt einem
viele Simulations und Statistik
und sonst was Tools zur Verfügung.
Nutze ich zum Beispiel auch unter der Haube, um
gewöhnliche Differenzialgleichungen zu integrieren.
Für andere Differenzialgleichungen dann nicht mehr, weil das
komplizierter ist. Da habe ich dann meine eigenen
Integratoren implementiert.
Ja, dann, gut,
es gibt viele Sachen für Datenfahr,
also um wirklich
große Datenmengen und vor allem Daten zu verwalten,
Ich glaube, ihr hattet schon mal eine Folge zu Pandas, insofern werde ich davon nicht so viel erzählen. Kann ich auch gar nicht, weil ich es in der Regel nicht so viel mit Daten zu tun habe, aber die Daten, die ich habe, sind einigermaßen überschaubar.
Ja und dann eben ganz viele Bibliotheken, die gerade genau die Spezialanwendung machen, die man braucht und da ist eben das Schöne an Python, denke ich, dass es relativ einfach ist, erstmal irgendwas, wenn es nicht effizient sein soll, zu schreiben und zur Verfügung zu stellen, insbesondere auch Dinge zu nutzen und sie natürlich auch mit anderen Dingen zusammen zu nutzen, weil man am Ende eine vollwertige Programmiersprache dahinter hat.
Was immer das Problem mit anderen Sachen ist, die, also, ja, dass man eben irgendwann an die Grenzen stößt, dass man, gut, viele, häufig braucht man die Sachen natürlich auch nicht, häufig braucht man nicht, also, wenn ich jetzt, was weiß ich, Leute, die Matlab oder was auch immer nutzen, ja, die wollen damit natürlich auch keinen Webserver betreiben oder was auch immer.
ja, man kann halt auch
immer, also ich glaube, der Vorteil ist eher
nicht, also weniger, dass man solche
Sachen wie Web-Server oder so weiter nutzen kann, sondern
dass man sagen kann, das hier ist eine universelle
Programmiersprache, die lernen wir jetzt mal bitte alle
und dann können wir dann
machen, was wir wollen und wenn man allgemeine
Programmierkonzepte nutzt, kann man
sie verwenden, ob man jetzt, also muss jetzt gar nicht
in Python sein, aber wenn man
sowas wie objektorientiertes Programmieren einmal
verstanden hat, kann man das dann eben
für Simulationen nutzen oder oder oder.
Was ist so die häufigste andere Sprache, die du findest
in deinem wissenschaftlichen Umfeld, mit der du
dann auch arbeiten wollen würdest oder sagst,
das gehört auch dazu? Also arbeiten wollen würden,
das ist ja dahingestellt, ich musste
sage ich mal
einen Kurs
Datenanalyse in MATLAB für Biologen unterrichten.
Das heißt,
ja, das ist so die andere Programmiersprache, mit der
ich viel zu tun hatte. Ich habe es aber
geschafft, das weitestgehend
MATLAB nie anzurühren dazu für. Also es
gibt ja eine freie Alternative namens Octave,
das macht sich mal so für freundefreier Software etwas erträglicher aus,
dem musste ich mich da nicht irgendwie rumschlagen, das zu installieren.
Und ja, ich habe es tatsächlich weitestgehend geschafft,
diesen Kurs zu lehren, ohne das jemals anzurühren.
Und ja, also ich würde auch mit dieser Programmiersprache nicht arbeiten,
weil es gibt Sachen, das Schöne ist,
ich habe es irgendwie so dann zwei Monate vor dem Kurs mich hingesetzt
und das gelernt und wirklich jede Sache, wo ich denke,
okay, wer hat sich das ausgedacht,
das kann doch nur zu tausenden von Fehlern
und sonst was Problemen führen.
Wird da auch zu tausenden von Fehlern und Problemen los?
Ja, flog mir dann die Ohren, ja.
Es passt wirklich zum Teil, wie die Voraussetzung war.
Ich habe ja auch, ja gut, das kann man jetzt wieder nicht vorführen,
aber so ein Beispiel, wo man an einer Stelle,
ich hoffe, ich erzähle jetzt doch noch mal ein bisschen.
Matap hat die großartige Idee gehabt,
dass man das Leerzeichen als Elementtrennungsoperator
in Arrays nutzt.
Ja, ja, ja.
Nämlich, da war doch was.
Genau, also statt Kommata wie in Python.
Und man kann auch Kommata nutzen, man kann auch Semikola nutzen,
das ist dann eine neue Zeile, aber man kann auch Leerzeichen nutzen.
Und dann gibt es jetzt das Problem, wenn ich jetzt was tippe wie eckige Klammer auf,
was steht für Array?
Okay, soweit so erwartet.
Fünf Leerzeichen plus Leerzeichen drei, dann ist das natürlich acht.
Wenn ich aber eintippe fünf Leerzeichen plus kein Leerzeichen,
Achtung, drei, ist das natürlich das Array, was fünf und drei enthält.
war das Leerzeichen, ja, der
plus 3.
Und das Plus gehört dann halt zu der Zahl
und sagt einfach nur, das ist jetzt plus 5 und nicht minus.
Genau, ja. Und das
hört sich so noch
okay, kann man noch verstehen. Das Problem ist, wenn jetzt
die Arrays etwas größer und komplizierter werden und da komplizierte
Ausdrücke drinstehen, was manchmal tatsächlich der Fall ist,
dann kann einem
die Formatierung dieses Arrays dann die Probleme
machen. Also, ja.
Das war der Fehler, wo wir wirklich eine halbe Stunde gesucht haben,
um zu verstehen, was da überhaupt passiert.
Ja, das habe ich mir gut verstanden.
Man starrt da drauf und denkt sich so,
ja.
Und die Sprache ist halt jetzt voll davon.
Das wurde halt in den
80er Jahren entwickelt,
oder so 1987, 86, keine Ahnung.
Und seitdem gefühlt
nicht mehr weiterentwickelt.
Und ja, so bedient es sich auch.
Das erinnert mich so ein bisschen an Python, wenn du das Tupel
machen übergeben willst, dass du dahinter noch ein Komma machen willst,
weil da sonst kein Tupel macht, wenn du da einfach
ein Element nur drin hast.
Ja, genau, das ist noch so,
ja, aber das passiert halt andauernd.
Ja, und da gibt es
so zwischendrin gibt es R, das ist schon ein bisschen
besser.
Also erstens ist es frei, zweitens
ist es nicht ganz so irrsinnig,
es hält sich so ein bisschen an Programmierstandards,
aber
ja, damit habe ich noch nicht so
viel zu tun gehabt. Und es gibt natürlich auch diverse
andere Sparen. Das ist jetzt relativ
ein Kombis für Simulationen oder
Sachen, die schnell laufen müssen, ist Julia,
wo ich dann mich
immer noch frage, okay, wieso brauchen
wir jetzt hier noch klammern, weil
die Python ja zum Beispiel abgeschafft hat
und insbesondere, dass ich eine Sprache ist, die sich
in vielen Fällen, so wie ich es verstanden habe, an Python
orientiert. Ja, aber
sehr viel mache ich zur Zeit in Python und wenn es dann
schnell gehen muss, mache ich es eigentlich in C.
Also das sind so die Sprachen, mit denen ich
direkt zu tun habe.
Dann direkt tatsächlich als C-Extension
oder nimmst du sowas wie Cytan
und
wandelst das dann halt um
in C. Ich mache es tatsächlich
als C-Extension, weil ich es einmal gelernt habe und mich
auskenne. Zum einen und zum anderen
jetzt, um auf meine eigene Software zurückzukommen,
da ist ja wieder gerade das Problem,
dass ich es dann wirklich möglichst schnell haben möchte
und wenn ich den Nutzer dann
Siphon-Code eingeben lasse, habe ich
nicht so viel gewonnen.
Ja, klar. Dann kann ich auch direkt
C-Code machen und dann kann ich auch noch viele Sachen nutzen,
die eben so
in Siphon nicht drin sind.
Also doppelt verlinkte Listen
oder so, glaube ich, würden
Siphon nicht funktionieren.
Also, dann mache ich es schon
einmal Hardcore und kann
dann wenigstens die Sachen, die wirklich
schnell sein müssen, auch radikal
optimieren.
Du sitzt dann am liebsten mit der
Stoppuhr, timet und dann
guckst du dir das dann wirklich an?
Ja, also in einigen Fällen wirklich ja,
zum anderen bilde ich
mir ein, ein bisschen Erfahrung zu haben,
wie man Dinge schnell macht. Also
in vielen Fällen schreibe
ich die Dinge dann hoffentlich auch direkt so, dass sie schnell sind.
Also hintereinander direkt in den Speicher,
dass ein Zeiger nicht so schnell oder so viel hin- und herspringen
muss oder was es dann so ist. Ja, okay,
auf der Ebene bin ich noch nicht, aber dass man sich halt schon mal
überlegt,
ja, dass das könnte ich
jetzt,
dass man eben hier
diese gewisse Schleifen gar nicht braucht oder
ja,
mit Zeiger-Arithmetik arbeitet oder eben
sich überlegt, okay, jetzt habe ich hier noch einen Funktionsaufruf
und das kostet Zeit und
wie kann ich das
vermeiden oder wie kann ich hier die Suche,
also irgendwelche Suchoperationen, ja.
Okay, okay, das hört sich tatsächlich an, als wärt ihr tatsächlich
von der schwachen Hardware, die ihr noch zur Verfügung
stellt, in den Forschungsinstitutionen
so ein bisschen abhängig. Aber ich dachte, die wären eigentlich
schon weiter.
Abhängig von dieser Komplexität,
dieser unheimlich großen Berechnungen.
Naja, also die Hardware kann
ja nur so viel leisten.
Also erstmal, wenn ich ja durch die,
in vielen Fällen gehe ich, indem ich von
Python auf C gehe, hole ich
einen Faktor von 1000 oder so raus.
Bei mir.
Ja, da
will ich jetzt nicht mehr mit der...
Das klingt jetzt ziemlich viel.
Natürlich, also ich könnte das in Python
wahrscheinlich auch noch, wenn ich mich wirklich, wirklich stark
hinsetze, besser machen, dass es
nur noch ein Faktor 100 ist, aber
gerade solche Probleme habe ich eben.
Das muss man ja auch. Also
für viele andere Probleme gilt das übrigens nicht. Also ich habe
jetzt schon meine exotischen Spezialprobleme,
die ich und vielleicht noch
ein paar kleinere Communities auf der Welt
haben,
wo das wirklich einen riesen Unterschied macht
und wo ich dann eben auch Software geschrieben habe, die
diesen Unterschied dann wegmacht, aber
für Python-Nutzer rausholt.
Die...
So, jetzt war ich...
Was war nochmal deine Frage?
Ja, es geht so ein bisschen darum, also wie das dann hinterher
aussieht, also warum du diese Geschwindigkeit
dann über C rausholen musst, um das nicht
irgendwie, weiß nicht, andere Ideen dafür noch...
Großrechnung. Einfach mehr Hardware, ja.
Genau, mehr Hardware draufschmeißen. Genau.
Also natürlich kann man immer mehr Hardware draufschmeißen,
aber diese Hardware muss ja dann auch erstmal, also gerade wenn ich
einen Cluster habe, muss ich mich erstmal damit auseinandersetzen,
wie ich meine Sachen clusterfähig mache.
Und in vielen dieser Fälle ist es auch so, ich möchte das mal eben schnell laufen lassen, sofort das Ergebnis sehen und dann darauf basierend weiterdenken. Also ich habe viele Fälle, da habe ich eine Simulation, ich möchte jetzt verstehen, was passiert da, ich drehe an einem Parameter, ich möchte verstehen, was der Parameter macht und dann möchte ich sofort das Ergebnis sehen. Da hilft mir ein Großrechner nicht viel weiter, wenn ich das jetzt erstmal auf dem Großrechner lagen muss und so weiter und so fort.
Mhm.
Und dann irgendwann am Wochenende nachts gibt es dann mal Rechenzeit, wo man das dann durchläuft.
Das zweite Problem ist, ja, auch der Großrechner kann die Sachen nur hintereinander ausführen.
Viele Sachen, also gerade Simulationen, sind eben, ich habe ein großes System, ich simuliere das über die Zeit, es baut alles aufeinander auf.
Ich kann einfach nicht diese 500 Zeitschritte parallelisieren, denn die brauchen die ersten Ergebnisse vom vorigen Zeitschritt.
Also das heißt, da kann ich auch mit dem Großrechner unbedingt viel rausholen.
Was ich natürlich machen kann, ist, ich kann diese ganzen Simulationen, die ich habe,
sage, okay, ich möchte jetzt 500 Simulationen laufen lassen, die kann ich dann parallelisieren.
Aber da bin ich natürlich aufgerufen, wenn es schneller geht,
weil wenn es schneller geht, kann ich eben 500 Simulationen laufen lassen statt nur 5.
Und ja, das macht dann halt in vielen Fällen auch schon wieder einen schönen Unterschied.
Das klingt tatsächlich so, also wäre das ein großer Vorteil.
Also ich hätte jetzt nicht gedacht, dass man irgendwie das 100-fache da auch mit rausziehen kann,
weil ich hätte irgendwie gedacht, dass man die Sachen in Python
dann irgendwie mit Zeissen oder
was, dann irgendwie trotzdem so hinbiegt,
dass das bewerbsfähig ist.
Ich weiß nicht, wenn man sich jetzt hinsetzt
und das mit Zeissen hinbiegt, dann hat man eventuell
Faktor 10.
Das hängt so ein bisschen vom Problem ab.
Also ich habe wirklich Probleme, da habe ich,
also was ich gemacht habe, ist,
ich schreibe immer erst die Sache komplett in Python.
Wenn ich meine eigenen Sachen baue,
mache ich mir einen
Kern aus Python, von dem
ich weiß, was er tut, der lesbar und
so weiter ist. Und
wo ich erstmal lerne,
den Algorithmus so ein bisschen zu optimieren und
wie speichere ich Dinge und so weiter und so fort.
Und dann gehe ich hin und schreibe das Ganze
nochmal neu in C.
Was auch sehr schön ist, dann habe ich irgendwie eine Testmöglichkeit.
Ich habe einfach meine zwei Kerne, ich bombardiere
die mit zufälligen Eingaben und gucke,
ob sie das gleiche tun.
Aber von dem,
davor habe ich halt dann auch einen guten Vergleich.
Weil ich habe das einmal in Python
geschrieben, genau dasselbe.
Vielleicht dann, ehrlicher gesagt, auch nicht
optimiert darauf, dass es besonders schnell ist,
sondern eben auch, dass es lesbar ist und vergleichbar und dass ich
verstehe, was es tut und dass es gut testbar
ist und so weiter und so fort.
Das muss ich dann schon eingestehen, aber es ist
trotzdem, je nach Aufgabenstellung wirklich,
sind es solche großen Faktoren.
Mit Cypher, ja,
wenn ich das jetzt in Cypher programmieren könnte
oder wollte oder meinen Nutzer
das vermuten würde,
dass er das in Cypher programmiert,
ja, okay, dann
wäre es vielleicht nur noch ein Faktor, keine Ahnung,
10, 5, was auch immer,
Aber dann geht natürlich auch sehr viel Programmierzeit
drauf.
Wenn du jetzt sagst, so deine Nutzer, das heißt, du
stellst tatsächlich so ein Programmierinterface bereit
und deine Nutzer machen ihre
Dateneingabe oder die Schnittstelle
dafür noch komplett selber?
Also meine Nutzer sind Programmierer.
Das muss ich auch immer unterscheiden. Das ist immer sehr
lustig, wenn man dann auf diesem Python-Treffen
sitzt mit allen möglichen Leuten
und die aus dem Web-Bereich und so weiter
kommen und erstmal deren Nutzer natürlich keine
Programmierer sind und sich dann
Gedanken und man ganz andere Vorstellungen
wie man eine Fehlermeldung schmeißt.
Meinen Benutzer schmeiße ich einfach eine Fehlermeldung
und die können die dann hoffentlich auch lesen.
Naja, manchmal.
Also meine Nutzer sind Programmierer
und die brauchen jetzt kein grafisches Interface zum Glück.
Du visualisierst dann auch gar nichts von den Lösungen irgendwie,
sondern das schmeißt du dann irgendwo rein
und dann kann man...
Ja, das kann der Nutzer dann mit einem Plotprogramm machen.
Das ist der Plotprogramm der Wahl oder was auch immer.
Gut, meistens ist da Matplotlib.
Aber das ist ja in modularer Denkweise nicht meine Verantwortung, da irgendwas zu visualisieren, sondern mir geht es nur darum, die Lösung zu produzieren an der Stelle.
Also tatsächlich Python und C dann parallel und dann hast du dann eine schnelle und eine hübsche und effektive Lösung, deine Probleme so zu behandeln.
Und würdest du sagen, das, was du da machst, das hast du jetzt gesagt, das ist irgendwie sehr speziell auf so einer Insel, das kannst du auch übertragen oder könnte man übertragen auf andere Wissenschaften und andere Anwendungsfälle so ohne weiteres?
oder ist das gar nicht möglich?
Ja, also so klein ist die Insel nicht.
Das Problem, gewöhnliche Differenzialgleichung
oder retardierte Differenzialgleichung
und so weiter und so fort zu lösen,
das betrifft schon eine gewisse Menge,
also schon nicht wenig Leute.
Also ich könnte jetzt,
es tut mir schwer, eine Zahl abzuschätzen,
wie viele Wissenschaftler und andere Leute
sich mit so einem Problem beschäftigen.
Wir stinken halt nicht an gegen die Leute,
die partielle Differenzialgleichung haben.
Das sind diese klassischen vektorisierbaren Fälle,
Was man so sieht, wenn Leute Wärmeleitungen
simulieren oder irgendwie
physikalische Verformung und solche Sachen.
Die machen alle Parzelle von Zahlgleichen.
Ja, also
die Insel ist nicht so klein,
aber sie ist, ja,
kleiner als vielleicht andere größere Inseln.
Was jetzt wahrscheinlich keine
sinnvolle Aussage ist.
Ja, also ich meine, gut,
ich kenne jetzt vor allen Dingen halt
den ganzen
Data-Science-Bereich, da auch das
das wissenschaftliche Umfeld. Da gibt es halt
Differenzialgleichungen hat man da eigentlich nie so wirklich
zu tun, auch nicht mit symbolischen. Da wird immer eher so,
da packt man die große
GPU aus und dann sucht man damit das
Problem halt zu. Nee, aber das ist ja auch ein ganz anderer Ansatz.
Ich habe Daten und ich will
sie verstehen. Bei Simulationen geht es darum,
ich habe eine Idee,
wie Sachen funktionieren. Ich möchte jetzt mal gucken, was eigentlich
passiert, wenn ich diese Idee in die Tat umsetze.
Ganz doof gesagt. Ich habe mein Modell und
jetzt lasse ich es mal laufen. Ja, aber da würde
mich eigentlich auch mal interessieren, wie ist das denn?
Wie kann man das denn dann verifizieren? Ich meine, woher
weißt du, dass deine Simulation
tatsächlich irgendwie das
liefert, was
du jetzt bekommen hättest, wenn du 500
Gläser
mit Nährflüssigkeit irgendwie
auf den Fenster Sims gestellt hättest?
Das ist eine große Frage.
Da gibt es natürlich, also das ist
dann wirklich, dass man sagt, okay, wir machen jetzt mal den gleichen Fall
und lassen es laufen und vergleichen das wirklich
jetzt mit der Nährflüssigkeit.
Ich habe jetzt erstmal die Frage auf eine ganz
andere Weise verstanden, die vielleicht auch interessant ist,
nämlich, wie teste ich eigentlich solche Software?
Ich habe häufig
sehr komplexe Systeme.
Ich kann die natürlich mit einer anderen Software
laufen lassen, was ich auch nicht so möchte.
Und ja, dann theoretisch
zu bestimmen, was eigentlich rauskommt,
das war auch sehr spaßig.
Insbesondere ein Fall, den ich jetzt noch nicht so
angeschaut habe, sind dann stochastische Differenzialgleichen.
Das ist so, mehr oder weniger das Gleiche, ich packe noch
Zufall drauf.
Und dann muss man, ja,
dann gibt es ja noch nicht mal eine richtige Lösung.
Also jede Lösung, die ich prinzipiell kriegen könnte,
könnte, oder die ich sehe, könnte richtig sein
für den richtigen Zufall.
Ich kann nur sagen, okay, diese Lösung ist jetzt eher unwahrscheinlich
oder diese Lösung ist eher wahrscheinlich, aber
ich kann ja gar nicht mal
sagen, das ist eine falsche Lösung anhand einer Lösung.
Du müsstest ja vor allem erstmal die Verteilung kennen
deiner Zielfunktion, damit du weißt, ob das
wahrscheinlich ist oder nicht. Genau, das, ja genau,
das heißt, ich kann einfach nur, ich kann nicht mal eine Aussage über
eine Lösung meiner Software machen, ich kann nur eine Aussage
über ein Ensemble von Lösungen, also tausend
Lösungen machen. Und ja,
das sind dann die sehr, sehr langlaufenden
Tests, wo ich erstmal tausend Lösungen berechne,
dann irgendwelche statistischen Verfahren darüber.
Ja, aber ich finde, das ist das Interessanteste.
Also jetzt von meinem Gusto her,
wenn du so eine Verteilungswolke irgendwo hast,
die nähert sich ja dann oder verdichtet sich ja dann
an den Stellen, wo dann doch die meisten Experimente
irgendwo in derselben Richtung ausgehen.
Und da hättest du, finde ich, so die höchste Treffgenauigkeit,
als wenn du jetzt einfach so ein simuliertes Modell hast
und sagst, oh, da kommt jetzt was.
Also ich verstehe jetzt ohne Statistik,
bei so Simulationen gar nicht, was dabei rauskommt,
also wie die Validität einzuschätzen wäre.
Wenn du jetzt sagst, du machst jetzt den Test dazu, dann finde ich das
sehr spannend. Sorry, ich rede jetzt vom Software-Test.
Ja, aber ich meine, klar,
das hängt ja irgendwie zusammen.
Also der Software-Test,
der muss ja zwar dann, klar, da muss das Programm
funktionieren, weil sonst ist der Test ja Quatsch, aber
der ist ja dann auch irgendwie die Basis
Voraussetzung dafür, dass das Modell, was du
dir ausgedacht hast, dann wenigstens gerade läuft.
Ich bin mir nicht sicher,
ob ich das richtig verstanden habe. Also ja, natürlich muss
das, also einerseits
muss das Modell die Realität, oder am Ende wollen wir, dass
das Modell die Realität beschreibt, klar.
Aber die erste Schwierigkeit, ich habe jetzt
irgendwas programmiert, was mir
mein Modell löst, was es behauptet
und die Frage ist, macht es
wirklich die richtige Lösung?
Also einfach wirklich nur einen Software-Test schreiben.
Also einfach nur zu gucken, ich stecke das rein,
kommt das Richtige raus.
Und das ist halt, wenn es stochastisch ist, ein bisschen blöd,
weil dann kommt halt jedes Mal was anderes raus.
Und es könnte alles richtig sein.
Das ist so wie ein Zufallszahn-Generat
testen, geht je nachdem noch, weil ich
einfach ganz viel, ganz schnelle Zufallszahlen
ziehe und dann weiß ich genau, okay, die müssen dann vielleicht gleich
verteilt sein oder so, aber
bei, ja, dem Problem
ist es dann eben nicht so einfach. Also letzten Endes
sind da ganze wissenschaftliche Arbeiten draus
entstanden, nur
auf die Frage, wie, also aus der Frage
heraus, wie teste ich das eigentlich richtig und
so eine Differenz, wo wir feststellen, okay,
die Theorie, die wir haben zu dem, was da rauskommen
muss, stimmt nicht mit dem überein, was da rauskommt
und können wir das... Entweder stimmt die Theorie
nicht oder das Modell ist falsch.
Ja, das ist wohl ein Fehler in der Experimentation.
Also am Ende haben wir festgestellt,
also erstens, ja,
die Theorie könnten wir erweitern, das haben wir auch gemacht
und da sind dann ganze Arbeiten und
Paper draus entstanden, das war gut.
Also Software testen ist was Gutes,
produziert wissenschaftliche Paper.
Die andere Sache ist, wir haben auf die Weise
tatsächlich Fehler im veröffentlichten
Algorithmus gefunden,
wo irgendwie in der großen Tabelle, die
diesen Algorithmus beschreibt, also solche Algorithmen
werden mit Tabellen beschrieben, ist leider so,
dann irgendwo ein Vorzeichenfehler war.
Den haben wir damit gefunden.
Also insofern, ja.
Und den hätten wir wahrscheinlich sonst auch nicht gefunden,
wenn wir uns diese Mühe nicht gemacht hätten.
Und dann hätten wir jetzt wahrscheinlich
eine ganze Menge fehlerhafter Rechnungen.
Und wüssten es nicht.
Wir auch.
Wir würden alle für bare Münzen verkaufen,
damit Geld verdienen und irgendwelchen großen Papern veröffentlichen.
Alle Leute würden nicht zujubeln.
Und irgendwann würde einer sagen so, hm.
Ja, oder halt auch eben nie.
Und das ist halt, dass es einem noch viel mehr Sorgen machen sollte.
dass es eben einfach gar nicht schief geht,
sondern die Leute einfach...
Das passiert in der Wissenschaft leider viel zu häufig.
Ich denke auch, dass das oft passiert, ja.
Die Erde ist vielleicht doch eine Scheibe.
Man weiß es nicht so genau.
Ja, nee, also ganz so schlimm ist es nicht,
aber ja.
Naja, also so ein Paradigmenwechsel,
bevor die mal passieren,
da muss ja so ein bisschen schon Arbeit passieren,
muss sich irgendjemand aus dem Turm stellen
und was runterschmeißen.
Aber ihr verwendet auch ganz normal
Pytest oder so zum Testen
oder habt ihr da noch speziellere Kniffe,
die man da benutzen muss,
wo man das irgendwie in den Griff kriegen würde.
Also nee, als ich angefangen habe,
habe ich glaube ich sogar noch mit Unitest gearbeitet.
Schande über mein Haupt, ich weiß.
Also wenn ihr jetzt gerade irgendwie lustig
über Tests nochmal einsteigen wollt,
dann können wir gleich gerne noch ein bisschen länger drüber reden,
weil da sind noch einige Fragen eingetrudelt.
Aber Entschuldigung, das ist vielleicht auch ein ganz anderes Thema.
Aber nee, also ich glaube die klassischen Software-Test-Tools,
das ist nicht so das Problem, die zu nutzen,
wenn man sie nutzen kann.
Das Problem ist eher die Frage, ich habe eben so
eine, sowas wie
eine stochastische Sache
und kann nur eine Aussage über das Ensemble
machen, wie mache ich das eigentlich?
Das ist dann eher eine wissenschaftliche Frage als eine
Softwarefrage oder
die Frage, eine Softwarelösung zu finden.
Ja, du musst ein Stichproben ziehen und dann musst du gucken,
ob die Stichproben irgendwie der erwarteten Verteilung
sprechen, dann muss man wieder eine Fehlerwahrscheinlichkeit
rausholen. Ja, genau, aber das ist
nicht einfach, je nachdem, was man hat.
Die andere
Problematik, oder eine andere
Beispielproblematik, wenn wir gerade dabei sind,
ist sowas wie, ich habe ja gesagt, ich
habe eine symbolische Eingabe, ich übersetze das in C-Code.
Was ist jetzt eigentlich der richtige
C-Code? Also ich kann ja nicht einfach
sagen, okay, ich möchte genau diesen C-Code
haben, der ist dann richtig, sondern ich könnte
ja auch einfach mal, weiß ich was, A plus B oder B plus
A ist in der Stelle gleich.
In den allermeisten Fällen.
Wie entscheide ich, was da richtig
ist? Das kann ich eigentlich nur machen, indem ich
die Ausrechnung wieder vergleiche.
Ein solches Mädchen.
Also das heißt, die Equivalenz von deinen Experimenten
ist schon fraglich dann.
Also wenn du die Experimente durchführst, dass sie halt
gleich durchgeführt worden sind.
Ich meine nicht bei Experimenten, ich meine erst bei Simulationen.
Ist Simulation kein Experiment?
Also okay, Entschuldigung.
Begrifflich wahrscheinlich da gerade irgendwas verwechselt.
Ist auch etwas, was ich gerade eben Experiment genannt habe
oder als mathematisches Experiment beschrieben habe.
Ja, das könnte
fraglich sein, aber es geht jetzt erst darum, macht meine Software
das, was sie soll.
Also ich kann jetzt eben nicht hingehen und eine kleine
eine Einheit von einem Code
Produktion, also Code Drucker
oder wie die heißen, also einfach eine
Übersetzung von Symbolen in Code, die ich zum Beispiel
nutze, kann ich, ist es gar nicht so einfach
die zu testen, da ich eben keine
ganz klare Aussage habe, was da rauskommen
muss. Da ich eben nicht weiß, in welcher
Reihenfolge zum Beispiel
sind jetzt diese fünf Summanden in
einer Addition.
Da gibt es keine Vorschrift, was da
richtig ist. Und wenn ich, kann ich
natürlich mich drüber hinwegsetzen und sagen, ich
zerteile das jetzt komplett und mache da irgendwie
einen Symbolbaum oder was auch immer, aber dann
muss ich natürlich wieder zerlegen, ist auch nicht schön.
Also
ein Problem mit der ganzen Software war, dass es eigentlich nicht
sehr einfach zu testen war.
Okay. Und aber dafür habt ihr
was veröffentlicht, wo ihr sagt, hey, das ist so
ein voller Fortschritt, das sollte man so tun.
Also nicht zum Testen, also
das habe gar nicht ich gemacht, das haben dann andere Leute
haben darauf aufgebaut und haben
wir haben, also
die Geschichte ist eigentlich, wir haben
ich habe dieses Problem entdeckt und dann haben wir irgendwann
uns hingesetzt und eine Bachelorarbeit
aufgesetzt
machen lassen zu dem Thema, okay,
vermessen wir das doch mal bitte, verstehen wir das
ein bisschen besser und hatte dann auch
noch andere Anwendungen, nicht nur den Test, muss man dazu
gestehen. Und ja, das
war, wir haben, da wurden neue Erkenntnisse
gewonnen und veröffentlicht.
Aber das war gar nicht so,
also das war nur etwas, was ich angestoßen
habe und insofern kann ich dir jetzt auch gar nicht
so viel zu erzählen.
Ja, klingt sehr spannend, also dass man tatsächlich
so echte Experimente
irgendwie begleitet und simuliert
mit Python oder halt
ein bisschen C, aber halt dann so in die Zukunft
damit ein bisschen gucken kann, was könnte denn dabei rauskommen
oder welche Lösung für
wirklich Probleme, also weiß nicht, ob das nur Medikamente
angeht oder kann man
andere denken, genau, damit
bauen kann, das ist natürlich schon spannend.
Also das ganze Feld, so dynamische Systeme
vorher sagen, ist
sehr vielfältig in Anwendung.
Was ich vorher gemacht habe, waren
Probleme mit
Und eine Frage, mit der sich meine frühe Arbeitsgruppe beschäftigt hat, war, wie sagen wir epileptische Anfälle voraus? Können wir das eventuell machen? Oder wie sagen wir Bevölkerung, plötzlich das Bevölkerungswachstum heraus?
Also das Thema meiner vorigen Forschung war, wie sagen wir, extreme Ereignisse, also verstehen, wie passieren extreme Ereignisse.
Und extreme Ereignisse kann dann so sein wie epileptischer Anfall, kann aber auch so was sein wie Überpopulation, Artensterben, Erdbeben, all solche verschiedenen Dinge.
Also was war das Ergebnis? Gibt es so einen entscheidenden Punkt, den man irgendwie erreichen kann, wo dann bestimmte Faktoren identifizierbar sind, die sagen so, hey, jetzt macht's gleich peng?
Nee, so weit sind wir
leider nicht gekommen.
Also das Ergebnis war dann sowas wie
wir können, wir haben einen neuen Mechanismus
gefunden, wie solche Sachen entstehen können
in der Dynamik eines Systems.
Dann können wir in einigen Fällen, hilft uns das ein bisschen
was vorherzusagen, aber insbesondere können
dann die Leute, die ein konkretes System haben und
mit einem konkreten System was vorhersagen, eventuell
besser verstehen, wie sie das machen.
Okay. Das ist leider nicht sehr
befriedigend, aber
das ist eben Grundlagenforschung.
Das ist Wissenschaft.
Ich fürchte, das ist halt irgendwie so
eine der blöden
Eigenschaften, die da halt so dabei sind,
dass das extrem seltene
Geschichten halt, sondern schlecht Statistik
zu machen kann, weil es einfach nicht so häufig
auftritt. Aber wenn die halt stark genug
sind, dann haben sie halt einen großen Einfluss auf das, was
passiert und dann ist es halt blöd.
Also Statistik ist die eine Sache und die Phase
können wir jetzt allein mit Statistik vorhersagen.
Wahrscheinlich nicht. Wir müssen verstehen, was passiert da eigentlich.
Und wie kommt es
eigentlich dazu?
Und dann geht das überhaupt.
Es kann ja auch sein, dass man das einfach gar nicht...
Und was ist wichtig?
Und jetzt mal vielleicht auch nochmal ein Beispiel,
wozu Simulationen gut sind.
Was jetzt immer wieder die Frage war,
ein früher Kollege von mir,
der hat wahrscheinlich die erste Simulation geschrieben,
die macht, was aussieht wie ein epileptischer Anfall.
Ob es jetzt irgendwie wirklich das damit zu tun hat,
muss man dann nochmal untersuchen.
Aber was nicht darauf basiert,
dass wir an irgendeinem Knopf drehen
und irgendeinen Parameter ändern,
also irgendwelche Neurochemikalien oder so im Gehirn ändern,
sondern wir können eine einfache Simulation machen,
die machen epileptischen Anfall, ohne dass wir
was ändern müssen.
Dann einfach, okay, was bringt das Ganze jetzt?
Naja, die Leute, die
ein paar Ebenen in der Anwendung
höher sind, können jetzt hingehen
und sagen, okay, wir haben uns bisher
immer darauf gestützt, was ändert sich da chemikalisch
und so weiter. Könnte es vielleicht was anderes
sein? Könnte es vielleicht einfach
sein, dass das Gehirn anders verknotet
ist oder die Neuronen anders verbunden sind
in Gehirnen, die epileptische Anfälle produzieren
und das ist das Problem.
Und die Frage ist noch offen,
Aber solche Ansätze stößt man dann
eventuell mit Simulationen hervor.
Ja, schön, wenn man das dann heilen kann.
Irgendwann dafür sorgt, dass es den Menschen besser geht.
Genau, das ist natürlich das fairen Ziel,
aber leider ist es
nicht so ganz einfach.
Ja, ich weiß halt, kann man
aus diesem Elfenbeinturm, wenn ich das mal so nennen darf,
irgendwie so runtersteigen, wieder auf die Straße
und mit beiden Händen
wieder so das ausschütten, was man da so fabriziert.
Ja, manchmal passiert das ja einmal,
sonst hätten wir ja keine Computer.
Ja, genau, also manchmal ist da jemand
so ein Magier irgendwo so in den Turm,
irgendwann macht dann der Bumm oder diese Kugel leuchtet
und auf einmal der Turm fängt an zu leuchten und dann
gucken alle, oh, was ist das denn? Und dann, ah, guck mal hier,
ich habe was Schönes gefunden.
Ich glaube, ja, aber ich fürchte, das kann man nicht wirklich,
ich fürchte, das ist bei Wissenschaft noch schlimmer
als bei Firmen oder Startups,
also es ist ja auch schon irgendwie so, dass man das eigentlich
nicht wirklich voraussagen kann, weil
naja, es hängt halt davon ab, wie sich die Zukunft
entwickelt, die lässt sich schon mal nicht so gut voraussagen
und dann sind so viele Faktoren dabei, die man
nicht unter Kontrolle hat, dass
und bei Wissenschaft hast du
jetzt, das ist ja noch übler, du weißt ja, also
Das ist alles Alchemie.
Naja, oder so ein bisschen Glück auch.
Also ich meine, natürlich ist es so, du kannst kein Glück haben,
wenn das nicht auch irgendwie funktioniert oder wenn du nicht das Richtige
tust, aber ob das, was du da tust, jetzt irgendwie
eine sinnvolle,
erfolgsversprechende Geschichte ist oder nicht, das hast
du halt, würde ich sagen, zum großen Teil gar nicht unbedingt
unter Kontrolle.
Also andersrum, wenn wir es unter Kontrolle hätten, müssen wir
es nicht machen. Wissenschaft geht ja darum, irgendwie,
dass wir neue Sachen herausfinden und
dass wir die Frage beantworten, funktioniert
diese Methode oder so und wenn wir wissen, ob diese Methode
funktioniert, müssen wir es nicht machen.
Ich finde das immer wieder beeindruckend, wie man dann, also es ist ja
schon, das ist, es hat ja so ein leicht, also ich
würde da leicht
in Defizitismus verfallen, glaube ich.
Man muss ja da sehr motiviert sein, das dann zu tun,
wenn man sich im Grunde ausrechnen
kann, dass man wahrscheinlich
Pech haben wird und das heißt, man
gibt sich viel Mühe, aber es kommt nichts mehr raus. Obwohl auf der anderen
Seite, das, was man tut, macht natürlich auch Spaß.
Ja, aber ich meine, gut,
es ist schon so dieses klassische Klischee,
Die Hauptsache, die man mit einer
Promotion kriegt,
ist eine riesengroße
Enttäuschungsresistenz.
Was war das?
Das ist, ich
verwende Apple Hardware
und
es kommuniziert untereinander
und mein Telefon hat gerade meinem Computer gesagt,
das war Klingeln, was manchmal gut ist,
in diesem Fall war es nicht so toll.
Manchmal kümmert sich auch noch
vorher drum, dass er das alles abstellt.
Ja, diesmal habe ich es irgendwie verpennt. Ich glaube,
ich mache das gerade mal. Man kann nämlich auch sagen,
irgendwie. Die ganzen wissenschaftlichen Probleme, wir kennen die
Antwort doch eigentlich schon alle, oder?
Ja, kennen wir die? Wie lange? 42.
Achso.
Stimmt, finde ich.
Ja, aber
das ist halt,
es ist da so ein
frustrierendes Potenzial dabei, das glaube ich auch immer,
wenn man
guckt, was die Politik da auch immer machen möchte,
die versucht das dann zu ignorieren, dann macht man so Forschungsprogramme,
Ich habe da von einem gehört, es gibt ein großes Forschungs...
Also man macht das dann so, man glaubt irgendwie, was war das irgendwie, man kann irgendwie Chips bauen, also normalerweise belichtet man irgendwie Chips sozusagen top-down irgendwie, man überlegt sich eine Architektur, könnte man das nicht auch umgekehrt machen?
Also man hat irgendwie so eine Lösung, irgendwie auch wieder, keine Ahnung, irgendeine Art Nährflüssigkeit, ja, und dann sorgt man dafür, dass die richtigen Bedingungen existieren und dann entstehen da Transistoren oder was auch immer für Schalter, man braucht gerade quasi dann so bottom-up automatisch.
Das wäre ja voll gut, wäre viel billiger.
Bräuchte man da nicht so super
Ultra-Reihenräume und
diese ganzen teuren Gerätschaften.
Und da hat man irgendwie,
die Idee hört sich wirklich total super an.
Und dann gab es irgendein
großes Forschungsprojekt,
das da wurde auch 100,
das sind glaube ich 100 Millionen
Euro reingegangen. Und das Problem
ist natürlich, wenn jetzt so viele Leute daran arbeiten,
also das lief dann ganz lange
und irgendwie musste immer noch ein Doktorand,
ein Armer, der musste dann
geopfert werden, diesem Drachen.
Man hat gesagt, der muss tatsächlich an diesem Problem
noch arbeiten, damit man sagen kann, dass man an diesem Problem
arbeitet. Aber in Wirklichkeit wussten alle schon
seit einigen Jahren, naja, das funktioniert
aus prinzipiellen Gründen grundsätzlich nicht.
Aber man kann ja auch nicht sagen, es funktioniert nicht, dann kriegt man
kein Geld mehr, ist auch schlecht. Also
haben halt die anderen inzwischen alle was anderes gemacht.
Heimlich.
Ja, okay.
Die große Veröffentlichung schreiben.
Einerseits natürlich auch das große Problem ist, dass man einfach nicht mal
sagen kann, okay, wir haben herausgefunden,
es funktioniert nicht und hier ist
der Grund. Das ist ganz schön haarig.
Also ich komme ja aus der VWL eigentlich
und da waren dann so Experimente schon
problematisch, weil da hat man
irgendwelche Modelle gebaut, die dann irgendwelche Prognosen
gemacht haben und dann ging
dann vor allen Dingen sowas wie der Internationale Währungsfonds
dann hin und hat dann diese
Modelle ausprobiert
mit irgendwelchen Entwicklungsländern, um zu gucken,
klappt das mal? Und das hat dann ab und zu mal dazu geführt,
dass dann irgendwie so ein Landesgesundheitssystem dann zusammenbrach
oder sowas. Und das ist dann vielleicht
so ein Mittelgut und das war aber eigentlich
das Modell hat dann eigentlich vorhergesagt,
das hätte gut funktionieren sollen. Die haben sich dann alle so ein bisschen
die Haare gerauft. Die wollten eigentlich auch, dass es dem Land eher gut geht.
Also es war jetzt nicht nur irgendwie so Weltbankdruck oder so.
Und dann haben die gesagt, Mist, das haben wir jetzt ja falsch gemacht.
Haben es beim nächsten Mal, dann haben wir anders ausprobiert.
Und dann, ja, das ist halt das
Problem, wenn du halt das so was ausprobierst,
auf Systemen, die auch heterogen sind und
ein bisschen chaotisch reagieren und du weißt nicht genau,
was muss man da jetzt eigentlich genau tun.
Und das ist schon, glaube ich, nicht so einfach.
Ja, aber noch schlimmer ist es, wenn man das System
selbst beeinflusst durch die Vorhersage. Also das klassische
Ich kann Aktienkurse vorhersagen
und es gibt immer irgendwelche Leute, die
irgendeine neue Methode entwickeln, um
Aktienkurse vorherzusagen.
Du musst das nur gut verkaufen und die antityklische Strategie fahren.
Ja, oder
beziehungsweise der Problem ist, wenn sie
die dann veröffentlichen,
dann funktioniert es plötzlich nicht mehr.
Ja, genau.
Das ist doch super, dann kannst du antityklisch fahren,
wenn du sowas raushaust.
Du darfst es halt nicht veröffentlichen.
Ja.
Das ist, ja.
Ja, schon interessant.
Ja, ich finde das halt sehr, sehr spannend,
wenn man irgendwie so Sachen digitalisiert,
welche Parameter man überhaupt in diese Modelle einbauen müsste
und wie man es schafft, so Reagenzglas-Bedingungen,
selbst wenn es jetzt nur, in Anführungszeichen,
so ein Glas mit einer Kultur auf einem Fensterbrett in der Sonne ist.
Hui.
Wobei, da musst du sagen, also ich bin auch eher die,
es gibt zwei Spezies der Modellierung,
Arten der Modellierung.
Der erste ist der Ansatz, wir wollen es wirklich
möglichst exakt und so weiter hinbiegen,
um wirklich die genaue, perfekte
Vorhersage für dieses Glas auf der Fensterbank zu treffen.
Der andere Ansatz ist,
okay, wir können
das eh nicht,
sondern die Frage ist, okay, wir sehen
dieses Phänomen oder sowas, oder was sind die minimalen
Sachen, die wir brauchen, um dieses Phänomen zu kriegen?
Also das, was ich eben beschrieben habe, was ist das
minimale System, was uns sowas produziert,
wie einen epileptischen Anfall oder irgendwas?
um daraus irgendwie zu verstehen,
was sind eigentlich die Zutaten, die ich brauche.
Und ich gehöre eher zu der letzten Spezies,
weil ich denke, ja, man kriegt eher interessantere Erkenntnisse
und es ist in vielen Fällen auch wahrscheinlich der gesündere Ansatz.
Sozusagen, weil man da dann immer weiß,
was man eigentlich getan hat sozusagen.
Und das bei Phänomenen, die man beobachtet,
da sieht man halt nur, was man halt sieht.
Aber man weiß, was passiert.
Ja, man kann es auch im Zweifelsfall einfach mal machen.
Also ich mache mir gar nicht die Illusion,
das Gehirn komplett zu simulieren zu können.
Das kann ich nicht, das kann niemand.
Und es gibt ja jetzt gewisse Projekte,
aber ja, ich mache mir diese Illusion gar nicht,
aber ich mache mir, eventuell kriege ich es hin,
einen Teil davon, mal ein Konzept zu verstehen,
welche Auswirkungen gewisse Strukturen haben.
Oder ja, das ist so die größte Hoffnung da.
Ja, aber wie ist das eigentlich mit dem Wissenschaftsbetrieb und der Digitalisierung? Das ist jetzt alles inzwischen, ich meine, im Grunde sollte man ja annehmen, wenn das Steuergelder sind und eigentlich ja schon auch irgendwie so gemeinwohlmäßig ausgerichtet sein sollte oder allen zugänglich sein sollte, vielleicht zumindest die, die das bezahlt haben, dass dann halt irgendwie alle Forschungsergebnisse digital veröffentlicht werden und dass das halt irgendwie, ja,
Keine Ahnung, ich könnte mir das so vorstellen, dass halt die Wissenschaft so ein bisschen funktioniert wie so eine große freie Software-Community oder so, aber real existieren das so ein bisschen anders.
Ja, also ich meine, man kann mittlerweile sagen, dass ein Großteil der wissenschaftlichen Software, zumindest in den Bereichen, in denen ich unterwegs bin, zum Glück frei ist, also auch frei verfügbar und die Leute sich das zunutze gemacht haben.
Und mein großer Vorteil ist, kein Mensch hat
irgendwas davon, ich habe nichts davon gehabt,
ich würde nichts davon haben, meine Software zu verkaufen.
Ich habe was davon, dass ich ein Paper über
meine Software schreibe,
Leute das zitieren und
falls ihr das schon mal gehört habt, Zitate sind
die wissenschaftliche Währung und
das nützt dann eventuell, um meine Karriere voranzubringen.
Das ist schon mal
gut, aber auch da gibt es noch
Bereiche, wo es Leute gibt, die
ihre Software zwar
gerne allen zur Verfügung stellen, aber schreibt
mir bitte vor eine E-Mail und dann kriegt ihr die zugeschickt
und zitiert mich bitte natürlich.
So
komplett irre Sachen zum Teil,
dass es einfach extrem schwierig ist,
da an sinnvolle Sachen ranzukommen.
Und auch,
ja, die Sachen, also ja,
es ist digital, aber ist es
vernünftig digital?
Und
das ist ja nur die Software-Ebene.
Du hast noch die ganzen Formulare dazu, das kommt heiler oft dann noch dazu.
Ja, nee, also
Software ist die eine Sache,
der Software-Ebene
funktionieren
die Teile der Wissenschaft vielleicht doch eher so wie eine
große freie
Software-Community? Ja,
kann man so sagen.
Es ist vielleicht nicht sehr wohl organisiert und durchdacht
und so weiter. Es wäre gut, wenn die Leute
vielleicht mal ein bisschen Ahnung davon hatten, wie man eigentlich Software baut.
Statt nur programmieren zu können,
so ein bisschen.
Auf der anderen Seite, wenn jetzt die eigentliche Wissenschaft,
also die Wissenschaft, wenn man jetzt um die Erkenntnisse
in der Wissenschaft
der Wissenschaft redet, ist es immer noch ein sehr
großes, ja, mein Sandförmchen,
dein Sandförmchen und
großer Neid, dass man
versucht, die eigenen Erkenntnisse
möglichst, die eigenen Daten
möglichst auszuschlachten und all solche Sachen.
Hängt so ein bisschen vom Feld ab, also
gerade die Mathematik, Informatik,
Physik sind da so ein bisschen besser, aber
jetzt bin ich in der Biologie so ein bisschen
und ja, da ist es
immer noch,
ja, da geht es
Ja, auch wirklich darum, okay, ich habe diese Daten
und wenn ich diese Daten habe, dann bin ich,
ja, dann muss ich damit alles Mögliche
machen, möglichst auf einmal und das
große eine Ding landen,
sonst funktioniert
das nicht oder funktioniert es nicht für die Karriere.
Also leider ist es wahrscheinlich auch richtig,
dass es nur
so geht, was
natürlich dämlich ist.
Obwohl aus der Physik habe ich das auch manchmal gehört,
dass da die Leute dann in Vorträgen
sitzen und Fotos machen von dem
Experiment gehabt, sodass sie dann
die ersten Theoretiker sein konnten, die dann die Theorie dazu
zu einem Experiment oder so irgendwie
Ja gut, aber dann machen sie
zumindest nicht den Vortragenden den
Ja, ja, ja, das ist, ja
Also natürlich, das gibt es in allen Bereichen
wahrscheinlich irgendwo, das wird man nicht vermeiden können, aber
es gibt da schon große Unterschiede
Also in der, gerade in der Physik und Mathematik gibt es ja
diese Preprint-Kultur, also
muss jetzt vielleicht für die Leute, die es nicht kennen, sagen
In der Wissenschaft
zählen hauptsächlich
so
sogenannte peer-reviewte Veröffentlichung,
also Veröffentlichungen, die andere Wissenschaftler
für einigermaßen gut befunden
haben. Das ist ein gewisser Prozess. Dieser Prozess
dauert
in einigen Feldern oder Fächern
und je nachdem, was man macht, bis zu Jahre.
Also vom Einreichen
des fertigen Manuskripts bis zur
Veröffentlichung. Und in der
Zeit kann natürlich alles Mögliche passieren und andere
Leute können das Gleiche erfinden und so weiter und so fort.
Und da gibt es zumindest, gerade
in Mathe, Physik, Informatik und so weiter,
die Kultur,
dass man sagt, okay, wir haben das Preprint-Server,
das bekannteste ist das Archive,
wo man sagt, okay,
ich reiche das jetzt ein und gleichzeitig
stelle ich das schon mal frei zur Verfügung und
das Journal, bei dem ich das einreiche,
ist auch, kann damit
leben, dass ich das frei zur Verfügung stelle und
sagt mir, nee, das hast du schon veröffentlicht, machen wir nicht.
Und ja, das ist
so langsam im Kommen, jetzt auch
in der Biologie, das ist
auch definitiv gut und
das führt eigentlich auch so ein bisschen dazu, dass dieses,
dass man die Sachen wirklich direkt
nutzen kann. Aber
andererseits in der Biologie dauert es halt auch einfach immer noch
ewig, bevor man die Sachen überhaupt veröffentlicht.
Und ja,
egal, aber das ist jetzt vielleicht auch nicht so.
Ja, du hast noch ein paar
Teptermarks, glaube ich, unterlassen.
Ja, das kann sein.
Das war so eine spannende Geschichte.
Was fällt euch noch dazu ein?
Habt ihr noch was zu dem Thema zu erzählen?
Ich kann auch was erzählen.
Was Publikationen angeht.
Genau, da haben wir noch gar nicht drüber gesprochen.
Wie gesagt, ich habe eine wissenschaftliche Software
geschrieben, okay, so weit so furchtbar.
Das Hauptproblem ist natürlich jetzt, ich möchte auch
weiterhin als Wissenschaftler bezahlt werden und das
heißt, ich muss zitiert werden, wie ich gerade schon
gesagt habe und dazu muss ich das Ganze veröffentlichen.
Andersrum, Veröffentlichung
und Zitate sind Geld, also muss ich
veröffentlichen.
Und ja, die meisten
Veröffentlichungen in der Wissenschaft sind natürlich immer noch
über eigentliche Forschung oder klassische
Forschung und ich habe irgendwas herausgefunden.
Hier ist es und nicht, ich habe
hier eine neue Software geschrieben, die ich ihr erlaubt,
das zu machen.
Das war's.
Und
ja, diesen Prozess
habe ich durchlaufen. Ich habe ihn erfolgreich durchlaufen. Ich habe es
geschafft, dieses Paper zu veröffentlichen.
Es war aber zum Teil sehr interessant.
Ja, wo fange ich mal an?
Höflich formuliert. Ja, höflich formuliert,
genau. Also der erste Schritt ist
erstmal, dass man ein Journal finden muss,
was überhaupt sagt, okay, ich akzeptiere,
wir akzeptieren solche Veröffentlichungen,
wir finden das gut.
Der zweite Schritt ist dann zu sagen,
ein Journal, bei dem Journal auch,
ja, etwas, natürlich das Ganze zusammenzuschreiben,
was übrigens, also für die Leute,
jetzt wirklich für die Wissenschaftler
und den Zuhörern bedeutend einfacher war,
als klassische Forschungsarbeit zusammenzuschreiben.
Ukulele.
Ja.
Und ja, dann gab es, wie gesagt, diesen Peer-Review-Prozess, das heißt auch dieses Manuskript ging an andere Forscher, die dann sagen sollten, ist das schön oder nicht oder gut oder nicht.
Und da hat dann erstmal einer der Reviewer, die nebenbei anonym sind, also ich weiß nicht, wer es war, gesagt, ja, das ist ja alles schön und gut, das ist auch besonders interessant für diese spezifische wissenschaftliche Community, aber das ist ja so irgendwie eigentlich kein richtiges Paper, also lehne ich es ab.
Obwohl das Journal sagt, genau solche Dinge
würden wir auch gerne haben.
Und ja, ich weiß nicht genau, was da schiefgelaufen
ist, ob das Journal dem Reviewer nicht gesagt hat,
okay, guck mal, das ist okay, oder
ob der Reviewer es nicht verstanden hat, oder
ja, es war auf jeden Fall
ganz komisch, also am Ende bin ich hingegangen und hab,
also man sagt dann natürlich nicht, okay,
ich akzeptiere das, ich werde abgelehnt worden, ich gehe woanders hin
oder so,
sondern
man
kann dann
erst mal das Ganze erwidern
und sagen, ja, du sagst, mein Paper
ist doof, aber ich sage, es ist gut, weil.
Und ja,
mein Argument bestand dann daraus,
dieses Urteil
von diesem Reviewer, der halt
gesagt hat, ja, es ist relevant für die Community,
neben die Kriterien vom Journal zu
stellen, dass er gesagt hat, ja, wir akzeptieren solche
Paper, wenn. Und dann kam im Prinzip
fast genau das Gleiche, was
der Reviewer dann gesagt hat.
Und am Ende
hat es dann auch ohne große Probleme geklappt,
aber es war irgendwie schon lustig.
Dann kommt das nächste Problem, also wenn man das alles
geschafft hat, also wenn quasi
die Wissenschaftler sagen, das ist okay, dann muss das
noch
in eine druckbare Form gebracht werden,
was sich jetzt erstmal ein bisschen albern
anhört, denn ja gut, wir sind jetzt hier
in der Physik, Mathematik und ähnlichem, da sprechen
alle Leute latech und
können in der Regel selbst sehr
gute Sachen produzieren,
die man auch drucken kann,
aber ja, einige
Wobei, kurze
Abschweifung, ich glaube für diese
Physics Review Letters oder so,
das ist ganz wichtig in der Physik, da
gibt es ein Word Template, das man benutzen muss,
die... Nein, ziemlich sicher nicht.
Also für Physical Review Letters
kann man definitiv auch Technik einreichen.
Und auch, also es geht
mittlerweile, es ist sehr weit verbreitet, man kann
Latex einreichen, die Fahrerzeit wird es eins zu eins
verwendet. Also
das Einreichen ist die eine Geschichte,
Die andere Sache ist, was macht das Journal
dann, was machen am Ende die Schriftsetzer damit?
Sie könnten natürlich, also im Prinzip könnte man
eigentlich hinsehen, wir haben einen Standardstil und den
wenden wir einfach an und dann brauchen wir gar keine Schriftsetzer
mehr. Das ist aber nicht der Fall
in den meisten Journalen,
zumindest in meinem Feld. Und das heißt,
irgendein Schriftsetzer hatte dann zum ersten Mal
in seinem Leben Computercode vor sich
und musste den
setzen. Oh, diese blöden
tabulatorischen Eindrückungen, das sieht aber doof
aus. Ja,
Also, das würde ja noch
gehen.
Also, ja, das wäre auch ein Problem,
aber, also ja,
der Code war an verschiedenen Eindrückungsebenen,
unterschiedliche Codeblöcke waren an unterschiedlichen
Eindrückungsebenen. Ja, das war auch ein Problem,
aber das war nur der Anfang. Das hätte man noch
über, oder darüber hätte man noch hinwegsehen können.
Da gab es auch zum Beispiel, also, was
nach so drei Iterationen,
also, ich habe
ein,
das Resultat der Schriftsätze bekommen,
ich habe gesagt, nee, das geht so nicht, die haben
was Neues versucht, ich habe es bekommen, ich habe gesagt, nee, das geht so nicht
und so weiter und so fort. Nach drei Iterationen
hatte ich ungefähr raus, was da eigentlich
vor sich geht. Und zwar haben die
versucht, meinen Code wie
Formeln zu interpretieren und den
nach Formelregeln gesetzt.
Und Formeln gibt es halt zum Beispiel solche,
also für den Formelsatz gab es die Regel, wenn
die erste, die innerste Klammer,
die man macht, ist rund,
die nächste Klammer ist eckig und danach
kommt geschweift.
Das haben die auch radikal
auf den, ja, das ist
eine Form, in der es sagt, okay, kann man drüber streiten,
ja, das haben die aber radikal auf den Code
angewendet. Tja.
Und wenn dann, dann steht halt Sinus,
eckige Klammer auf, F von I,
eckige Klammer zu.
Ja.
Ja, das, ähm.
Das wäre jetzt, das wäre jetzt natürlich dann auch wieder
irgendwie eine Anwendung für, für, äh,
CodeGolf, ob man das dann so transformieren
könnte, dass es, äh, irgendwie
am Schluss hat man dann halt noch so ein kleines CodeGolf-Ding,
dass das eine wieder in die andere Form übersetzt
sodass es halt dann irgendwie ausführbar wird.
Oh, ich mache eine Exkursion.
Ist das, glaube ich, okay?
Das war jetzt nicht Code Golf,
aber so eine Programmieraufgabe.
Ich versuche es jetzt gerade aus dem Gedächtnis zu reproduzieren.
Sagen wir es so wie A, Klammer auf, B plus C,
gleich, gleich, A, B plus B, C.
Also das Assoziativgesetz.
Und zwar hingeschrieben, so wie man es auf Papier schreiben würde.
Das heißt, ohne Malzeichen.
so, also man hat jetzt
diesen Code, das könnte man ja in Python machen
und die Aufgabe ist jetzt
davor etwas zu machen, dass
dieser, dass das wahr ergibt
man darf, ja, ich glaube mit der Bedingung, dass
man ja A und B nicht einfach
durch Nullen ersetzen darf oder so
und ja, also
mein Ansatz dafür, es war leider
nicht der schnellste oder der kürzeste
war, dass man sagt, okay, wir machen
erstmal A, B und C zu Symbolen,
dann funktioniert schon mal symbolisches Rechnen, also mit Zympai.
Und dann
überschreiben wir noch für A,
oder fügen wir A, ein
Call-Funktion hinzu,
machen die Call-Methode für A
und sagen halt, dass sie das
macht, was dann rechnisch rauskommen müsste.
Das heißt, dieses A Klammer auf B plus C
würde wie ein Funktionsaufruf ähnlich
interpretiert werden und dann funktionierte das.
Was auch eine sehr schöne
Sache in Python ist, wenn man das einfach mal
weiß, dass man einfach alle Operatoren irgendwie
beliebig definieren kann, wenn man möchte.
Und das auch für sehr viele Sachen nutzen
kann. Ja.
Und eben, um die Historie zu lösen.
Plus mit Ohr überschreiben
oder sowas, hast du auch ein True, wenn du ein Bohl draufwirfst.
Wenn du das
Pluszeichen mit einem Ohr überschreibst
oder sowas, also
dann könnte das vielleicht funktionieren.
Ja.
Ich glaube, es musste
für eine, man durfte irgendwie A, B und C nicht überschreiben.
Ich müsste es nochmal raussuchen, was genau die...
deswegen das Plus hier und dann den
Bolian draufwerfen, dann stimmt das schon.
Ja.
Ja gut. Ja, ja. Ne, also ich hatte dann
sehr viel Spaß mit den Schriftsetzern eben, um
Ja, das ist auf jeden Fall schön.
An die Klammern anpassen, Einrückungsebenen
entfernen. Ja, genau. Sie haben auch irgendwie
den Unterstrich per Hand gezeichnet, das heißt, wenn man den Code
kopiert hat, war der Unterstrich plötzlich weg,
weil es irgendwie kein Unterstrich war. Das Bild war
innerhalb von dem PDF dann
nicht mehr Text.
Genau, es war Text
und anstatt des Unterstrichs, die auch irgendwie
unterschiedlich lang war, war da halt ein Leerzeichen
und da war eine Linie.
Also so per Hand
reingehend sein.
So ein Zeichenobjekt.
Aber wenn man den Text kopiert hat, war das halt nicht da.
Dann hat jemand die Taste auf der Tastatur nicht gefunden.
Dann wurden die auch schön typografische
Anführungszeichen im Code.
Sieht einfach viel besser aus.
Ja, ich meine, es sieht tatsächlich
viel besser aus, es funktioniert leider halt auch nicht.
Aber gut,
da kann ich jetzt...
Ja, aber das ist, ich meine,
das ist halt, gut, das ist wahrscheinlich
eben in der, je nach Community so unterschiedlich,
weil jetzt so was in der Informatik oder so,
da Pseudocode wird ja schon
oft in Papers auch reingeschrieben, ne, aber
Naja, ich war
halt, das war, was heißt leider,
ich meine, es war ja, es gab
Sinn, dass ich mich in einer
Community gewandert habe, die das nicht macht und
die haben irgendwie so
ein solches Paper pro Jahr
und ja, das ist
nicht viel.
Naja, aber das ist, also
ich weiß nicht, diese ganze Publikationspraxis, dass man
halt Dinge halt nur publizieren
kann, oder ich meine, in der Informatik ist es halt auch
so, dass, oder
ich meine, es gibt Ausnahmen, aber überwiegend zu
der Zeit, wo ich viel Papers gelesen habe, war es halt so,
dass die Leute,
naja,
also, dass man eigentlich nur
mathematische Sachen veröffentlichen
konnte, also Code und so, eigentlich eher nicht.
Man kommt an den Code auf Anfrage
dann immer ran, wenn man Leute einschreibt.
aber ist es halt nicht Teil
der Veröffentlichung und
dann war halt, also ich meine
es führt halt auch so ein bisschen dazu
quasi, dass man
da das eh niemand, ich meine an dem Paper
ob das jetzt stimmt oder nicht, kann man
den Paper halt nicht mehr ansehen, also wenn man nur das überprüft
dann weiß man überhaupt nicht, ob das jetzt funktioniert
oder nicht und
wir haben dann halt da auch teilweise versucht Sachen
ja halt
sozusagen
zu reproduzieren und die Quote
der Sachen
die so wirklich überhaupt gar nicht, also manchmal
kann man vielleicht auch Sachen nicht richtig reproduzieren,
weil man es nicht verstanden hat oder selber zu blöd ist,
es hinzukriegen oder so. Aber manchmal ist es
relativ offensichtlich, dass das nie funktioniert haben
kann und die Quote von den Sachen
war recht hoch. Also das war schon
erschreckend. Und dann denkt man sich so schon, okay,
ja, und das waren alles
ordentlich peer-reviewte Sachen, die durchgegangen
sind, die irgendwo veröffentlicht wurden und so. Also
ja.
Ja. Aber da muss
man sagen, die Informatik hat es noch gut, wenn man einfach
zu sagen, okay, ich habe hier das, man könnte
zumindest mal hingehen und diesen Standard einführen,
es gibt ja auch Tendenzen in die Richtung zum Glück,
dass man sagt, okay, hier ist jetzt bitte die Software,
ein Programm, was das macht und wenn ich das ausführe,
dann kommt das halt raus.
Und das Programm ist verständlich, dann kommt das raus.
Mit anderen experimentellen Sachen
geht das nicht.
Du kannst halt eben nicht einfach mal ein Jahr
ins Labor setzen, da rumpipitieren und
welche Bakterien wachsen lassen
und gucken, ob das gleiche rauskommt.
Also kann man schon,
das ist aber deutlich schwieriger.
Stimmt, ja. Bei anderen ist es noch viel übler.
Oder halt so, oh,
das war jetzt das Land.
Was machen wir jetzt?
Wie viele Länder haben wir denn noch?
Welche haben noch nie etwas von uns
gehört in unseren bisherigen Ergebnissen?
Wir lassen das Modell einfach nochmal rechnen.
Ja, dann haben wir ein paar so Programme eingeführt.
Das musste man dann so machen.
Sie haben dann tatsächlich das Modell nicht geändert.
Sie haben dann davon überzeugt, das Modell war richtig.
Nur die Umstände waren falsch.
Doch, zwei oder drei andere Projekte, die auch nicht funktionieren.
Also ja, da war ein bisschen Resistenzgang
gegen gute...
Ja, das ist halt so, wenn man einmal weiß, dass man richtig liegt.
Ich meine, dann muss man einfach nur das häufig genug probieren
und irgendwann wird es schon funktionieren.
So viel zählt das doch, oder?
Ja, ja.
SAP war das, das Structural Adjustment Program.
Tja.
Ja, ja.
Aber sozusagen,
also ich weiß nicht, wie arbeitest du
üblicherweise? Also in Notebooks
oder eher
Ich versuche mir
mittlerweile angewöhnt, so ein bisschen anzugewöhnt
in Notebooks zu arbeiten, einfach weil es gerade für
wenn man mit Plots zusammenarbeitet
Es ist halt irgendwie einfach, ja
Ganz praktisch. Also ich muss dazu sagen, ich komme
ursprünglich, ich bin
habe sehr früh genug Plot
gelernt und das auch
was jetzt ein Plotting-Programm
ist, was nichts mit Python zu tun hat
weil es eine eigene Programmiersprache ist und
bin damit
sehr zufrieden gewesen und beziehungsweise bin auch in der Lage
gewesen, alles zu machen, ich kannte einfach alle Kniffe
und hab mich deswegen sehr lange
geweigert auf
Python-Plots umzustellen,
was natürlich gewisse Vorteile hat,
da man eben nicht erstmal die Programmiersprache
wechseln muss, um was zu plotten und nicht erstmal
ein Interface schreiben muss und so weiter und so fort.
Insofern, ja,
hink ich da so ein bisschen hinterher,
denke ich, aber mittlerweile, ja,
ist mein, also
ich schreibe die meisten, oder Sachen,
die ich mehrfach verwende, definitiv ganz normal
mit
meiner
Entwicklungsumgebung, die da Unix heißt.
Also Text-Editor und Konsole und was auch immer.
Genau, was für ein Editor bist du?
Ich nutze
NeoWim.
Und
dann, wenn die Sachen einigermaßen
stehen und es wirklich nur darum geht,
entweder schöne Plots zu produzieren
oder rumzuspielen
in dem, was man jetzt an Simulationen geschrieben
hat, dann wechsle
ich mittlerweile dann auch doch mal ins Notebook.
Andererseits, also wenn es jetzt wirklich darum geht,
Software zu schreiben, die andere nutzen sollen,
findet das immer noch,
ja, was heißt, findet das nicht im Notebook statt,
aber dafür ist es, glaube ich, auch nicht gemacht.
Ja, ja, das ist auch
etwas, was man jetzt immer zunehmend hört, dass
Leute das halt benutzen und
ja, ich finde es eigentlich relativ
einleuchtend, dass das jetzt sich so
durchsetzt. Was ich halt noch schade finde,
ist, dass es irgendwie noch immer keine so richtig
schöne,
schön bedienbare
oder intuitive Plot-Umgebung
irgendwie überhaupt gibt.
Also es gibt ja so ein paar,
die hast du bestimmt schon alle ausprobiert.
Du hast ja selber schon gesagt,
Alter ihr oder sowas. Mal reingeschaut
für Python. Ich glaube, das ist für
Scientific-Sachen gar nicht so verkehrt. Gerade für
so statistische Plotting nochmal.
Habe ich aber selber auch noch nicht so viel benutzt.
Vielleicht muss ich da auch nochmal reingucken.
Mich stört halt noch
dieses, ich glaube, es wurde mal
Plotting by Side-Effect genannt von
Mudplotlib.
Ja, das stimmt.
Also wahrscheinlich, genau. Vielleicht gibt es
mittlerweile, aber ich meine,
ich habe noch nichts davon gehört, dass irgendwas
eben die ganze,
das ganze Repertoire mitbringt, was man
eben auch braucht. Ich möchte halt,
das Hauptproblem ist, wenn ich jetzt irgendeine
Plotting-Sprache lerne oder irgendein Plotting-Interface
lerne oder was auch immer, möchte ich, dass es
wirklich alles kann.
Irgendwann werde ich dazu kommen, dass ich das brauche,
dass ich dieses Detail einstellen muss und wenn ich das
nicht kann. Plotly Express, das ist, glaube ich, noch ganz nett.
Und das
heißt, das ist so ein bisschen auch
ein Problem, dass natürlich normalerweise
kann man irgendwie ein kleines Tool schreiben
und dann wird das immer größer und so weiter, aber
gerade bei Plot-Sachen,
man muss eigentlich schon mit etwas anfangen, was fast
alles kann, bevor man irgendwie eine Chance
hat, was anderes sich durchzusetzen.
Ja, es gibt da, ich weiß nicht,
inwiefern Gnuplot das auch
übernommen hat, es gab ja dieses sehr einflussreiche
Wo, obwohl das ist glaube ich gar nicht so
furchtbar alt, Grammar of
Graphics irgendwie
und unter R
hat man ja mit ggplot2 irgendwie da so eine
Umsetzung von im Grunde
und das ist eigentlich ja schon sehr nett, aber ich
fürchte auch, in Python gibt es da nichts, was
irgendwie
es gibt
irgendwie Adaptionen davon
in Python, aber ob das jetzt
wirklich genauso gut ist, weiß ich auch nicht und
es ist immer noch aktiv irgendwie unter Entwicklung
furchtbar schlecht ist, Matplotlib auch nicht.
Nee, nee, es ist
irgendwie, ich möchte jetzt
einfach mal eine Parabel plotten.
Und jetzt,
sowas wie Gnuplot, was eine
rein plot-orientierte Programmiersprache ist,
ist das eine Zeile.
Und ja, Matplot muss ich,
ich weiß gar nicht, wie ich das
am schnellsten hinbekommen würde.
Dotplot?
Ja, den müssen wir schon ein bisschen rumbasteln, glaube ich, aber
wenn du es einmal definiert hast,
Also ich glaube wahrscheinlich, wenn mir irgendjemand
einfach für fünf Jahre Geld geben sollte oder so,
würde ich mich daran setzen, dass
ein komplett neuer Nightmare Day sieht.
Cool.
Ja, wir haben noch
den Lieblingspick natürlich,
der Pick der Folge oder sowas.
Was wäre denn deine Wahl,
dein bester Pick für Alt-Weißen-Modul?
Ich glaube, eigene Module sind wahrscheinlich
ausgeschlossen.
Wenn du so dein eigenes Modul da
ein bisschen umschmachst.
Also. Jetzt musst du das aber kurz
erzählen, was ist denn dein eigenes Modul?
Nee, nee, nee, mach ich nicht.
Ich hab ja auch schon die ganze Zeit drüber geredet.
ja, ich glaube also, das Lieblingsmodul
ist wahrscheinlich immer noch NumPy, weil es einfach
enorm
mächtig die Sachen
bringt, die
gerade, ja,
in Rechen von großen
Datenmengen und auch ansatzweise
also nicht mal sehr großen Datenmengen,
aber auch kleineren Datenmengen
Dinge hinbringt, die
Standard Python nicht hat und
das, ja, ich kann mir
glaube ich kaum, es gibt
sehr wenige Fälle, wo ich es nicht importiere.
Und was
wäre denn Pick der Woche?
Ist das auch ein Pie, oder?
Was ist der Pick der Woche? Ich weiß es auch nicht.
Dann müssen wir doch eigentlich eine wöchentliche Sendung machen.
Ja, ja, fast.
Ja, aber ich würde mir so eine kleine Kategorie einführen.
Pick der Folge oder sowas.
Also was
macht es für mich zum Pick der Folge? Das ist das, was ich diese
Woche genutzt habe oder was ich diese Woche neu gelernt habe.
Ja, oder vielleicht irgendwas Aktuelles. Das wäre
was, was in letzter Zeit als cool aufgefallen ist.
Das wusste ich gar nicht. Aktuell kann doch was ganz Altes sein.
Einfach was nochmal so. Irgendwas Neues.
Was soll es der Standard-Tipp sein?
Ihr stellt Fragen.
Deshalb kann ich mir doch schon mal überlegen.
Ja, ich habe nämlich auch noch nicht dran gedacht.
Also, was ich neulich zum ersten Mal
verwendet habe, was ich
und was ich dann wieder nicht
verwendet habe, weil es mich dann doch nicht glücklich gemacht hat,
war Name-Touple. Ich habe aber gehört, es gibt
jetzt Dataclasses
und muss mich dazu unbedingt einlesen.
Ja. Kann wenig dazu sagen,
aber es ist
wahrscheinlich genau das, was ich
Ja, ich glaube schon.
Ja, beziehungsweise es gibt halt für ältere Python-Versionen
auch ein Modul,
das man einfach so installieren kann. Also es ist jetzt natürlich in der
Standard-Bibliothek mit drin oder beziehungsweise
in Python selber, aber
das
Ding heißt Atris oder so
und das kann sogar noch deutlich
mehr als die
Dataclasses. Aber ich glaube auch, dass
das Dataclasses, da gab es auch die letzten paar
DDF-Treffen
und Talks zu, wo halt auch von der
Geschwindigkeit wurde gesagt, das ist halt
deutlich besser als Name-Toppel und so.
Im Grunde gibt es
keinen wirklich tollen Grund mehr,
außer man braucht jetzt die Indizierbarkeit oder so
noch Name-Toppel zu verwenden,
weil man das mit Dataclasses oder Atos halt
deutlich besser hinkriegt.
Ja,
das ist auf jeden Fall eine interessante Geschichte.
Und dein Weg auch?
Ja, ich würde tatsächlich,
also was ich in letzter Zeit noch mal
angeguckt habe aus
unterschiedlichen Gründen und dann doch wieder
gar nicht so schlecht fand, ist
Django Guardian.
Ist halt weg mit Entwicklung, was völlig
anderes.
Ich kann nicht mitreden.
Also da geht's
einfach darum, dass man halt häufig das Problem
hat, dass man Berechtigungen
verwalten möchte auf
bestimmte
Zeilen in der Datenbank und
auf Tabellenebene gibt es das in Django schon
eingebaut, dass man da halt Berechtigungen vergeben kann
und dann halt auch diese Berechtigung
benutzen kann, um irgendwie Zugriff darauf zu
regeln, aber
für Objekte,
Einzelobjekte oder Zeilen
geht das halt nicht und Django
Guardian erweitert halt das Django Permissions
Modell darum, dass das halt dann doch geht,
indem da zwei zusätzliche Tabellen
eingeführt werden, das, ja, der rammt sich dann
relativ wüst aus, wenn man das macht, aber es ist
also man denkt zuerst, das kann nicht gehen oder das ist halt
furchtbar, aber nee, es funktioniert tatsächlich
und zwar sieht es ziemlich gut aus.
Und ja, genau, also
wenn man dieses Problem hat, sollte man sich vielleicht
das mal genauer angucken, weil das sieht
doch nach einer halbwegs vernünftigen Lösung aus.
Cool, kann man so permission in dem Webtoon
lösen, dass irgendwie jeder darauf
zugreifen kann, was er will. Ja, ich picke
Bandit, das habe ich irgendwie zwischendurch
entdeckt, das ist so ein Anfänger, glaube ich,
Security-Hinweis, was so alles
sicherheitsrelevant sein könnte in dem Code,
wenn man so einen Python geschrieben hat.
Da habe ich noch eine Sache, die mich überhaupt nicht interessiert.
Nicht ganz viel
zu machen, das ist auch nicht so, glaube ich,
so ganz tiefgehend, aber so für die ersten Sachen, dass man so ein bisschen
was versteht, was man da tut, fand ich das ganz spannend.
Erst mal so reinzugucken.
Ja, cool.
Ich weiß nicht, haben wir noch irgendwas?
Ja, das Wissenschaftler muss ja auch nicht.
Das ist ja ein bisschen einem geschlossen.
Ich kann noch was erzählen.
Ich kann auch noch was erzählen.
Wahrscheinlich, wenn ihr mich lasst,
rede ich einfach fünf Stunden lang.
Ja, richtig schlecht.
Aber vielleicht noch eine lustige Sache zum Thema,
was kann man alles, ich glaube, ich habe mein Mikrofon
vorgestellt, sorry. Kann das sein, dass ich
irgendwie lauter bin oder so?
Okay, gut.
Genau, was ich auch noch gemacht
habe, was vielleicht so,
weil es jetzt furchtbar schwer zu erklären sein wird, ist,
ich habe mich ja auch mit der Frage
beschäftigt, also wir bauen Ökosystemmodelle,
habe ich ja schon geredet, und
irgendwann bin ich auf die Frage gekommen,
wie macht man das eigentlich
richtig, beziehungsweise
wir sind auf ein Problem
gestoßen mit einem Modell,
dass wenn ich jetzt, ich habe meine Spezies,
die da irgendwas machen, also von
Tieren oder Bakterien oder was auch immer
und es ist keines passiert,
also nehmen wir mal an, wir haben Elefanten und Giraffen
und was auch immer, was da einfach hervorzustellen ist
und
jetzt
mein Modell sagt immer, eine Spezies
ist eine Variable, also
die Menge an
Individuen einer Spezies.
Und darauf
baue ich ein ganzes Modell auf und
einfach, weil ich diese
Vereinfachung, die ich mache, dass ich sage,
alle Elefanten sind gleich,
alle Giraffen sind gleich.
Und ja,
eine Sache, die wir dann festgestellt haben,
ist, dass gewisse Modelle die Eigenschaften haben,
dass wenn ich jetzt irgendwie aus Versehen
es nicht hinkriege, alle Elefanten korrekt
in einer Spezies zuzuordnen,
angenommen, die Hälfte davon sind blau und rot
angemalt. Nashörner.
Ja, nee, also Nashörner auch,
aber eigentlich sind es wirklich alles Elefanten. Sie haben genau die
gleichen Eigenschaften, es sind nur die Hälfte von denen sind halt rot.
Oder rosa. Nehmen wir rosa Elefanten.
Ist immer gut, über rosa Elefanten zu reden.
Und dann haben wir festgestellt, dass gewisse Modelle
dann andere Ergebnisse produzieren,
wenn wir das machen. Also wenn wir irgendwie
eine Spezies nehmen und die aufteilen
künstlich.
Was nicht gut ist, denn ich möchte
natürlich, dass ein Modell, wenn ich
dieselbe Situation zweimal beschreibe, da soll er auch
tun, ist dasselbe, rauskommen.
Und
okay, was hat das jetzt mit Python zu tun?
Ich bin dann irgendwann hingegangen
und habe, gut, wir haben festgestellt,
wir haben dieses Problem, jetzt mal verstehen, wann taucht dieses Problem
auf? Und dann habe ich mit
Python und SymPy automatisierte Tests
geschrieben für Modelle.
Das heißt,
ich konnte ihm einfach ein Modell geben, hatte einige
Rechnungen gemacht, hatte dann eben die Hälfte der Elefanten
blau angemalt und
mir automatisch gesagt, das ist jetzt ein gutes Modell
und das ist ein schlechtes Modell.
Das ist auch eine etwas
exotischere Sache, die ich dann mit Python
oder mit Genöst
habe, wo man auch sowas wie Sympa
eben benutzen kann, dass man solche Rechnungen
automatisieren kann, die man sonst
sonst würde ich wahrscheinlich heute noch da sitzen
und das Ganze auf dem Papier durchrechnen.
Dann stapeln sich dann die Blöcke irgendwann.
Ja.
Und ich habe jetzt
immer noch trotzdem einen Block nur
vollgeschrieben mit irgendwelchen Formeln.
Tja, aber ist denn dann sozusagen rausgekommen, woran das lag?
Oder ist das irgendwie, das liegt dann am Modell selber wahrscheinlich?
Ja, also am Ende habe ich eine Regel gefunden für Modelle, die genau das machen.
Das ist jetzt auch so gerade meine aktuelle Arbeit,
wo ich noch irgendwie gucken muss, dass ich das veröffentlicht kriege
oder beziehungsweise, dass die Leute das wertschätzen.
Und dann am Ende braucht man den Test nicht mehr.
Eigentlich wäre es natürlich lustig gewesen, wenn man sagt,
wir finden es nicht heraus, verdammt, scheiße.
aber hier ist eine Software, die euch diese Frage
annähernd beantwortet.
Hätte was für sich gehabt, aber nein, wir haben am Ende
eine Regel gefunden, wann genau es der Fall ist
und jetzt braucht man es dann nicht mehr,
aber natürlich hat es enorm geholfen,
irgendwie ein Gefühl dafür zu kriegen, wann das passiert
und unter welchen Bedingungen
und warum und
das erstmal so da ein bisschen rumzuspielen.
Das war irgendwie
eine Sache, wo ich dann
Zympa wirklich gelernt habe, wertzuschätzen.
Ja, aber würde ich sagen,
dann sind wir doch schon so quasi durch, ne?
Ja, ich würde auch sagen, dann sind wir doch mal tatsächlich durch.
Vielen Dank, dass du da warst, Gerrit.
Ja, Gerrit, vielen Dank, dass du da warst.
Ja, vielen Dank.
Hat mich auch gefreut, hier zu sein.
Einfach über mich selbst reden,
zwei Stunden lang, nein, nicht ganz.
Ja, ja.
Fast.
Ja, es scheint auch hier auch eine längere
Zeit. Und wir haben es tatsächlich geschafft,
ein bisschen wieder Luft. Der Wind ist gerade aufgekommen.
Vielleicht konnte ich erinnern, wenn wir es heute aufgenommen haben.
Ich bin sehr gespannt, wie das mit den, ja, also es ging nicht.
Wir mussten Ventilatoren aufstellen.
Nachdem wir in der letzten
Episode das Audio schon versaut haben.
Vielleicht können wir noch einen draufsetzen.
Nicht alle die Verzweiflung treiben
mit Ventilatoren-Geräusch, aber hoffentlich
wird das
irgendwie einer der
Post-Processing-Algorithmen
irgendwie magisch beseitigen.
Ja, wir werden sie sonst beschwert euch bei uns.
Ja, wisst ihr, ihr könnt immer E-Mails schreiben an
hallo-at-pison-podcast.de und
ihr könnt auch gerne kommentieren.
Auf der Webseite gibt es eine schöne Kommentarfunktion.
Ihr könnt uns überall abonnieren, wenn ihr gerade lustig
seid, bleibt uns gewogen, erzählt weiter, was es uns gibt.
Ja, wo ihr auch immer gerade seid,
was auch immer die Tageszeit ist, auch Tagesnachtzeit.
Stopp nicht an Hitzschlag.
Ja, bisschen warm.
Ja, wir hören uns.
Viel Spaß und bis später. Tschüss.