Meine Lokale KI namens „Draco“

Warum diese Hardware Draco trägt

Wenn man eine lokale KI bauen will, stellt sich irgendwann zwangsläufig die Frage:
Wo soll sie eigentlich laufen?

Nicht im Sinne von „was ist am billigsten“,
sondern: Was kann dauerhaft, stabil und kontrolliert denken?

Für mich war schnell klar:
Das Gehirn von Draco braucht keine Cloud, aber Substanz.


Warum Enterprise-Hardware?

Im Keller, im Serverrack, arbeitet ein HPE ProLiant DL380 Gen9.
Kein neues Gerät, kein Showpiece – sondern gebrauchte Enterprise-Hardware, die genau für das gebaut wurde, was hier gefragt ist: Dauerbetrieb.

Diese Maschinen wurden nicht dafür entworfen, leise im Wohnzimmer zu stehen oder gut auf Fotos auszusehen.
Sie wurden gebaut, um zu laufen. Und zu laufen. Und weiterzulaufen.

Genau das will ich für eine lokale KI.


Rechenleistung ohne Drama

Im Inneren arbeiten zwei Intel Xeon E5-2698 v3.
Viele Kerne, viele Threads, kein aggressives Boosting – dafür konstante Leistung.

Das ist wichtig, weil Draco nicht „explodieren“ muss, sondern verlässlich reagieren soll.
Spikes und Überraschungen sind nett für Benchmarks, aber Gift für Systeme, die man verstehen und kontrollieren will.


Gedächtnis statt Gedränge

Dazu kommen 256 GB ECC-RAM.

Nicht, weil es cool klingt,
sondern weil Speicher der Ort ist, an dem KI, Caches, Modelle und Kontext leben.

ECC ist hier kein Luxus, sondern Konsequenz:
Fehler werden korrigiert, bevor sie überhaupt sichtbar werden.
Stabilität beginnt im Detail.


Denken braucht Muskeln: GPU

Reine CPU-Power reicht für moderne KI nicht aus.
Deshalb steckt im System eine NVIDIA RTX A4000.

Keine Gaming-GPU, kein RGB, kein Overclocking – sondern Workstation-Hardware, gebaut für Rechenlasten, nicht für Show.

Die GPU ist hier kein Selbstzweck, sondern Werkzeug.
Sie übernimmt genau den Teil, den sie am besten kann: rechnen.

Eine zweite RTX A4000 ist bereits geplant – nicht aus Gier nach Leistung, sondern um Spielraum und Reserven zu schaffen.
Der Drache wächst lieber kontrolliert als hektisch.


Warum kein Mini-PC?

Die Frage kommt oft:
Reicht dafür nicht ein NUC, ein Mini-Server oder ein Einplatinenrechner?

Kurz: Nein.

Nicht, weil sie schlecht wären – sondern weil sie an Grenzen stoßen, die man erst merkt, wenn man sie überschreitet:

  • begrenzter Speicher
  • eingeschränkte Erweiterbarkeit
  • thermische Limits
  • wenig Fehlertoleranz

Für Tests okay. Für ein zentrales System nicht.


Der wichtigste Punkt

All diese Hardware hat eine Aufgabe:

Draco denken lassen. Mehr nicht.

Der Server entscheidet nichts im Alleingang.
Er schaltet nichts direkt.
Er greift auf nichts Reales zu.

Er ist der Kopf.
Nicht die Hand.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert