German-OCR-3

Deutsche Vision-OCR. Kompakt. Lokal. Open Source.
_{Aus deutschem Dokument-Bild → strikt validiertes JSON. In unter 60 Sekunden lokal lauffähig.}

👁 Site
👁 Ollama
👁 GitHub
👁 License: Apache 2.0
👁 Language
👁 Hallucination

⚡ At a glance

100 %

_{Gültiges JSON}

95 %

_{Sender korrekt}

0 %

_{Halluzination}

5.0 s

_{Latenz / Doc}

_{Auf 200+ echten anonymisierten deutschen Rechnungen (Default-Edition, 2.7 GB)}

Was ist German-OCR-3?

German-OCR-3 ist eine kompakte, schnelle und voll lokal lauffähige Vision-OCR-Distribution für deutsche Geschäftsdokumente — Rechnungen, Briefe, Formulare, Quittungen, Bescheide. Aus dem Bild kommt strikt validiertes JSON nach unserem deutschen Extraktions-Schema. Ohne Cloud-Pflicht, ohne Vendor-Lock-in.

Zwei Editionen, beide Apache 2.0, beide unter 3 GB:

Edition	Ollama	Größe	Zielhardware	Stärke
Nano	`Keyvan/german-ocr-nano`	1.0 GB	CPU · Edge · Mobile	„läuft überall"
Default ⭐	`Keyvan/german-ocr-3`	2.7 GB	4–6 GB VRAM	beste Field-Erkennung

Fine-tuned adapter für deutsche Geschäftsdokument-Extraktion. Apache 2.0.

📊 Praxistest — 200+ echte deutsche Rechnungen (anonymisiert)

👁 Praxistest

Edition	Valid JSON	Sender korrekt	Halluzination	Latenz
`Keyvan/german-ocr-nano`	84 %	79 %	0 %	6.6 s
`Keyvan/german-ocr-3` ⭐	100 %	95 %	0 %	5.0 s

Keine "Mustermann"-Defaults. German-OCR-3 liest echte Firma, Kundenadresse, Produkte, Beträge — statt zu raten.

📐 Größenvergleich

👁 Modellgrößen

german-ocr-3 (2.7 GB) ist 6× kleiner als ein typischer 7B-OCR-VLM. Läuft auf einer 8 GB-Gaming-GPU oder über CPU auf einem normalen Laptop.

👁 Latenz

🚀 Quickstart

Ollama (empfohlen, eine Zeile)

ollama pull Keyvan/german-ocr-3
ollama run Keyvan/german-ocr-3 "Extrahiere die Rechnung im Bild als JSON." ./meine_rechnung.png

Python (via Ollama HTTP API)

import base64, json, requests
from pathlib import Path

b64 = base64.b64encode(Path("rechnung.png").read_bytes()).decode()
resp = requests.post("http://localhost:11434/api/generate", json={
 "model": "Keyvan/german-ocr-3",
 "prompt": "Extrahiere die Rechnung im Bild als JSON.",
 "images": [b64],
 "stream": False,
 "options": {"temperature": 0, "num_ctx": 32768},
})
data = json.loads(resp.json()["response"])
print(json.dumps(data, indent=2, ensure_ascii=False))

Bundle herunterladen

huggingface-cli download Keyven/german-ocr-3 --local-dir ./german-ocr-3
# Enthält: Modelfile · JSON-Schemas · System-Prompt · GGUF-Quants · Charts

llama.cpp (GGUF direkt)

llama-cli -m ./german-ocr-3/german-ocr-3-Q4_K_M.gguf \
 --system-prompt-file ./german-ocr-3/system_prompt.txt \
 -p "Extrahiere die Rechnung als JSON:" --temp 0

📚 Trainings- und Evaluations-Datensätze

Datensatz	Umfang	Typ
`neuralabs/german-synth-ocr`	4 500+	Deutsche OCR-Samples (synthetisch, Apache-2.0)
`Aoschu/German_invoices_dataset_for_donut`	129	Echte deutsche Rechnungen (Donut-Format)
Eigenes synthetisches DE-Rechnungs-Set	100	Rechnungen mit Golden-JSON, deterministisch generiert
Anonymisierter DACH-Praxistest	200+	Echte Rechnungen verschiedener DACH-Anbieter (intern, DSGVO)

🎯 Zielgruppen

Solo-Builder & Indies — deutsche Dokumente lokal extrahieren, ohne Cloud-OCR-Kosten.
DACH-KMU mit Datenschutz-Anspruch — lokal / on-prem hosten.
Agenturen & Studios — Open-Source-Fundament unter der eigenen Pipeline.

Wer es gemanagt und mit noch größeren Modellen will:

🌐 german-ocr.de — gehostete deutsche OCR-API mit Premium-Modellen, höherer Genauigkeit, ohne eigene Hardware. Daten bleiben in der EU.

⚠️ Limitations

Optimiert für deutsche Dokumente — andere Sprachen keine Garantie.
Beste Qualität bei klaren, hochauflösenden Scans/Fotos.
Handschriftliche Dokumente: nur begrenzt.
Bei kritischen Vorgängen (Buchhaltung, Recht): immer Human-in-the-Loop.

🙏 Credit & Attribution

German-OCR-3 baut auf der hervorragenden Arbeit des Qwen-Teams bei Alibaba Group auf. Die zugrundeliegende Vision-Language-Architektur stammt aus der Qwen 3.5 Small Series, veröffentlicht unter Apache License 2.0. Ohne die offene Forschung und die saubere Veröffentlichung der Qwen-Weights wäre dieses Projekt nicht möglich.

Qwen 3.5 — https://huggingface.co/Qwen · https://qwen.ai
Apache License 2.0 (Weights) — © 2025–2026 Qwen Team, Alibaba Group
Qwen2.5-VL Technical Report — arXiv:2502.13923

Vollständiger Attribution-Text in NOTICE.

📄 License

Apache License 2.0 für die gesamte German-OCR-3-Distribution (Modelfiles, System-Prompt, Schemas, Docs, GGUFs).

📑 Citation

Wenn du German-OCR-3 in Forschung oder Produktion verwendest, zitiere bitte beides — unsere Distribution und die Qwen-Basisarbeit:

@misc{german_ocr_3_2026,
 title = {German-OCR-3: A compact German document-OCR distribution},
 author = {Hardani, Keyvan},
 year = {2026},
 url = {https://github.com/Keyvanhardani/German-OCR}
}

@misc{qwen35_2026,
 title = {Qwen 3.5 Small Series},
 author = {{Qwen Team, Alibaba Group}},
 year = {2026},
 howpublished = {\url{https://huggingface.co/Qwen}},
 note = {Apache License 2.0}
}

@article{qwen25vl_2025,
 title = {Qwen2.5-VL Technical Report},
 author = {{Qwen Team, Alibaba Group}},
 journal = {arXiv preprint arXiv:2502.13923},
 year = {2025}
}

👤 Author

Keyvan Hardani · Website: keyvan.ai · LinkedIn: linkedin.com/in/keyvanhardani · GitHub: @Keyvanhardani · Hosted Premium: german-ocr.de

Downloads last month: 43

GGUF

Model size

0.8B params

Architecture

qwen35

Hardware compatibility

4-bit

Model tree for Keyven/german-ocr-3

Base model

Qwen/Qwen3.5-2B-Base

Finetuned

Qwen/Qwen3.5-2B

Quantized

(123)

this model

Datasets used to train Keyven/german-ocr-3

Paper for Keyven/german-ocr-3

Paper • 2502.13923 • Published Feb 19, 2025 • 219

URL: https://huggingface.co/Keyven/german-ocr-3

⇱ Keyven/german-ocr-3 · Hugging Face