Google Gemini 3.1 Flash-Lite: Neues Benchmark in KI-Leistung und Effizienz

Google Gemini 3.1 Flash-Lite: Neues KI-Modell setzt Benchmark für Geschwindigkeit und Effizienz Lesezeit: ca. 8 Minuten Key Takeaways Gemini 3.1 Flash-Lite erzielt eine Ausgabegeschwindigkeit von 363 Tokens pro Sekunde und positioniert sich damit deutlich vor GPT-5 mini, Claude 4.5 Haiku und Grok 4.1 Fast. Niedrige Betriebskosten: 0,25 US-Dollar pro Million Input-Tokens und 1,50 US-Dollar pro […]

Continue Reading

Alibaba Qwen 3.5 Small Model Series: Eine neue Dimension von lokal betreibbaren KI-Modellen

Alibaba Qwen 3.5 Small Model Series: Multimodale Open-Weight-KI für lokale Geräte Lesezeit: ca. 9 Minuten Key Takeaways Alibaba veröffentlicht mit der Qwen 3.5 Small Model Series vier kompakte, nativ multimodale KI-Modelle als Open-Weight (0,8B, 2B, 4B und 9B Parameter). Die Modelle sind für den Betrieb auf handelsüblichen Laptops und Endgeräten optimiert und benötigen besonders wenig […]

Continue Reading