Google Gemini 3.1 Flash-Lite: Neues Benchmark in KI-Leistung und Effizienz

Google Gemini 3.1 Flash-Lite: Neues KI-Modell setzt Benchmark für Geschwindigkeit und Effizienz Lesezeit: ca. 8 Minuten Key Takeaways Gemini 3.1 Flash-Lite erzielt eine Ausgabegeschwindigkeit von 363 Tokens pro Sekunde und positioniert sich damit deutlich vor GPT-5 mini, Claude 4.5 Haiku und Grok 4.1 Fast. Niedrige Betriebskosten: 0,25 US-Dollar pro Million Input-Tokens und 1,50 US-Dollar pro […]

Continue Reading

Alibaba stellt Qwen3.5 Small Model Serie vor: Effiziente KI für On-Device-Anwendungen

Alibaba präsentiert Qwen3.5 Small Model Series: Effiziente KI-Modelle für On-Device-Anwendungen Lesezeit: ca. 10 Minuten Key Takeaways Alibaba veröffentlicht die Qwen3.5 Small Model Series mit LLMs im Bereich von 0,8 bis 9 Milliarden Parametern. Fokus auf „More Intelligence, Less Compute“: Leistungsfähige KI bei geringeren Hardware-Anforderungen. Optimiert für On-Device-Anwendungen – etwa auf mobilen Geräten, Wearables oder Edge-Devices. […]

Continue Reading