Effizienz – KI-News.org

Google Gemini 3.1 Flash-Lite: Neues Benchmark in KI-Leistung und Effizienz

März 3, 2026März 3, 2026MartinLeave a Comment

Google Gemini 3.1 Flash-Lite: Neues KI-Modell setzt Benchmark für Geschwindigkeit und Effizienz Lesezeit: ca. 8 Minuten Key Takeaways Gemini 3.1 Flash-Lite erzielt eine Ausgabegeschwindigkeit von 363 Tokens pro Sekunde und positioniert sich damit deutlich vor GPT-5 mini, Claude 4.5 Haiku und Grok 4.1 Fast. Niedrige Betriebskosten: 0,25 US-Dollar pro Million Input-Tokens und 1,50 US-Dollar pro […]

Alibaba stellt Qwen3.5 Small Model Serie vor: Effiziente KI für On-Device-Anwendungen

März 3, 2026MartinLeave a Comment

Alibaba präsentiert Qwen3.5 Small Model Series: Effiziente KI-Modelle für On-Device-Anwendungen Lesezeit: ca. 10 Minuten Key Takeaways Alibaba veröffentlicht die Qwen3.5 Small Model Series mit LLMs im Bereich von 0,8 bis 9 Milliarden Parametern. Fokus auf „More Intelligence, Less Compute“: Leistungsfähige KI bei geringeren Hardware-Anforderungen. Optimiert für On-Device-Anwendungen – etwa auf mobilen Geräten, Wearables oder Edge-Devices. […]

Schlagwort: Effizienz

Google Gemini 3.1 Flash-Lite: Neues Benchmark in KI-Leistung und Effizienz

Alibaba stellt Qwen3.5 Small Model Serie vor: Effiziente KI für On-Device-Anwendungen

Categories

Latest News

OpenAI veröffentlicht Leitfaden zu KI-Wertmodellen für Unternehmen

Scalable Machine Learning Data Pipelines mit Daft: Hochperformante Verarbeitung von strukturierten und Bilddaten

Meta