Computerhaus Quickborn

Angst vor hohen Betriebskosten bremst KI-Einführung​

Beim KI-Training noch tragbar, können anhaltend hohe Inferenzkosten das Potenzial von KI-Projekte deutlich reduzieren. Andrey_Popov – Shutterstock Die zunehmende Nutzung von KI in Unternehmen wird durch die schwer kalkulierbaren Inferenzkosten gebremst – viele Unternehmen befürchten unerwartet hohe Rechnungen für entsprechende Cloud-Dienste. Zu diesem Ergebnis kommen die Marktforscher von Canalys in einem aktuellen Bericht. Demnach beliefen sich die weltweiten Ausgaben für Cloud-Infrastrukturdienste den Schätzungen der Analysten zufolge im ersten Quartal 2025 auf 90,9 Milliarden Dollar. Das entspricht einem Anstieg von 21 Prozent gegenüber dem Vorjahr. KI treibt Cloud-Migration   Die Unternehmen hätten erkannt, dass die Bereitstellung von KI-Anwendungen einen erneuten Fokus auf die Cloud-Migration erfordert, so die Marktforscher. Sie gehen davon aus, dass umfangreiche Investitionen in Cloud- und KI-Infrastruktur das ganze Jahr über ein bestimmendes Marktthema sein werden. Allerdings beobachten die Auguren, dass die mangelnde Transparenz bei den laufenden, wiederkehrenden Inferenzkosten bei den Unternehmen für Verunsicherung sorgt. „Im Gegensatz zum Training, das eine einmalige Investition darstellt, verursacht die Inferenz wiederkehrende Betriebskosten, was sie zu einem entscheidenden Hindernis auf dem Weg zur Kommerzialisierung der KI macht“, erklärt Rachel Brindley, Senior Director bei Canalys. Da KI zunehmend von der Forschung in den großflächigen Einsatz übergehe, würden Unternehmen ihr Augenmerk verstärkt auf die Kosteneffizienz der Inferenz legen und dabei Modelle, Cloud-Plattformen und Hardware-Architekturen wie GPUs mit speziell entwickelten Beschleunigern vergleichen. „Viele KI-Dienste folgen heute nutzungsbasierten Preismodellen – in der Regel werden Token oder API-Aufrufe abgerechnet –, was die Kostenprognose mit steigender Nutzung zunehmend erschwert“, fügt Yi Zhang, ebenfalls Analystin bei Canalys, hinzu. Sind die Inferenzkosten volatil oder übermäßig hoch, seien Unternehmen gezwungen, die Nutzung einzuschränken, die Komplexität der Modelle zu reduzieren oder den Einsatz auf hochwertige Szenarien zu beschränken. „Als Konsequenz bleibt das breitere Potenzial von KI ungenutzt“, so Zhang. Um diesen Herausforderungen zu begegnen, verstärken führende Cloud-Anbieter ihre Investitionen in KI-optimierte Infrastrukturen, erklärt Canalys. Hyperscaler wie AWS, Azure und Google Cloud hätten allesamt proprietäre Chips und TPUs sowie speziell entwickelte Instanzfamilien eingeführt, die darauf abzielen, die Inferenzleistung zu verbessern und die Gesamtkosten für KI zu senken. Als Beispiel verweisen die Auguren auf AWS. Die Amazon-Tochter habe im März ihre Preise angepasst, um die Einführung ihrer Trainium-KI-Chips gegenüber teureren, NVIDIA-basierten Lösungen zu fördern. Dabei wurde der Preis-Leistungs-Vorteil von Trainium 2 in Höhe von 30 bis 40 Prozent hervorgehoben. Auch Wettbewerber Microsoft Azure fokussiere sich darauf, die Kosten für die KI-Einführung zu senken, berichtet Canalys. So sei es mithilfe von alternativen Lösungen möglich, die KI-Leistung bei konstantem Stromverbrauch um fast 30 Prozent zu steigern, während die Kosten pro Token um über 50 Prozent sinken. AWS vor Microsoft Azure und Google Cloud Im globalen Vergleich behauptete AWS im ersten Quartal 2025 souverän seine Führungsposition im Markt für Cloud-Infrastrukturdienste: Laut Canalys steigerte der Anbieter seinen Umsatz um 17 Prozent und erreichte einen Marktanteil von 32 Prozent. Microsoft Azure folgte mit 23 Prozent Marktanteil und einem kräftigen Wachstum von 33 Prozent. Google Cloud lag mit zehn Prozent auf Platz drei und verzeichnete ein Plus von 31 Prozent. Gemeinsam vereinten die drei Hyperscaler 65 Prozent der weltweiten Cloud-Ausgaben auf sich – ein Zuwachs von 24 Prozent im Vergleich zum Vorjahr. srcset="https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?quality=50&strip=all 900w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=300%2C168&quality=50&strip=all 300w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=768%2C432&quality=50&strip=all 768w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=150%2C84&quality=50&strip=all 150w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=854%2C480&quality=50&strip=all 854w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=640%2C360&quality=50&strip=all 640w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=444%2C250&quality=50&strip=all 444w" width="900" height="506" sizes="(max-width: 900px) 100vw, 900px">Die drei führenden Hyperscaler verzeichnen dank KI weiterhin kräftige Wachstumsraten. Canalys 

Angst vor hohen Betriebskosten bremst KI-Einführung​ Beim KI-Training noch tragbar, können anhaltend hohe Inferenzkosten das Potenzial von KI-Projekte deutlich reduzieren. Andrey_Popov – Shutterstock Die zunehmende Nutzung von KI in Unternehmen wird durch die schwer kalkulierbaren Inferenzkosten gebremst – viele Unternehmen befürchten unerwartet hohe Rechnungen für entsprechende Cloud-Dienste. Zu diesem Ergebnis kommen die Marktforscher von Canalys in einem aktuellen Bericht. Demnach beliefen sich die weltweiten Ausgaben für Cloud-Infrastrukturdienste den Schätzungen der Analysten zufolge im ersten Quartal 2025 auf 90,9 Milliarden Dollar. Das entspricht einem Anstieg von 21 Prozent gegenüber dem Vorjahr. KI treibt Cloud-Migration   Die Unternehmen hätten erkannt, dass die Bereitstellung von KI-Anwendungen einen erneuten Fokus auf die Cloud-Migration erfordert, so die Marktforscher. Sie gehen davon aus, dass umfangreiche Investitionen in Cloud- und KI-Infrastruktur das ganze Jahr über ein bestimmendes Marktthema sein werden. Allerdings beobachten die Auguren, dass die mangelnde Transparenz bei den laufenden, wiederkehrenden Inferenzkosten bei den Unternehmen für Verunsicherung sorgt. „Im Gegensatz zum Training, das eine einmalige Investition darstellt, verursacht die Inferenz wiederkehrende Betriebskosten, was sie zu einem entscheidenden Hindernis auf dem Weg zur Kommerzialisierung der KI macht“, erklärt Rachel Brindley, Senior Director bei Canalys. Da KI zunehmend von der Forschung in den großflächigen Einsatz übergehe, würden Unternehmen ihr Augenmerk verstärkt auf die Kosteneffizienz der Inferenz legen und dabei Modelle, Cloud-Plattformen und Hardware-Architekturen wie GPUs mit speziell entwickelten Beschleunigern vergleichen. „Viele KI-Dienste folgen heute nutzungsbasierten Preismodellen – in der Regel werden Token oder API-Aufrufe abgerechnet –, was die Kostenprognose mit steigender Nutzung zunehmend erschwert“, fügt Yi Zhang, ebenfalls Analystin bei Canalys, hinzu. Sind die Inferenzkosten volatil oder übermäßig hoch, seien Unternehmen gezwungen, die Nutzung einzuschränken, die Komplexität der Modelle zu reduzieren oder den Einsatz auf hochwertige Szenarien zu beschränken. „Als Konsequenz bleibt das breitere Potenzial von KI ungenutzt“, so Zhang. Um diesen Herausforderungen zu begegnen, verstärken führende Cloud-Anbieter ihre Investitionen in KI-optimierte Infrastrukturen, erklärt Canalys. Hyperscaler wie AWS, Azure und Google Cloud hätten allesamt proprietäre Chips und TPUs sowie speziell entwickelte Instanzfamilien eingeführt, die darauf abzielen, die Inferenzleistung zu verbessern und die Gesamtkosten für KI zu senken. Als Beispiel verweisen die Auguren auf AWS. Die Amazon-Tochter habe im März ihre Preise angepasst, um die Einführung ihrer Trainium-KI-Chips gegenüber teureren, NVIDIA-basierten Lösungen zu fördern. Dabei wurde der Preis-Leistungs-Vorteil von Trainium 2 in Höhe von 30 bis 40 Prozent hervorgehoben. Auch Wettbewerber Microsoft Azure fokussiere sich darauf, die Kosten für die KI-Einführung zu senken, berichtet Canalys. So sei es mithilfe von alternativen Lösungen möglich, die KI-Leistung bei konstantem Stromverbrauch um fast 30 Prozent zu steigern, während die Kosten pro Token um über 50 Prozent sinken. AWS vor Microsoft Azure und Google Cloud Im globalen Vergleich behauptete AWS im ersten Quartal 2025 souverän seine Führungsposition im Markt für Cloud-Infrastrukturdienste: Laut Canalys steigerte der Anbieter seinen Umsatz um 17 Prozent und erreichte einen Marktanteil von 32 Prozent. Microsoft Azure folgte mit 23 Prozent Marktanteil und einem kräftigen Wachstum von 33 Prozent. Google Cloud lag mit zehn Prozent auf Platz drei und verzeichnete ein Plus von 31 Prozent. Gemeinsam vereinten die drei Hyperscaler 65 Prozent der weltweiten Cloud-Ausgaben auf sich – ein Zuwachs von 24 Prozent im Vergleich zum Vorjahr. srcset="https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?quality=50&strip=all 900w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=300%2C168&quality=50&strip=all 300w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=768%2C432&quality=50&strip=all 768w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=150%2C84&quality=50&strip=all 150w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=854%2C480&quality=50&strip=all 854w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=640%2C360&quality=50&strip=all 640w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=444%2C250&quality=50&strip=all 444w" width="900" height="506" sizes="(max-width: 900px) 100vw, 900px">Die drei führenden Hyperscaler verzeichnen dank KI weiterhin kräftige Wachstumsraten. Canalys

Beim KI-Training noch tragbar, können anhaltend hohe Inferenzkosten das Potenzial von KI-Projekte deutlich reduzieren. Andrey_Popov – Shutterstock Die zunehmende Nutzung von KI in Unternehmen wird durch die schwer kalkulierbaren Inferenzkosten gebremst – viele Unternehmen befürchten unerwartet hohe Rechnungen für entsprechende Cloud-Dienste. Zu diesem Ergebnis kommen die Marktforscher von Canalys in einem aktuellen Bericht. Demnach beliefen sich die weltweiten Ausgaben für Cloud-Infrastrukturdienste den Schätzungen der Analysten zufolge im ersten Quartal 2025 auf 90,9 Milliarden Dollar. Das entspricht einem Anstieg von 21 Prozent gegenüber dem Vorjahr. KI treibt Cloud-Migration   Die Unternehmen hätten erkannt, dass die Bereitstellung von KI-Anwendungen einen erneuten Fokus auf die Cloud-Migration erfordert, so die Marktforscher. Sie gehen davon aus, dass umfangreiche Investitionen in Cloud- und KI-Infrastruktur das ganze Jahr über ein bestimmendes Marktthema sein werden. Allerdings beobachten die Auguren, dass die mangelnde Transparenz bei den laufenden, wiederkehrenden Inferenzkosten bei den Unternehmen für Verunsicherung sorgt. „Im Gegensatz zum Training, das eine einmalige Investition darstellt, verursacht die Inferenz wiederkehrende Betriebskosten, was sie zu einem entscheidenden Hindernis auf dem Weg zur Kommerzialisierung der KI macht“, erklärt Rachel Brindley, Senior Director bei Canalys. Da KI zunehmend von der Forschung in den großflächigen Einsatz übergehe, würden Unternehmen ihr Augenmerk verstärkt auf die Kosteneffizienz der Inferenz legen und dabei Modelle, Cloud-Plattformen und Hardware-Architekturen wie GPUs mit speziell entwickelten Beschleunigern vergleichen. „Viele KI-Dienste folgen heute nutzungsbasierten Preismodellen – in der Regel werden Token oder API-Aufrufe abgerechnet –, was die Kostenprognose mit steigender Nutzung zunehmend erschwert“, fügt Yi Zhang, ebenfalls Analystin bei Canalys, hinzu. Sind die Inferenzkosten volatil oder übermäßig hoch, seien Unternehmen gezwungen, die Nutzung einzuschränken, die Komplexität der Modelle zu reduzieren oder den Einsatz auf hochwertige Szenarien zu beschränken. „Als Konsequenz bleibt das breitere Potenzial von KI ungenutzt“, so Zhang. Um diesen Herausforderungen zu begegnen, verstärken führende Cloud-Anbieter ihre Investitionen in KI-optimierte Infrastrukturen, erklärt Canalys. Hyperscaler wie AWS, Azure und Google Cloud hätten allesamt proprietäre Chips und TPUs sowie speziell entwickelte Instanzfamilien eingeführt, die darauf abzielen, die Inferenzleistung zu verbessern und die Gesamtkosten für KI zu senken. Als Beispiel verweisen die Auguren auf AWS. Die Amazon-Tochter habe im März ihre Preise angepasst, um die Einführung ihrer Trainium-KI-Chips gegenüber teureren, NVIDIA-basierten Lösungen zu fördern. Dabei wurde der Preis-Leistungs-Vorteil von Trainium 2 in Höhe von 30 bis 40 Prozent hervorgehoben. Auch Wettbewerber Microsoft Azure fokussiere sich darauf, die Kosten für die KI-Einführung zu senken, berichtet Canalys. So sei es mithilfe von alternativen Lösungen möglich, die KI-Leistung bei konstantem Stromverbrauch um fast 30 Prozent zu steigern, während die Kosten pro Token um über 50 Prozent sinken. AWS vor Microsoft Azure und Google Cloud Im globalen Vergleich behauptete AWS im ersten Quartal 2025 souverän seine Führungsposition im Markt für Cloud-Infrastrukturdienste: Laut Canalys steigerte der Anbieter seinen Umsatz um 17 Prozent und erreichte einen Marktanteil von 32 Prozent. Microsoft Azure folgte mit 23 Prozent Marktanteil und einem kräftigen Wachstum von 33 Prozent. Google Cloud lag mit zehn Prozent auf Platz drei und verzeichnete ein Plus von 31 Prozent. Gemeinsam vereinten die drei Hyperscaler 65 Prozent der weltweiten Cloud-Ausgaben auf sich – ein Zuwachs von 24 Prozent im Vergleich zum Vorjahr. srcset=”https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?quality=50&strip=all 900w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=300%2C168&quality=50&strip=all 300w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=768%2C432&quality=50&strip=all 768w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=150%2C84&quality=50&strip=all 150w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=854%2C480&quality=50&strip=all 854w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=640%2C360&quality=50&strip=all 640w, https://b2b-contenthub.com/wp-content/uploads/2025/06/jatKncCTrxdB0xpsHzm6rROpcphflQb.jpg?resize=444%2C250&quality=50&strip=all 444w” width=”900″ height=”506″ sizes=”(max-width: 900px) 100vw, 900px”>Die drei führenden Hyperscaler verzeichnen dank KI weiterhin kräftige Wachstumsraten. Canalys 

Nach oben scrollen
×