Auch im KI-Zeitalter gehören Mainframes längst noch nicht zum alten Eisen.whiteMocca/Shutterstock Mit den IBM Synthetic Datasets will Big Blue Unternehmen dabei helfen, KI-Modelle schneller zu trainieren oder zu optimieren, Vorhersagemodelle zu verbessern, und wahrheitsgetreue Modelle zu validieren. Die Datensatz-Familie, die voraussichtlich Ende Februar verfügbar sein wird, umfasst dazu Module für Zahlungskarten, Bankgeschäfte und Geldwäsche sowie Hausratversicherungen. Synthetische Datensätze bestehen aus herunterladbaren CSV- und DDL-Dateien mit vorab zusammengestellten Attributen, die für spezifischen Anwendungsfälle für IBM Z und IBM LinuxONE benötigt werden. Dadurch seien sie benutzerfreundlich und mit allem kompatibel, von Datenbanken über Tabellenkalkulationen bis hin zu Hardwareplattformen und Standard-KI-Tools, heißt es seitens IBM. Daten zum Anlernen und Optimieren Verfügt ein Kunde über ein vorhandenes Modell oder LLM, bieten synthetische Daten zusätzliche Informationen, um das KI-Modell zu optimieren – in reichhaltiger und gelabelter Form. Hat ein Kunde noch kein Modell, sind die synthetischen Datensätze so konzipiert, dass sie datenschutzkonforme Trainingsdaten liefern, um Modelle von Grund auf neu zu erstellen, so der Anbieter. Kunden könnten Modelle auf IBM Z und IBM LinuxONE mit AI Toolkit für IBM Z und IBM LinuxONE, Cloud Pak für Daten auf Z oder Machine Learning für z/OS bereitstellen, erklären Elpida Tzortzatos, IBM Fellow und Z-Architektin, und Tina Tarquinio, IBM-Vizepräsidentin, in einem Blogbeitrag: „Sie können Inferenzen auf IBM z16 und IBM LinuxONE 4 durchführen und dabei Investitionen in die Hardwarebeschleunigung und die Datengravitation nutzen, um die Geschwindigkeit und den Umfang von KI-Inferenzen drastisch zu erhöhen.“ Hilfe bei Betrugserkennung und Geldwäscheprävention Darüber hinaus seien Anwender damit in der Lage, prädiktive KI-Modelle zu verbessern und LLMs mit zusätzlichen, umfangreichen und breit gefächerten Daten zu optimieren. Das führe laut den Autoren zu erheblichen Kosteneinsparungen in Bereichen wie der Betrugserkennung und der Geldwäscheprävention. Geldwäsche bliebe in realen Daten oft unentdeckt, so die Autoren, weil Kriminelle illegale Gelder häufig über diverse Banken und Landesgrenzen verschieben, um deren Herkunft zu verschleiern. Das habe komplexe Transaktionsmuster zur Folge, so Tzortzatos und Tarquinio. Mit IBM Synthetic Data Sets for Core Banking and Money Laundering werde jede Transaktion entweder als Geldwäsche identifiziert oder nicht, „wobei das gesamte Bankensystem abgedeckt wird, globale Transaktionen einbezogen werden und sogar Bargeldtransaktionen, die in realen Bankdaten normalerweise nicht verfügbar sind“, schreiben die IBM-Experten. Dieser umfangreiche Datensatz mit bekannter Grundwahrheit ermögliche es Datenwissenschaftlern, ihre Modelle zu validieren und robuste AML-Modelle zu erstellen, wodurch Risiken reduziert und Kosten für Unternehmen eingespart würden. Darüber hinaus spare es unzählige Arbeitsstunden, Fehlalarme zu reduzieren.
IBM hilft Mainframe-Kunden beim KI-Training
Auch im KI-Zeitalter gehören Mainframes längst noch nicht zum alten Eisen.whiteMocca/Shutterstock Mit den IBM Synthetic Datasets will Big Blue Unternehmen dabei helfen, KI-Modelle schneller zu trainieren oder zu optimieren, Vorhersagemodelle zu verbessern, und wahrheitsgetreue Modelle zu validieren. Die Datensatz-Familie, die voraussichtlich Ende Februar verfügbar sein wird, umfasst dazu Module für Zahlungskarten, Bankgeschäfte und Geldwäsche sowie Hausratversicherungen. Synthetische Datensätze bestehen aus herunterladbaren CSV- und DDL-Dateien mit vorab zusammengestellten Attributen, die für spezifischen Anwendungsfälle für IBM Z und IBM LinuxONE benötigt werden. Dadurch seien sie benutzerfreundlich und mit allem kompatibel, von Datenbanken über Tabellenkalkulationen bis hin zu Hardwareplattformen und Standard-KI-Tools, heißt es seitens IBM. Daten zum Anlernen und Optimieren Verfügt ein Kunde über ein vorhandenes Modell oder LLM, bieten synthetische Daten zusätzliche Informationen, um das KI-Modell zu optimieren – in reichhaltiger und gelabelter Form. Hat ein Kunde noch kein Modell, sind die synthetischen Datensätze so konzipiert, dass sie datenschutzkonforme Trainingsdaten liefern, um Modelle von Grund auf neu zu erstellen, so der Anbieter. Kunden könnten Modelle auf IBM Z und IBM LinuxONE mit AI Toolkit für IBM Z und IBM LinuxONE, Cloud Pak für Daten auf Z oder Machine Learning für z/OS bereitstellen, erklären Elpida Tzortzatos, IBM Fellow und Z-Architektin, und Tina Tarquinio, IBM-Vizepräsidentin, in einem Blogbeitrag: „Sie können Inferenzen auf IBM z16 und IBM LinuxONE 4 durchführen und dabei Investitionen in die Hardwarebeschleunigung und die Datengravitation nutzen, um die Geschwindigkeit und den Umfang von KI-Inferenzen drastisch zu erhöhen.“ Hilfe bei Betrugserkennung und Geldwäscheprävention Darüber hinaus seien Anwender damit in der Lage, prädiktive KI-Modelle zu verbessern und LLMs mit zusätzlichen, umfangreichen und breit gefächerten Daten zu optimieren. Das führe laut den Autoren zu erheblichen Kosteneinsparungen in Bereichen wie der Betrugserkennung und der Geldwäscheprävention. Geldwäsche bliebe in realen Daten oft unentdeckt, so die Autoren, weil Kriminelle illegale Gelder häufig über diverse Banken und Landesgrenzen verschieben, um deren Herkunft zu verschleiern. Das habe komplexe Transaktionsmuster zur Folge, so Tzortzatos und Tarquinio. Mit IBM Synthetic Data Sets for Core Banking and Money Laundering werde jede Transaktion entweder als Geldwäsche identifiziert oder nicht, „wobei das gesamte Bankensystem abgedeckt wird, globale Transaktionen einbezogen werden und sogar Bargeldtransaktionen, die in realen Bankdaten normalerweise nicht verfügbar sind“, schreiben die IBM-Experten. Dieser umfangreiche Datensatz mit bekannter Grundwahrheit ermögliche es Datenwissenschaftlern, ihre Modelle zu validieren und robuste AML-Modelle zu erstellen, wodurch Risiken reduziert und Kosten für Unternehmen eingespart würden. Darüber hinaus spare es unzählige Arbeitsstunden, Fehlalarme zu reduzieren.
IBM hilft Mainframe-Kunden beim KI-Training Auch im KI-Zeitalter gehören Mainframes längst noch nicht zum alten Eisen.whiteMocca/Shutterstock Mit den IBM Synthetic Datasets will Big Blue Unternehmen dabei helfen, KI-Modelle schneller zu trainieren oder zu optimieren, Vorhersagemodelle zu verbessern, und wahrheitsgetreue Modelle zu validieren. Die Datensatz-Familie, die voraussichtlich Ende Februar verfügbar sein wird, umfasst dazu Module für Zahlungskarten, Bankgeschäfte und Geldwäsche sowie Hausratversicherungen. Synthetische Datensätze bestehen aus herunterladbaren CSV- und DDL-Dateien mit vorab zusammengestellten Attributen, die für spezifischen Anwendungsfälle für IBM Z und IBM LinuxONE benötigt werden. Dadurch seien sie benutzerfreundlich und mit allem kompatibel, von Datenbanken über Tabellenkalkulationen bis hin zu Hardwareplattformen und Standard-KI-Tools, heißt es seitens IBM. Daten zum Anlernen und Optimieren Verfügt ein Kunde über ein vorhandenes Modell oder LLM, bieten synthetische Daten zusätzliche Informationen, um das KI-Modell zu optimieren – in reichhaltiger und gelabelter Form. Hat ein Kunde noch kein Modell, sind die synthetischen Datensätze so konzipiert, dass sie datenschutzkonforme Trainingsdaten liefern, um Modelle von Grund auf neu zu erstellen, so der Anbieter. Kunden könnten Modelle auf IBM Z und IBM LinuxONE mit AI Toolkit für IBM Z und IBM LinuxONE, Cloud Pak für Daten auf Z oder Machine Learning für z/OS bereitstellen, erklären Elpida Tzortzatos, IBM Fellow und Z-Architektin, und Tina Tarquinio, IBM-Vizepräsidentin, in einem Blogbeitrag: „Sie können Inferenzen auf IBM z16 und IBM LinuxONE 4 durchführen und dabei Investitionen in die Hardwarebeschleunigung und die Datengravitation nutzen, um die Geschwindigkeit und den Umfang von KI-Inferenzen drastisch zu erhöhen.“ Hilfe bei Betrugserkennung und Geldwäscheprävention Darüber hinaus seien Anwender damit in der Lage, prädiktive KI-Modelle zu verbessern und LLMs mit zusätzlichen, umfangreichen und breit gefächerten Daten zu optimieren. Das führe laut den Autoren zu erheblichen Kosteneinsparungen in Bereichen wie der Betrugserkennung und der Geldwäscheprävention. Geldwäsche bliebe in realen Daten oft unentdeckt, so die Autoren, weil Kriminelle illegale Gelder häufig über diverse Banken und Landesgrenzen verschieben, um deren Herkunft zu verschleiern. Das habe komplexe Transaktionsmuster zur Folge, so Tzortzatos und Tarquinio. Mit IBM Synthetic Data Sets for Core Banking and Money Laundering werde jede Transaktion entweder als Geldwäsche identifiziert oder nicht, „wobei das gesamte Bankensystem abgedeckt wird, globale Transaktionen einbezogen werden und sogar Bargeldtransaktionen, die in realen Bankdaten normalerweise nicht verfügbar sind“, schreiben die IBM-Experten. Dieser umfangreiche Datensatz mit bekannter Grundwahrheit ermögliche es Datenwissenschaftlern, ihre Modelle zu validieren und robuste AML-Modelle zu erstellen, wodurch Risiken reduziert und Kosten für Unternehmen eingespart würden. Darüber hinaus spare es unzählige Arbeitsstunden, Fehlalarme zu reduzieren.