Databricks, das coole Datenmanagement-Startup aus San Francisco, hat sich entschlossen, das generative KI-Startup MosaicML für läppische 1,3 Milliarden Dollar zu schnappen. Dieser Schritt zielt darauf ab, die steigende Nachfrage von Unternehmen zu befriedigen, ihre eigenen, kostengünstigeren Sprachmodelle zu erstellen.
Datenmanagement trifft auf Sprachmodell-Plattform
Databricks kombiniert seine KI-fähige Datenmanagement-Technologie mit der Sprachmodell-Plattform von MosaicML. Dies ermöglicht Unternehmen, kostengünstige Sprachmodelle mit proprietären Daten selbst zu erstellen. Derzeit verlassen sich die meisten Unternehmen auf Drittanbieter-Sprachmodelle, die auf großen Mengen öffentlich zugänglicher Daten trainiert wurden.
MosaicML: Kostensenkung für generative KI
MosaicML, ebenfalls in San Francisco ansässig und 2021 gegründet, konzentriert sich darauf, die Kosten für die Nutzung generativer KI zu senken – von Zehn Millionen Dollar auf Hunderttausende von Dollar pro Modell. Nach der Übernahme wird MosaicML als eigenständiger Service von Databricks fortgeführt.
Generative KI: Text, Bilder und Code aus natürlichen Sprachanweisungen
Generative KI-Anwendungen sind darauf ausgelegt, originale Texte, Bilder und Computercode auf Basis von natürlichen Sprachanweisungen der Benutzer zu erzeugen. Das Interesse an dieser Technologie hat seit der Einführung von ChatGPT, einem Online-Generative-KI-Chatbot von OpenAI, im November stark zugenommen.
Vorteile von maßgeschneiderten Modellen
„Bei der Erstellung eines Modells von Grund auf wissen Sie, was Sie ihm füttern“, sagt Ali Ghodsi, CEO von Databricks. Fertige Modelle, die bereits auf Internetdaten trainiert wurden, enthalten überflüssige Informationen, die die Ergebnisse verzerren können. Viele Unternehmen sind auch wegen Datenschutz- und Sicherheitsbedenken zurückhaltend, ihre Daten in von externen Anbietern erstellten Modellen zu teilen.
Die Rolle der Daten
Daten waren schon immer der Schlüssel zum Erfolg“, sagt Sreekar Krishna, KPMG’s U.S. KI-Leiter. Große Sprachmodelle erfordern mehr Rechenleistung und Synthesefähigkeiten im Vergleich zu kleineren Modellen, stellen aber Herausforderungen in der Datenverwaltung und der Bestimmung der Eignung für spezifische Anwendungen dar.