Lass uns treffen

Google TimesFM – Open-Source-Beitrag

Open-Source-Beiträge auf Github zum Google Research “TimesFM”-Projekt.

alter-text

https://github.com/google-research/timesfm

https://research.google/blog/a-decoder-only-foundation-model-for-time-series-forecasting/

Projektzusammenfassung: Verbesserung des Google Research TimesFM-Projekts mit CI/CD und Python Poetry

Open-Source-Beitrag: Continuous Integration/Continuous Deployment (CI/CD) und Abhängigkeitsmanagement für TimesFM

Projektübersicht:

TimesFM ist ein fortschrittliches Prognosemodell, das von Google Research entwickelt wurde und auf einem umfangreichen Korpus von 100 Milliarden realen Zeitpunkten vortrainiert ist. Es liefert beeindruckende Zero-Shot-Leistungen über verschiedene öffentliche Benchmarks aus mehreren Domänen und Granularitäten hinweg. Dieses Modell zeichnet sich in der Zeitreihenprognose aus, die in Branchen wie Einzelhandel, Finanzen, Fertigung, Gesundheitswesen und Naturwissenschaften von entscheidender Bedeutung ist. TimesFM ist besonders im Einzelhandel von großer Bedeutung, da eine genaue Nachfrageprognose die Lagerkosten erheblich senken und den Umsatz steigern kann.

Trotz seiner robusten Leistung stand TimesFM vor Herausforderungen, die vielen Deep-Learning (DL)-Modellen gemeinsam sind: der Bedarf an umfangreichen Trainings- und Validierungszyklen vor der Bereitstellung. Um dies zu adressieren, wurde TimesFM als Foundation-Modell entwickelt, das starke Prognosefähigkeiten für neue Zeitreihendaten ohne zusätzliches Training bietet. Dies ermöglicht es den Nutzern, schnell Prognosen für spezifische Aufgaben wie die Einzelhandelsnachfrageplanung zu implementieren und zu verfeinern.

Meine Beiträge:

Um die Benutzerfreundlichkeit und Zugänglichkeit von TimesFM weiter zu verbessern, habe ich zum Projekt beigetragen, indem ich eine Continuous Integration/Continuous Deployment (CI/CD)-Pipeline mit GitHub Actions implementiert und Python Poetry für das Abhängigkeitsmanagement und die Paketierung integriert habe. Diese Beiträge zielten darauf ab, den Installationsprozess zu vereinfachen und die Entwicklungsabläufe zu optimieren.

Wichtige Verbesserungen:

CI/CD-Pipeline mit GitHub Actions:

  • Automatisierung: Automatisierte die Test-, Build- und Bereitstellungsprozesse, um sicherzustellen, dass Änderungen am Code durch einen konsistenten und zuverlässigen Workflow überprüft werden.
  • Qualitätssicherung: Verbesserte die Codequalität durch das Ausführen automatisierter Tests bei jedem Pull-Request, um Probleme frühzeitig im Entwicklungszyklus zu erkennen.
  • Bereitstellung: Optimierte den Bereitstellungsprozess, um schnellere und zuverlässigere Updates des TimesFM-Modells zu ermöglichen.

Python Poetry Integration:

  • Vereinfachte Installation: Ermöglichte es den Nutzern, TimesFM einfacher mit einem einzigen Befehl (pip install timesfm) zu installieren, wodurch die Einstiegshürde für neue Nutzer und Entwickler gesenkt wurde.
  • Abhängigkeitsmanagement: Verbessertes Abhängigkeitsmanagement durch die Verwendung von Poetry, das Paketabhängigkeiten effizienter verwaltet und sicherstellt, dass die richtigen Versionen verwendet werden.
  • Reproduzierbarkeit: Erhöhte die Reproduzierbarkeit der Entwicklungsumgebung, wodurch es für Mitwirkende einfacher wird, ihre Entwicklungsumgebungen einzurichten und zu warten.

Auswirkungen der Beiträge:

  • Benutzerfreundlichkeit: Senkte die Einstiegshürde für neue Nutzer und Mitwirkende, wodurch es einfacher wurde, mit TimesFM zu beginnen.
  • Produktivitätssteigerung: Durch die Automatisierung routinemäßiger Aufgaben und die Sicherstellung einer konsistenten Entwicklungsumgebung können sich Entwickler mehr auf Innovation und weniger auf Einrichtung und Wartung konzentrieren.
  • Verbesserte Zusammenarbeit: Die automatisierte CI/CD-Pipeline fördert einen kollaborativeren und effizienteren Entwicklungsprozess, bei dem Codeänderungen kontinuierlich integriert und getestet werden.

Über TimesFM:

TimesFM stellt einen bedeutenden Fortschritt in der Zeitreihenprognose dar. Es ist viel kleiner als die neuesten großen Sprachmodelle (200 Millionen Parameter) und erreicht dennoch nahezu den Stand der Technik auf einer Vielzahl von unbekannten Datensätzen. Dies macht es zu einem leistungsstarken Werkzeug für Branchen, die auf genaue Zeitreihenprognosen angewiesen sind.

Für weitere Informationen und um auf das Modell zuzugreifen, besuchen Sie bitte die HuggingFace- und GitHub-Repositories.

Fazit:

Meine Beiträge zum TimesFM-Projekt haben dessen Benutzerfreundlichkeit und Entwicklungseffizienz erheblich verbessert. Durch die Implementierung einer CI/CD-Pipeline und die Integration von Python Poetry habe ich dazu beigetragen, Arbeitsabläufe zu optimieren und das Modell für Nutzer und Entwickler zugänglicher zu machen. Diese Verbesserungen unterstützen den anhaltenden Erfolg von TimesFM bei der Bereitstellung robuster Zero-Shot-Prognosefähigkeiten in verschiedenen Domänen.


call to action image

Do you have something similar in mind?

Contact us for a free 15-minute consultation and tell us about your data/cloud challenges.

Contact Us