| [EDM] 使用新的 MLOps 解決方案簡化機器學習模型的構建和操作

活動時間:2022-10-27 09:00 - 2023-06-30 17:00

 

使用新的 MLOps 解決方案簡化機器學習模型的構建和操作

Informatica Principal Product Manager, ABHILASH MULA

此篇文章將討論組織如何成功部署其 ML 模型並將 AI 投入生產。

具有機器學習 (ML) 可以帶來的所有好處,具有諷刺意味的是,很少有組織根據其 AI/ML 模型實施或制定業務決策。讓我們回顧一下 ML 的基礎知識,並了解新的解決方案如何幫助部署 ML 模型,從而使 AI 獲得應有的認可。

什麼是機器學習,它有什麼作用?

ML 是人工智能 (AI) 的一個子集,其中算法發現數據中的模式,包括批次處理和流數據。ML 模型從過去的經驗中學習,並根據他們的經驗進行預測。因此,例如,零售商可以根據客戶的歷史購買模式構建個性化優惠,並將該數據與即時活動相結合。這包括網絡搜索、當前地理位置、移動應用程序中的活動等。從那裡他們可以構建 ML 模型來預測客戶購買特定產品的傾向。這通過在正確的時間向正確的客戶提供正確的報價來推動數據驅動的活動並提高投資回報率。

ML 使組織能夠根據數據和見解而不是直覺做出決策。此外,隨著接觸新數據,ML 模型變得更加智能和準確。一個例子是google地圖如何通過添加交通條件來提供更快的路線。

機器學習市場驅動因素和趨勢

隨著結構化和非結構化數據的快速增長,組織希望從數據中獲取價值,以獲得競爭優勢並改善客戶體驗。為了實現這一目標,ML 已成為發揮數據潛力的重要方法。機器學習還使企業更具創新性、效率和可持續性。許多高效的 ML 應用程序在現實環境中的成功未能達到預期。
根據 NewVantage Partners 的一項調查,只有 15% 的領先企業已將 AI 能力部署到任何規模的生產中(註1)。大多數領先的組織都有大量的人工智能投資,但他們獲得真正商業利益的道路充滿挑戰。

許多 ML 項目失敗的原因是許多概念證明從未投入生產。ML 社區一直專注於構建 ML 模型,而不是構建可用於生產的 ML 產品。因此,它們無法對生成的、通常是複雜的 ML 系統組件和基礎設施進行必要的協調。這包括在現實環境中自動化和操作 ML 系統所需的角色。

MLOps 如何為 AI/ML 項目帶來價值

機器學習操作 (MLOps)是簡化 ML 模型的過程。MLOps 專注於數據模型的部署、操作和執行。這套標準實踐可讓您大規模啟用 AI 的全部功能。它還使您能夠實時交付可信的、機器主導的決策。MLOps 結合了模型開發和運營技術。這對於高性能 AI 解決方案至關重要。

許多組織遵循該流程來構建、測試和訓練 ML 模型。但是您如何提供持續的反饋呢?一旦模型投入生產,這一點尤其重要。數據科學家不能負責管理端到端的機器學習管道。需要一個具有適當技術技能組合的團隊來管理編排。這建立了模型的持續交付週期,並構成了基於 AI 的系統的基礎。

MLOps 涵蓋了數據科學的所有關鍵階段:

  • 準備數據:此階段的重點是了解項目的目標和要求,並準備模型所需的數據。
  • 構建模型:這是數據科學家根據各種不同的建模技術構建和評估各種模型的地方。
  • 部署和監控模型:這是當模型進入可在業務流程中用於決策制定的狀態時。運營方面還確保模型提供預期的業務價值和性能。

實施 MLOps 有很多好處,包括:

  • 為數據科學項目提供商業價值
  • 提高數據科學團隊的效率
  • 允許 ML 模型以更可預測的方式運行並獲得更好的結果
  • 幫助企業提高收入和運營效率
  • 使用高性能模型加速 AI/ML 計劃
  • 推進 ML 進行數位化轉型

使用 Informatica ModelServe 簡化 MLOps

ModelServe是 Informatica 的雲原生 MLOps 解決方案,可簡化 ML 模型部署。它通過簡化和自動化機器學習模型的構建、部署和監控來實現這一點。這有助於企業在幾分鐘內擴展他們的人工智能採用,以實時做出可信的決策。它還結合了對高性能 AI 解決方案至關重要的模型開發和運營技術。

借助 ModelServe,數據科學家和 ML 工程師可以專注於解決業務問題,而不必擔心模型供應基礎設施。ModelServe 可在幾分鐘而不是幾天和幾個月內大規模操作使用幾乎任何工具、框架或數據科學平台構建的高質量且受監管的 AI/ML 模型。幾乎任何應用程序都可以使用模型。

Informatica ModelServe 的主要區別包括:

  • 為數據科學家和機器學習工程師提供簡單、易用、嚮導驅動的方法,以大規模部署和操作 AI/ML 模型
  • 數據科學家和 ML 工程師可以靈活地在幾乎任何框架中構建他們的 AI/ML 模型並在大多數應用程序中使用它們
  • 使數據科學家能夠利用高質量、受信任和受管控的數據加速 AI/ML 計劃
  • 由於簡化和自動化構建、部署和監控機器學習模型的過程,提高了數據科學團隊的生產力
  • 通過使用集成DataOps及時交付可信數據來增強模型性能
  • 通過加快和簡化模型生命週期,更好地專注於為那些使用 ML 管道的人提供高價值的創新任務
  • 數據科學家、機器學習工程師、數據工程師和 IT 運營之間更好的協作
  • 提高機器學習系統的可靠性、性能、可擴展性和安全性
  • 提高AI/ML 項目的投資回報率

Informatica ModelServe 中的功能、階段和步驟

以下是操作 ML 模型的步驟以及有關它如何使數據科學家和 ML 工程師操作 ML 模型的描述:

  1. 模型註冊:數據科學家可以使用 Python、TensorFlow、Spark ML、Keras 等 AI/ML 框架構建模型,並註冊模型。
  2. 模型部署:註冊模型後,數據科學家可以在幾分鐘(而不是幾天或幾週)內將 AI/ML 模型部署到無服務器環境中,而無需擔心模型配置基礎設施。
  3. 模型監控:借助 Informatica ModelServe,您可以在單一窗格中監控已部署模型的性能、檢測異常情況並採取補救措施,例如重新訓練模型。監控後,該模型幾乎可以在任何應用程序中使用。

(註1)https://www.forbes.com/sites/gilpress/2020/01/13/ai-stats-news-only-146-of-firms-have-deployed-ai-capabilities-in-production/?sh= 736e5b6e2650