1. 數據發現使您能夠查找、理解和信任您的數據 數據發現始於掃描組織環境中的數據,其中可能包括本地或基於雲的源,從數據倉庫到 ETL 和 BI 工具、SAAS 應用程序等。找到數據後,您可以發現有關它的更多資訊,例如其結構、內容和關係。此資訊可用於對數據進行編目、豐富其元數據並提供上下文以幫助您了解存在哪些數據、其來源、其沿襲、它與其他數據的關係等。
提高透明度並使人們能夠找到並全面了解您組織的數據可以建立對它的信任,這對於數據驅動的組織來說是必不可少的。
2. 自動化是數據發現的關鍵
雖然數據發現可以手動執行,但對於擁有龐大數據環境的組織來說並不理想——它根本不具備可擴展性,因為在廣泛的來源中發現數據可能是一個極其複雜、昂貴且耗時的過程。
幸運的是,組織可以使用分類和叢集等人工智能 (AI) 技術來促進數據發現。當數據科學家和分析師不必花時間手動執行數據發現時,他們可以將更多時間花在工作上,從而節省組織的時間和金錢。 在我們的電子書《通過 AI 支持的數據發現從您的數據中提取價值》中閱讀有關基於 AI 的發現技術的更多資訊。
3.人工智能和人類智能是一個成功的組合
雖然組織可以依靠人工智能來進行可擴展的數據發現,但人類智能可以增強這一過程。人工審查和管理數據資產可以增強和改進 AI 驅動的數據發現。例如,在數據目錄中,個人能夠提供額外的業務上下文,並能夠對 AI 策劃的資產進行認證、評級和審查,從而幫助用戶更多地了解數據。
當發生人工參與時,利用批量操作等方法有助於加快重複性任務並優化效率。此外,在智能數據目錄中,可以使用人工輸入和反饋來訓練 AI,以進一步完善和提高前面提到的自動數據發現過程(即分類等)的準確性。