實際工作中,我們往往依託於業務資料分析制定業務策略。這個過程需要頻繁地進行資料分析和挖掘,發現模式規律。對於演演算法工程師而言,一個有效的 AI 演算法系統落地,不僅僅是模型這麼簡單——資料才是最底層的驅動。
典型的『機器學習工作流程』包含 6 個關鍵步驟,其中『探索性資料分析(Exploratory Data Analysis, EDA) 』是至關重要的一步。
Wiki: In statistics, exploratory data analysis is an approach of analyzing data sets to summarize their main characteristics, often using statistical graphics and other data visualization methods. A statistical model can be used or not, but primarily EDA is for seeing what the data can tell us beyond the formal modeling and thereby contrasts traditional hypothesis testing.
優秀的工具可以簡化上述過程!甚至可以一鍵生成分析報告。本篇 ShowMeAI 給大家總結了截至 2022年 最受歡迎的探索式資料分析工具庫,快一起試起來吧!
通常,我們有以下 3 種方式進行 EDA: