數(shù)據(jù)模型實操指南
編者按:本文來自微信公眾號“Kevin改變世界的點滴”(ID:Kevingbsjddd),作者:Kevin改變世界的點滴,36氪經(jīng)授權(quán)發(fā)布。
數(shù)據(jù)能力是產(chǎn)品經(jīng)理的基礎(chǔ)能力之一。和原型、文檔、需求調(diào)研普及能力對比起來同樣重要?;ヂ?lián)網(wǎng)公司都離不開數(shù)據(jù),無論是冷啟動周期的種子用戶、還是增長期的留存用戶,有數(shù)據(jù)基礎(chǔ)知識同時要求產(chǎn)品經(jīng)理區(qū)分業(yè)務(wù)數(shù)據(jù)和用戶行為數(shù)據(jù)、定義數(shù)據(jù)口徑、搞清楚數(shù)據(jù)來源。
由于近期在負責數(shù)據(jù)中臺的搭建,我也來分享下我們在數(shù)據(jù)模型產(chǎn)品的建立過程。整個過程分為數(shù)據(jù)可視化面板設(shè)計、數(shù)據(jù)口徑、數(shù)據(jù)來源、數(shù)據(jù)挖掘4個維度分享。
1.數(shù)據(jù)可視化面板設(shè)計(難度:簡單)
目前市面上有較多以vue、react、JS的可視化數(shù)據(jù)效果。
比如jquery插件庫:https://www.jq22.com/
可以幫助找到開源、可用的酷炫交互動畫。這里基本只能幫助在數(shù)據(jù)可視化上展示更為“酷炫”,但實際上和數(shù)據(jù)圖表仍然要去比如螞蟻數(shù)據(jù)可視化、DBAPLUS上有通用的數(shù)據(jù)圖表。
▲開源的jquery插件
快速實現(xiàn)數(shù)據(jù)可視化效果。在數(shù)據(jù)可視化里,我們常用扇形、柱狀、柱狀圖、熱力圖來展現(xiàn)數(shù)據(jù)。
阿里的G2數(shù)據(jù)可視化引擎https://g2.antv.vision/zh
▲數(shù)據(jù)可視化圖表
找到適合數(shù)據(jù)場景的圖形即可,比如用戶畫像顯然是扇形比例會比柱狀圖更有優(yōu)勢。用戶增長趨勢則用柱狀圖比扇形。
涉及到數(shù)據(jù)挖掘的模型,比如漏斗模型、頁面路徑展示,都可以用上面的開源圖標完成。
2.數(shù)據(jù)口徑、場景定義(難度:中等)
數(shù)據(jù)的采集可以來前端埋點、還可以后端服務(wù)計算,比如H5要依托于前端的埋點,才可以有用戶行為數(shù)據(jù)。而訂單的狀態(tài)則需要依托于服務(wù)端判斷才有。
在數(shù)據(jù)口徑定以前,還有做數(shù)據(jù)依托于運營視角的歸類,比如什么數(shù)據(jù)屬于公共部分、什么數(shù)據(jù)屬于某個產(chǎn)品線的、還有什么數(shù)據(jù)是屬于某個用戶行為、場景才會產(chǎn)生的。
▲數(shù)據(jù)模型設(shè)計表
比如上圖我們建立了公共數(shù)據(jù)概覽、用戶生命周期2個不同歸類看板。目的就是拆分不同的數(shù)據(jù)場景。
比如第三方短信平臺的消息發(fā)送數(shù)量、消息發(fā)送成功、發(fā)送失敗數(shù)量,是平臺系統(tǒng)類型的數(shù)據(jù)。和用戶行為無關(guān),歸屬于公共類數(shù)據(jù)。
用戶生命周期則將數(shù)據(jù)和用戶行為結(jié)合分為回流用戶、活躍用戶、新用戶、流失用戶4類。因此只要處于用戶生命周期類場景的數(shù)據(jù)模型都將放在這個面板中。
在上面文檔里面的從左到右分別是數(shù)據(jù)字段\模型名稱、數(shù)據(jù)定義、數(shù)據(jù)說明、數(shù)據(jù)統(tǒng)計場景。
數(shù)據(jù)口徑定義是未來開發(fā)人員、產(chǎn)品部門、數(shù)據(jù)運營同學的數(shù)據(jù)詞典,一旦定義不清楚,即無法完成埋點、也無法完成數(shù)據(jù)清洗工作。同時要知道數(shù)據(jù)口徑定義還會隨著數(shù)據(jù)中心迭代而不斷維護,要求在一定的規(guī)則下繼續(xù)更新。
比如業(yè)務(wù)規(guī)范詞、數(shù)據(jù)名詞、統(tǒng)計單位說明,再加上版本號、或更新人員、業(yè)務(wù)部門。
3.調(diào)研數(shù)據(jù)源頭(難度:困難)
在實際生產(chǎn)環(huán)境中,我們可能面臨因為產(chǎn)品處于運營早期、甚至是有的數(shù)據(jù)源頭是第三方、跨部門提供的。
對方到底怎么統(tǒng)計、如何采集、能不能有對應(yīng)數(shù)據(jù)來源,需要產(chǎn)品經(jīng)理找到開發(fā)同學定義、廠商進行調(diào)研,比如上圖的短信發(fā)送成功、狀態(tài)等數(shù)據(jù),是來自短信第三方平臺提供,確保數(shù)據(jù)源是可有的,而不是產(chǎn)品經(jīng)理自己YY,建立一張可用的數(shù)據(jù)口徑表,是數(shù)據(jù)建設(shè)的核心之一。
現(xiàn)在數(shù)據(jù)源頭對接的2種形式
第1種形式:無任何規(guī)則的雜亂數(shù)據(jù)
由于一開始并沒有重視這部分數(shù)據(jù)工作,導致數(shù)據(jù)就簡單以日志、或MySQL的方式存儲在服務(wù)端。沒有建立對應(yīng)的數(shù)倉做相應(yīng)數(shù)據(jù)管理,
第2種形式:數(shù)據(jù)的接入是手動接入
在跨部門、和第三方公司合作上,有部分數(shù)據(jù)屬于新業(yè)務(wù),導致經(jīng)常出現(xiàn)對方?jīng)]有時間提供接口。所以手動導入Excel表格的方式是早期數(shù)據(jù)中臺建立的時候場景方式。
而產(chǎn)品經(jīng)理主要搞清楚數(shù)據(jù)來源是誰,比如是第三方、還是公司內(nèi)部其他產(chǎn)品。內(nèi)部走OA流程、郵件審批,外部第三方則走注冊、資質(zhì)申請、材料填寫。因為數(shù)據(jù)來源最難的是得到數(shù)據(jù)使用權(quán)限。
比如上面我們的數(shù)據(jù)統(tǒng)計表格里有短信供應(yīng)商、前端埋點、第三方廠商集合數(shù)據(jù),將所有來源進行匯總才能最后成為自己的數(shù)據(jù)模型。
當然以上2種方式,都最后要達成以接口的方式,實現(xiàn)實時統(tǒng)計。才能將數(shù)據(jù)中心真正的建立起來。前期人工導入、和數(shù)據(jù)規(guī)則定義都是為了后面接口的重要步驟。
好今天的分享就在這里。