數(shù)據(jù)模型實(shí)操指南
編者按:本文來(lái)自微信公眾號(hào)“Kevin改變世界的點(diǎn)滴”(ID:Kevingbsjddd),作者:Kevin改變世界的點(diǎn)滴,36氪經(jīng)授權(quán)發(fā)布。
數(shù)據(jù)能力是產(chǎn)品經(jīng)理的基礎(chǔ)能力之一。和原型、文檔、需求調(diào)研普及能力對(duì)比起來(lái)同樣重要?;ヂ?lián)網(wǎng)公司都離不開(kāi)數(shù)據(jù),無(wú)論是冷啟動(dòng)周期的種子用戶、還是增長(zhǎng)期的留存用戶,有數(shù)據(jù)基礎(chǔ)知識(shí)同時(shí)要求產(chǎn)品經(jīng)理區(qū)分業(yè)務(wù)數(shù)據(jù)和用戶行為數(shù)據(jù)、定義數(shù)據(jù)口徑、搞清楚數(shù)據(jù)來(lái)源。
由于近期在負(fù)責(zé)數(shù)據(jù)中臺(tái)的搭建,我也來(lái)分享下我們?cè)跀?shù)據(jù)模型產(chǎn)品的建立過(guò)程。整個(gè)過(guò)程分為數(shù)據(jù)可視化面板設(shè)計(jì)、數(shù)據(jù)口徑、數(shù)據(jù)來(lái)源、數(shù)據(jù)挖掘4個(gè)維度分享。
1.數(shù)據(jù)可視化面板設(shè)計(jì)(難度:簡(jiǎn)單)
目前市面上有較多以vue、react、JS的可視化數(shù)據(jù)效果。
比如jquery插件庫(kù):https://www.jq22.com/
可以幫助找到開(kāi)源、可用的酷炫交互動(dòng)畫。這里基本只能幫助在數(shù)據(jù)可視化上展示更為“酷炫”,但實(shí)際上和數(shù)據(jù)圖表仍然要去比如螞蟻數(shù)據(jù)可視化、DBAPLUS上有通用的數(shù)據(jù)圖表。
▲開(kāi)源的jquery插件
快速實(shí)現(xiàn)數(shù)據(jù)可視化效果。在數(shù)據(jù)可視化里,我們常用扇形、柱狀、柱狀圖、熱力圖來(lái)展現(xiàn)數(shù)據(jù)。
阿里的G2數(shù)據(jù)可視化引擎https://g2.antv.vision/zh
▲數(shù)據(jù)可視化圖表
找到適合數(shù)據(jù)場(chǎng)景的圖形即可,比如用戶畫像顯然是扇形比例會(huì)比柱狀圖更有優(yōu)勢(shì)。用戶增長(zhǎng)趨勢(shì)則用柱狀圖比扇形。
涉及到數(shù)據(jù)挖掘的模型,比如漏斗模型、頁(yè)面路徑展示,都可以用上面的開(kāi)源圖標(biāo)完成。
2.數(shù)據(jù)口徑、場(chǎng)景定義(難度:中等)
數(shù)據(jù)的采集可以來(lái)前端埋點(diǎn)、還可以后端服務(wù)計(jì)算,比如H5要依托于前端的埋點(diǎn),才可以有用戶行為數(shù)據(jù)。而訂單的狀態(tài)則需要依托于服務(wù)端判斷才有。
在數(shù)據(jù)口徑定以前,還有做數(shù)據(jù)依托于運(yùn)營(yíng)視角的歸類,比如什么數(shù)據(jù)屬于公共部分、什么數(shù)據(jù)屬于某個(gè)產(chǎn)品線的、還有什么數(shù)據(jù)是屬于某個(gè)用戶行為、場(chǎng)景才會(huì)產(chǎn)生的。
▲數(shù)據(jù)模型設(shè)計(jì)表
比如上圖我們建立了公共數(shù)據(jù)概覽、用戶生命周期2個(gè)不同歸類看板。目的就是拆分不同的數(shù)據(jù)場(chǎng)景。
比如第三方短信平臺(tái)的消息發(fā)送數(shù)量、消息發(fā)送成功、發(fā)送失敗數(shù)量,是平臺(tái)系統(tǒng)類型的數(shù)據(jù)。和用戶行為無(wú)關(guān),歸屬于公共類數(shù)據(jù)。
用戶生命周期則將數(shù)據(jù)和用戶行為結(jié)合分為回流用戶、活躍用戶、新用戶、流失用戶4類。因此只要處于用戶生命周期類場(chǎng)景的數(shù)據(jù)模型都將放在這個(gè)面板中。
在上面文檔里面的從左到右分別是數(shù)據(jù)字段\模型名稱、數(shù)據(jù)定義、數(shù)據(jù)說(shuō)明、數(shù)據(jù)統(tǒng)計(jì)場(chǎng)景。
數(shù)據(jù)口徑定義是未來(lái)開(kāi)發(fā)人員、產(chǎn)品部門、數(shù)據(jù)運(yùn)營(yíng)同學(xué)的數(shù)據(jù)詞典,一旦定義不清楚,即無(wú)法完成埋點(diǎn)、也無(wú)法完成數(shù)據(jù)清洗工作。同時(shí)要知道數(shù)據(jù)口徑定義還會(huì)隨著數(shù)據(jù)中心迭代而不斷維護(hù),要求在一定的規(guī)則下繼續(xù)更新。
比如業(yè)務(wù)規(guī)范詞、數(shù)據(jù)名詞、統(tǒng)計(jì)單位說(shuō)明,再加上版本號(hào)、或更新人員、業(yè)務(wù)部門。
3.調(diào)研數(shù)據(jù)源頭(難度:困難)
在實(shí)際生產(chǎn)環(huán)境中,我們可能面臨因?yàn)楫a(chǎn)品處于運(yùn)營(yíng)早期、甚至是有的數(shù)據(jù)源頭是第三方、跨部門提供的。
對(duì)方到底怎么統(tǒng)計(jì)、如何采集、能不能有對(duì)應(yīng)數(shù)據(jù)來(lái)源,需要產(chǎn)品經(jīng)理找到開(kāi)發(fā)同學(xué)定義、廠商進(jìn)行調(diào)研,比如上圖的短信發(fā)送成功、狀態(tài)等數(shù)據(jù),是來(lái)自短信第三方平臺(tái)提供,確保數(shù)據(jù)源是可有的,而不是產(chǎn)品經(jīng)理自己YY,建立一張可用的數(shù)據(jù)口徑表,是數(shù)據(jù)建設(shè)的核心之一。
現(xiàn)在數(shù)據(jù)源頭對(duì)接的2種形式
第1種形式:無(wú)任何規(guī)則的雜亂數(shù)據(jù)
由于一開(kāi)始并沒(méi)有重視這部分?jǐn)?shù)據(jù)工作,導(dǎo)致數(shù)據(jù)就簡(jiǎn)單以日志、或MySQL的方式存儲(chǔ)在服務(wù)端。沒(méi)有建立對(duì)應(yīng)的數(shù)倉(cāng)做相應(yīng)數(shù)據(jù)管理,
第2種形式:數(shù)據(jù)的接入是手動(dòng)接入
在跨部門、和第三方公司合作上,有部分?jǐn)?shù)據(jù)屬于新業(yè)務(wù),導(dǎo)致經(jīng)常出現(xiàn)對(duì)方?jīng)]有時(shí)間提供接口。所以手動(dòng)導(dǎo)入Excel表格的方式是早期數(shù)據(jù)中臺(tái)建立的時(shí)候場(chǎng)景方式。
而產(chǎn)品經(jīng)理主要搞清楚數(shù)據(jù)來(lái)源是誰(shuí),比如是第三方、還是公司內(nèi)部其他產(chǎn)品。內(nèi)部走OA流程、郵件審批,外部第三方則走注冊(cè)、資質(zhì)申請(qǐng)、材料填寫。因?yàn)閿?shù)據(jù)來(lái)源最難的是得到數(shù)據(jù)使用權(quán)限。
比如上面我們的數(shù)據(jù)統(tǒng)計(jì)表格里有短信供應(yīng)商、前端埋點(diǎn)、第三方廠商集合數(shù)據(jù),將所有來(lái)源進(jìn)行匯總才能最后成為自己的數(shù)據(jù)模型。
當(dāng)然以上2種方式,都最后要達(dá)成以接口的方式,實(shí)現(xiàn)實(shí)時(shí)統(tǒng)計(jì)。才能將數(shù)據(jù)中心真正的建立起來(lái)。前期人工導(dǎo)入、和數(shù)據(jù)規(guī)則定義都是為了后面接口的重要步驟。
好今天的分享就在這里。