近幾年相信各位大大應該很常聽見“大數據(big data)”這個名詞,許多的公司或是產品都一定要和bigggg data沾上邊才會有賣點,使用者才會覺得很炫酷~身為一個“前”數據分析師,覺得應該要站出來和各位觀眾略略解釋一下在互聯(lián)網產業(yè)的數據分析相關知識與應用。首先,來定義一下大數據big data這個虛幻的名詞,一般夠格被稱為big data的話應該具備三個V的特性:
數據量(Volume)
數據類型(Variety)
數據傳輸速度(Velocity)
顧名思義就是數據要大、要多元、也要有夠快的數據傳輸處理速度,而現在有更多的V被加入到討論之中,其中最為重要的為資料真實性(Veracity),以現今互聯(lián)網發(fā)展的趨勢而言,誰管你數據多大、多多、處理多快,數據要夠真實才有應用的價值,所以說不要再被big data這高大上的名詞給蒙騙了~
而AppsFlyer絕對夠格被稱為一個優(yōu)質的數據公司,光是2018上半年就記錄了145億的App安裝數、250億次App打開次數(數據源:AppsFlyer Performance Index VII),并具備能讓廣告主得到實時歸因的安裝信息的技術,最重要的是數據的真實性,也是備受業(yè)界推崇。所以說除了數據的多元性本人無法透過AppsFlyer所擁有的數據來呈現給大家外,在這個講求數據的時代,各位觀眾可以充分利用AppsFlyer,來幫助壯大自己的App事業(yè)喔。
再來應該是各位觀眾比較關心的事,
我在AppsFlyer拿了那么多Raw Data,
能做什么呢?
原始數據報告(Raw Data Report)為本人最喜愛的功能,沒有之一(第二名是Protect360防作弊功能),因為在AppsFlyer Dashboard上面9成的數字都是從原始數據報告來的,能夠獲取原始數據的話,自然就能夠無限的發(fā)揮想象去做任何的數據分析。一般來說要做數據分析的時候會follow以下步驟:
·提出問題
·提出假設
·獲取原始資料
·分析證明
·得出結論
舉例來說,我覺得用iPhone的人在我的App中應該是重點關注族群,因為iPhone比較貴,所以用iPhone的人消費力應該會比較強,那我的問題與假設就出來了:是否iPhone使用者具有更高的消費力?有了問題與假設后,再來就是獲取資料,而AppsFlyer的Raw Data正好有消費事件(如果有打點的話)和Platform的數據,假設數據量不多的話,可以簡單從Excel觀察即可,如果數據量過大(Excel只能看200K個Row),可以把數據匯入Data Base下SQL指令去觀察,甚至可以用Python、R(都有現成的統(tǒng)計模型套件可以使用)這種分析軟件跑個線性回歸或是分群來看不同參數對于購買力的影響。
最后為了方便大家,附上原始數據報告相關文件(https://support.appsflyer.com/hc/en-us/articles/208387843-Raw-Data-Reports-V5),其中有關于各字段的定義和解釋,還有Sample Data提供試用,比較常用的有attributed_touch_time(廣告點擊時間)、install_time(App激活時間)、event_time(事件觸發(fā)時間)三個時間字段可用來分析,media_source、campaign、af_adset、af_ad可用來看每個install的來源,appsflyer_id、advertising_id、idfa、customer_user_id可用來針對某個特定裝置或和你自己BI里的數據做mapping,如此一來廣告主最欠缺的App外數據(激活App之前的歸因數據)就可以和App內數據完美接軌了~有了這些精美的素材,就能隨心所欲來分析數據或用ggplot做出各種高質量的圖啦~