GameLook報道/和電影相同,游戲是一門綜合藝術,又具有典型的工業(yè)化特征,其復雜性也使得人們需要一套適宜的評價體系,讓專業(yè)或主流的聲音,幫助預先判斷品質。
近幾年來,游戲廠商越來越感受到,游戲評分太重要了,特別是TapTap、Steam流行后,玩游戲先看評分已成定勢。開服評分雪崩,也幾乎成為每個廠商都經歷過的噩夢和必修課,也促成當下普遍的“討好型”“道歉型”運營出現(xiàn)。
但是,好評分與差評分,是否又與游戲收入正相關?其實又不盡然,前段時間,GameLook報道了一款AVG手游《圣歌德嘉的晚鐘》,因創(chuàng)意獨特、質量上乘,在TapTap上玩家毫不吝嗇溢美之詞,給出了9.9分的高分。原本皆大歡喜,但業(yè)內某廠商高管不無擔憂地向GameLook表示:
“一看9.9的評分,心里就為他們捏了一把汗。TapTap上高評分的,基本都死了。中等評分左右才有機會活下去。好殘酷。”
這一說法略有絕對,但又并非毫無道理,一定程度反映了當下游戲評分與收入的“倒掛”現(xiàn)象。
高分低能、低分高能,游戲評分與收入倒掛
判別“賺大錢”手游最權威的指標,是App Store暢銷榜,以5月11日暢銷榜為準,GameLook統(tǒng)計了TOP50產品的評分數據。
App Store評分采取滿分5分制,50款游戲評分最高4.9分、最低3分,平均4.3分,這表示App Store評分與收入呈現(xiàn)正相關。
不過,App Store評分哪都好,最大的問題是“沒人信”。
很多玩家和媒體認為,App Store刷評論問題過于嚴重,盡管蘋果不斷更新算法規(guī)則,但外界一直認為其未有太多的規(guī)制手段,因此玩家對于App Store評分真實性信任度不高。
TapTap評分以真實性著稱,聯(lián)合創(chuàng)始人張乾也曾表示玩家、開發(fā)者與TapTap之間的信任感是“最寶貴的”,所以不會應廠商要求改評分。那么中國市場最賺錢的50款產品,在TapTap真實的評分系統(tǒng)是什么情況?
TapTap采取滿分10分制,排除TOP50內4款未上架TapTap的產品,46款游戲TapTap評分最高8.6分、最低1.6分,平均5.9分,剛好沒及格。
換言之,在玩家眼中好的游戲不賺錢,賺錢的游戲又沒那么好,是為“高分低能”“低分高能”。
為什么會這樣?
我們或許可以用“幸存者偏差”來解釋。暢銷的基礎是人氣,而高人氣的游戲,同比例放大往往不滿的玩家也多,加上評分往往被玩家視作投訴的方式,加劇了不理性差評的現(xiàn)象,使得評分失真。根據“沉默的大多數”理論,好評的玩家會遠遠小于差評的玩家,最終導致暢銷產品評分不高。這是從旁觀者角度看玩家,所發(fā)散的觀點,用以解釋“低分緣何高能”。
當然,今天無論是Steam還是TapTap,都啟動了評分保護機制,在發(fā)生因不可抗力事故引發(fā)的差評狂潮時,可以在一定時間內鎖定游戲評分。
差評打擊效果明顯,好評其實沒那么有用
不只是玩家,游戲廠商、渠道同樣有發(fā)言權。
2017年騰訊全球合作伙伴大會分論壇上,圓桌環(huán)節(jié)GameLook曾與莉莉絲創(chuàng)始人兼CEO王信文、祖龍創(chuàng)始人兼CEO李青,以及騰訊應用寶游戲負責人于小雨等業(yè)內人士討論過游戲評分的問題。
王信文坦陳,游戲評分確實會影響買量下載轉化率,莉莉絲經驗之談是:“(App Store)4分以上比較好,但4.2分、4.5分、4.8分之間沒有本質影響,3.5分到4分之間會使買量(下載轉化率)有一定下降,3.5分以下會有顯著下降。”
App Store評分系統(tǒng)有一個潛在的特質,它顯示的評分是最新版本的評分,而Google Play、TapTap均顯示歷史版本的累積評分。這使得App Store評分相對好處理,即便差評爆發(fā),廠商也可以爆肝發(fā)布一個優(yōu)化的新版,只要質量足夠高,評分就會回升。
也就是說,App Store確實有廠商“人為干預”的部分,但這部分同樣是在蘋果規(guī)則之內進行。TapTap盡管相對回升困難,但依據玩家意見修改后,評分回升的可能性也很高,包括《明日方舟》《戰(zhàn)雙帕米什》《山海鏡花》等產品,均有評分回升經歷。
總體來說,差的評分對游戲表現(xiàn)的確有負面影響,但好的評分正面影響又沒那么強。
李青也認同,游戲評分有一個門檻,過了之后,“對于買量的影響就沒有那么高了”。而二者都提到了一個游戲受眾的問題,與電影不同,高評分的電影意味所有觀眾都有可能買票走進影院,但手殘的玩家絕不會入坑吃雞、喜歡刺激的玩家總是拒絕模擬經營。換言之,游戲玩家相互之間是割裂的。
王信文和李青,都以各自旗下某款真實產品遭遇為例,探討了評分和收入的倒掛現(xiàn)象,如李青所說“我們推了一款產品,分巨高,但沒多少人玩,因為用戶群太窄”。
回到開頭某廠商高管的說法,其所擔憂的,正是《圣歌德嘉的晚鐘》評分超高背后折射的受眾規(guī)模大小。
測試前置緩解倒掛,高評分更需足量用戶支撐
有趣的是,游戲廠商大多認可App Store與TapTap評分的真實性,盡管就目前來看,它們所體現(xiàn)的都是“部分的真實”,但反過來說,“全部的真實”又怎么能夠通過單一平臺評分實現(xiàn)呢?不過李青覺得,得益市場和媒體的發(fā)展,各平臺評分會逐步接近100%真實的玩家想法。
而在于小雨看來,“離開渠道的評分都是耍流氓”,無論分的高低,始終要配合流量和用戶運營才最重要。
王信文、李青和于小雨提供了一種解決“高分低能”“低分高能”怪誕現(xiàn)象的設想,即辯證看待玩家評分,通過足量的用戶群去支撐玩家評分的價值。
我們可以討論海外廠商的做法,以“行業(yè)偶像”Supercell為例,它的解決手段是做好前置測試,將完整的游戲,先行在新西蘭等小市場進行軟啟動,模擬大市場情況,最大限度汲取玩家意見協(xié)助優(yōu)化。
Supercell做法關鍵點在于游戲的“完整”、以及目標市場的參照市場,與之相對,國內游戲測試時產品往往不是完整的,這個“完整”的定義并非玩法、美術、劇情完成度,而是是否具備商業(yè)變現(xiàn)系統(tǒng)。
因而我們能夠看到,許多國產游戲,甚至包括商業(yè)化大作,雖然測試期分數高到不正常,動輒9點幾,但一旦公測加入內購或廣告變現(xiàn),評分立刻跳水。剝離商業(yè)系統(tǒng)與完整版本之間體驗的巨大反差,讓暢銷游戲承擔了過多的罵名。
然而,國內市場環(huán)境杜絕了完整游戲測試的可能性,但海外市場打開了另一扇窗。
以莉莉絲為例,同樣對于測試十分看重,甚至采取和超休閑游戲一樣的做法,將測試前置到前所未有的創(chuàng)意階段,如發(fā)行負責人張子龍就曾透露,從《萬國覺醒》開始莉莉絲就在Demo階段開啟畫風吸量測試,過程花了幾個月。
同時和Supercell一樣,莉莉絲在軟啟動時期,便十分重視“打透樣板國家”,針對主流的中、美、日、韓等市場選擇10余個樣板后,還要至少測兩個月,找對目標用戶,將樣板國家數據挖干凈,最終確定游戲上線后的用戶規(guī)模。
相對的,經常發(fā)行獨立游戲的雷霆則是另一種“小而美”的典范,通過在發(fā)行上保持足夠的克制,而非全球性大范圍的轟炸,達到目標效果。當然,這也建立在提前預判獨立游戲小眾,找準核心用戶的基礎之上。
結語
“高分低能”“低分高能”是一種不正常的倒掛現(xiàn)象,它產生原因很復雜,有自媒體的發(fā)達、玩家審美上升、幸存者偏差等等。在現(xiàn)有環(huán)境下,徹底告別該現(xiàn)象可能性很小,但減少其影響和發(fā)生又并非不可能,更完善的測試,目前就不失為一種有效的方案。
歸根結底,沒有足夠的用戶群支撐,評分再高游戲長線運營也受到限制,反之高評分雖然作用沒有想象的那么重要,但一旦低于一個節(jié)點,對于產品的打擊性同樣致命。如何拿捏平衡,考驗的不只是廠商研發(fā),更有對核心用戶的定位和理解能力。
文章來源于:https://www.gamelook.com.cn/2020/05/385701 作者:GameLook