由于這些數(shù)據(jù)存于數(shù)據(jù)庫(kù)中,而且日期是恒定的,所以對(duì)這些數(shù)據(jù)進(jìn)行跨地域處理或相關(guān)性分析就很直接了。
例如,由于節(jié)假日期間,新的數(shù)碼相機(jī)經(jīng)常被作為禮物贈(zèng)送,所以,與平時(shí)比起來(lái),節(jié)假日期間的平均照片上載量有很大增長(zhǎng),就不奇怪了。有了這些數(shù)據(jù),我們可以針對(duì)相同日期計(jì)算出其他值來(lái),所以,我們能夠毫無(wú)困難地觀察平均上載大小是如何增加磁盤(pán)空間消耗的(因?yàn)檎掌脑汲叽缱兇罅?,從而相應(yīng)地增加Flickr Pro賬號(hào)的訂購(gòu)量(與免費(fèi)賬號(hào)相比,Pro賬號(hào)沒(méi)有容量限制)。
有了這些高層數(shù)據(jù)之后,你的機(jī)構(gòu)中面向產(chǎn)品的那些人對(duì)這些數(shù)據(jù)也抱有極大的興趣,你一點(diǎn)都不用感到驚訝。雖然你可能是用磁盤(pán)空間消耗數(shù)據(jù)為存儲(chǔ)需求做容量規(guī)劃,但他們卻另有看法,比如,這些使用情況的數(shù)據(jù)可以幫助他們做功能發(fā)布的時(shí)間表。網(wǎng)站使用情況有助于制定產(chǎn)品路線圖,產(chǎn)品路線圖有助于容量規(guī)劃,容量規(guī)劃有助于預(yù)算以及基礎(chǔ)架構(gòu)的前途,等等。你很慶幸是以一種簡(jiǎn)單且可移植的格式存儲(chǔ)這些數(shù)據(jù)的,因?yàn)闄C(jī)構(gòu)中的任何人都可能用到這些數(shù)據(jù)。
對(duì)于應(yīng)用層面的數(shù)據(jù),最有用的是能夠跟蹤用戶的交互情況。比如一個(gè)社會(huì)網(wǎng)絡(luò)站點(diǎn),用戶可以與其他用戶成為為“好友”、上載照片,或在其他用戶頁(yè)面上發(fā)表評(píng)論。記錄這些事件是不能用正規(guī)的時(shí)間間隔的方法的,這與采集CPU測(cè)量數(shù)據(jù)不同,采集CPU數(shù)據(jù)用的是正規(guī)的時(shí)間間隔方法一比如說(shuō),每隔15秒進(jìn)行采樣。這種方法與前述將每天發(fā)生的事件進(jìn)行累加的方式也不同。將這些非周期性事件與周期性事件進(jìn)行相關(guān)性分析時(shí),要確保時(shí)間尺度是固定的。
Flickr的這種非正規(guī)類型的一個(gè)例子如下:我們發(fā)布了一個(gè)功能,讓你導(dǎo)入各種郵件地址簿,并將這些地址簿中的名字及郵箱與你還不是聯(lián)系人的網(wǎng)站成員進(jìn)行關(guān)聯(lián),然后批量添加聯(lián)系人。如果我們只是將每天產(chǎn)生了多少聯(lián)系人進(jìn)行累加的話,我們?cè)趫D上就會(huì)看到那個(gè)數(shù)據(jù)點(diǎn)上有個(gè)跳變,但這個(gè)功能發(fā)布后,并沒(méi)有看到跳變,在隨后的數(shù)小時(shí)一直到下周,也都沒(méi)有看到。同樣的情況還有用戶對(duì)照片進(jìn)行標(biāo)注(tagging)的功能。了解這些信息有助于我們將來(lái)如何發(fā)布網(wǎng)站建設(shè)新功能,那就是一在發(fā)布功能之前,我們應(yīng)該準(zhǔn)備數(shù)據(jù)采集(對(duì)這些情況而言,就是一張MYSQL的匯總表)。
本文地址:http://www.khwajamoinuddinchishty.com//article/3310.html