追踪网站高层营业或功用特定的丈量数据
发布日期:2023-04-03浏览量:135
常规用这些数据追踪网站事宜。就flickr来讲,暗示上载照片数、新用户注册数、均匀照片大小、总的磁盘空间耗费量、卖出出了几个pro账号、有几个乞助信息登记及解决了几个,等等。由于这些数据普通用来做恒久趋向阐明,以便进行商品展望或容量布局,因而,以天为采集频度就够了。增加辨别率,一天多采几回,对后果没有任何影响,反而增加生成报表的时间,数据移动起来也很贫苦。天天采集一次这些数据很简略,天天夜里运转一个cron功课便可,将数据存入复制用的数据库子机,这台数据库子机就是用来处置这些数据的。
由于这些数据存于数据库中,并且日期是恒定的,以是对这些数据进行跨地区处置或相干性阐明就很直接了。
比方,由于节沐日时期,新的数码相机常常被作为礼品赠予,以是,与日常平凡比起来,节沐日时期的均匀照片上载量有很大增进,就不新鲜了。有了这些数据,咱们可以针对沟通日期计较出其余值来,以是,咱们能够毫无坚苦地察看均匀上载大小是怎样增加磁盘空间耗费的(由于照片的原始尺寸变大了),从而响应地增加flickr pro账号的订购量(与免费账号比拟,pro账号没有容量限定)。
有了这些高层数据之后,你的机构中面向商品的那些人对这些数据也抱有极大的乐趣,你一点都不消感触惊叹。尽管你能够是用磁盘空间耗费数据为存储需要做容量布局,但他们却另有观念,,这些运用情况的数据可以协助他们做功用发布的时间表。网站运用情况有助于拟定商品线路图,商品线路图有助于容量布局,容量布局有助于估算以及根蒂根基架构的出路,等等。你很庆幸是以一种简略且可移植的格局存储这些数据的,由于机构中的任何人均能够用到这些数据。
对付应用层面的数据,最有效的是能够跟踪用户的交互情况。一个社会网络站点,用户可以与其余用户成为为“摰友”、上载照片,或在其余用户页面上颁发评论。记载这些事宜是不克不及用正规的时间距离的要领的,这与采集cpu丈量数据差别,采集cpu数据用的是正规的时间距离要领一说,每隔15秒进行采样。这类要领与前述将天天发生的事宜进行累加的体式格局也差别。将这些非周期性事宜与周期性事宜进行相干性阐明时,要确保时间尺度是固定的。
flickr的这类非正规类型的一个例子以下:咱们发布了一个功用,让你导入各类邮件地址簿,并将这些地址簿中的名字及邮箱与你还不是接洽人的网站成员进行联系关系,而后批量增加接洽人。若是咱们只是将天天发生了几个接洽人进行累加的话,咱们在图上就会看到谁人数据点上有个跳变,但这个功用发布后,并无看到跳变,在随后的数小时一直到下周,也都没有看到。一样的情况另有效户比照片进行标注(tagging)的功用。理解这些信息有助于咱们未来怎样发布网站制作新功用,那就是一在发布功用以前,咱们应该筹备数据采集(对这些情况而言,就是一张mysql的汇总表)。
相关文章: