网站时间辨别率和存留时间的思索
发布日期:2023-04-11浏览量:141
在时间轴上记载数据的应战之一,就是怎样针对你的运用目的,将数据量连结在可管理的范畴内。磁盘空间的确比之前自制多了,并且可能存储多少tb的数据也没有问题,然而,跟着数据的不竭增进,确保这些数据可能一直可查询和可移动(若是需求的话),则是理智的。
有些零碎采用高辨别率采集数据,并存入关系数据库中。如许做,解决了数据自力查询的问题,并且也可能用sql对这些数据做些处置,这对不少工程师来说,是一个相对于直接办的工作。并且,由于采集的这些数据历来不会删除,末了将获得一个相对于规整的数据库,而规整性必定有利于数据库的机能,并且,对付大规模数据库来说,也可能维持其效力。
就个人而言,用一个已成为事实标准的存储零碎来存储丈量数据的话,我还没发现会短少甚么,这个存储零碎就是轮回数据库(round robin database,rrd)。rrd的根本思惟是,跟着时间的推移,一旦到达某个你选定的周期(小时、天、周、月、年),则有意地低落数据的辨别率。如许样做的理由是,大大都丈量数据只是在比来的时间周期内有意思,并且另一个益处就是rrd的数据文件不会增进到跨越限定,这象征着你不消担忧磁盘空间的问题。
许多零碎都有rrd的辨别率界说,即对付磁盘空间接纳守旧做法,从一小时起头就从最高辨别率往降落。这知足你的请求吗?或许知足,也或许不知足,取决于是甚么丈量数据,从哪一个时间点起头运用这些数据,以及从整个应用来说单个的丈量数占有多首要。我已经看到有的机构保留了若干年的、有几千个丈量指标的、辨别率为10秒的数据,也看到其余胜利的公司,他们的做法是比来一小时的辨别率是15秒,比来一天的辨别率是1分钟,而比来一周的辨别率是5分钟。很明明,由于没法回到已往获得更多细节数据,以是应将辨别率配置为多粒度的。
高辨别率数据应存留多永劫间呢?这也是一个七嘴八舌的问题。就我个人而言,我历来不需求知道www125服务器的cpu在2005年2月10日的12:34:50和12:34:60这两个时间点的情况,但我对2005年一切web服务器在每周的峰值情况会颇有乐趣,以是我对最大值均值的保留时间会比原始数据的保留时间要长。像辨别率的情况同样,若是你发现管理起来有问题,则数据的存留时间(retention)可以调小一点。
在决议丈量的辨别率时,要想分明它们的运用情况。你要查看这些数据以找出宕机或机能降落的起因吗?若是是的话,你就要将辨别率设得高一点,小于一分钟。你要将数据用于以三、6或9个月的时间尺度做容量布局吗?是的话,你就要将最大值和最小值的数据保留得更长一些。
还要让这些数据帮你获得形式的汗青意思,用这些数据答复下面的问题时,丈量数据采集零碎会真正出彩的:
● 对某个特定,天天的峰值时是哪些?每周周的峰值日是哪些?每一年的峰值月是哪些?
● 有时节性形式吗?如夏时日会低些,节沐日会高些,峰值会泛起在黉舍上课时期,等等。
● 最大(波峰)值与最小(波谷)值比力起来怎么样?
● 在网站制作用户散布于寰球、跨越多个时区的情况下,波峰与波谷的关系是否产生变革?
相关文章: