对RRDTool的总结 | 快乐成长

来源：互联网

RRDtool是指Round Robin Database 工具（环状数据库）。Round robin是一种处理定量数据、以及当前元素指针的技术。想象一个周边标有点的圆环－－这些点就是时间存储的位置。从圆心画一条到圆周的某个点的箭头－－这就是指针。就像我们在一个圆环上一样，没有起点和终点，你可以一直走下去。过来一段时间，所有可用的位置都会被用过，该循环过程会自动重用原来的位置。这样，数据集不会增大，并且不需要维护。我们使用RRDtool来处理RRD数据库。使用它向RRD数据库存储提取数据。
RRD适合存储时间序列的数据。就是说你必须能够在时间的几个点上度量某些值，并提供这些信息给RRDtool。如果你能够做到这一点，RRDtool就能够存储它们。这些数值必须是数字，但是不一定要是整数。
下面的许多例子是关于SNMP的，SNMP是简单网络管理协议的缩写。简单是指协议简单－－并不表示管理或监视网络简单。读完本篇文档后，你应当能够对人们谈论的SNMP有更多的理解。现在，只要知道SNMP可以用来查询设备中保持的计数器的值就可以了。我们要存放到RRD数据库中的正是这些计数器中的数值。
RRDtool源自MRTG（多路由器流量绘图器）。MRTG是有一个大学连接到互联网链路的使用率的小脚本开始的。MRTG后来被当作绘制其他数据源的工具使用，包括温度、速度、电压、输出量等等。
很可能你会从使用RRDtool来存储和处理通过SNMP收集到的数据。这些数据很可能是某个网络或计算机接收或发送的字节数（比特数）。它也可以用来显示潮水的波浪、阳光射线、电力消耗、展会的参观人员、机场附近的噪音等级、你喜欢的度假区的温度、电冰箱的温度、以及任何你可以想象的东西。
你最需要一个度量数据，以及能够提供这些数据给RRDtool的感应器。RRDtool会让你创建数据库、存储数据、提取数据、创建用于在Web浏览器中显示的PNG格式的图像。这些PNG图像来于你收集的数据，它可以是网络平均使用率、峰值等。
首先在此介绍一下常用的RRDtool选项的语法,你可以粗略的读一下,然后看例子,看完之后在仔细的研读语法.
1.如何使用rrdtool创建各种类型、特性的RRD环型数据库。
rrdtool create filename [--start|-b start time] [--step|-s step] [DS:ds-name:DST:dst arguments] 。net[RRA:CF:cf arguments]
说明：
RRDtool的创建功能能够设置一个新的RRD数据库文件。该功能完成所创建的文件全部被预填入 UNKNOWN 数值。
filename
需要创建的RRD的文件名。RRD数据库文件名应当以 .rrd作为扩展名。尽管RRDtool可以接受任何文件名。
--start|-b start time(default: now - 10s)
设定RRD数据库加入的第一个数据值的时间－从1970-01-01 UTC时间以来的时间（秒数）。RRDtool不会接受早于或在指定时刻上的任何数值。
--step|-s step(default: 300 seconds)
指定数据将要被填入RRD数据库的基本的时间间隔（默认是300秒）。
DS:ds-name:DST:dst arguments
单个RRD数据库可以接受来自几个数据源的输入。例如某个指定通讯线路上的进流量和出流量。在DS配置选项中，你必须为每个需要在RRD存储的数据源指定一些基本的属性。
ds-name是你要用来从某个RRD中引用的某个特定的数据源。ds-name必须为［a-zA-Z0-9]间的、长度为1－19个字符组成。
DST定义数据源的类型。数据源项的后续参数依赖于数据源的类型。对于GAUGE、COUNTER、DERIVE、以及ABSOLUTE，其数据源的格式为：
DS:ds-name:GAUGE | COUNTER | DERIVE | ABSOLUTE:heartbeat:min:max
对于COMPUTE数据源，其格式为:
DS:ds-name:COMPUTE:rpn-expression
要确定使用哪种数据源类型，请检查下面的定义。
GAUGE
是像温度计、或者某个房间内的人数、或共享Redhat的值这样的东西。
COUNTER
是像路由器中 ifInOctets 计数器这样会持续递增的计数器。COUNTER数据源假设计算机永远不会减小，除非计数器溢出。update功能可能导致溢出。计算机是按照每秒的频率存储的。当计数器溢出时，RRDtool会检查该溢出是否会发生在32位或64位边界，并且相应的把合适的值加入结果中。
DERIVE
存放该数据源从以往到现在的的差异线。这对于gauges类型非常有用，它可用来衡量进出某个房间的比率。在derive内部，与COUNTER几乎是一样的，但是没有溢出检查。因此，如果你的计数器在32或64位不会复位，你应当使用DERIVE或者用一个MIN值为0的混合使用。
关于COUNTER vs DERIVE的说明
如果你不容许偶尔发生的、某个计数器的合法回绕复位而造成的错误，而要用｀unknowns‘ 来对表示所有计数器的合法回绕和复位，你就要使用min=0的DERIVE类型。否则，使用具有合理max的COUNTER类型，会为所有的合法计数器回绕返回正确的值。
对于一个步长为5分钟的32位计数器，计数器回绕复位的错误概率大约为：每1Mbps的最大带宽发生概率为0.8%.注意这等价于100Mbps接口的80％，因此对于高带宽接口和32位计数器，最好使用带有min=0的DERIVE。如果你使用的是64 位计数器，只有任何最大值的设定可以避免计数器回绕的错误发生的可能性。
ABSOLUTE
读取后马上复位的计数器。用于易于溢出的快速计数器。因此，不要常规地读取他们，你需要自每次读取后确认在下一次溢出前有一个最大的有效时间。该类型的另外一个用途是你需要累积上次更新以来的信息数目。
COMPUTE
用于存放对RRD中的其他数据源进行公式计算的结果。该数据源在更新时不需要提供数值，它是根据rpn－表达式定义的公式从数据源的PDPs中计算出来的PDP（Primary Data Point）。归并功能会被应用到COMPUTE数据源的PDPs上。在数据库软件中，此类数据集用｀虚拟‘ 或 ’计算‘ 列表示。
heartbeat心跳定义了在两次数据源更新之间、在将数据源的数值确定为 UNKNOWN 前所允许的最大秒数。
min和max定义了数据源提供、预期的数值范围。任何数据源的超过min或max数值范围的数值，都将被认为是UNKNOWN 。如果你不知道或者不关心mix和max, 将他们设置为 unknown。注意min和max总是值数据源所处理的数值。对于一个流量计数器类型的DS来说，这可以是预期中该设备获取的数据率。
如果有可用的min／max的值信息，一定要设置min和max属性。这可以帮助RRDtool在更新时对提供的数据进行健壮检查。
rpn－expression定义了由同一个RRD库的其他数据源的计算而来的、某个COMPUTE数据源的PDPs计算公式。这于graph命令的CDEF参数一样。请参看graph手册了解RPN操作符的列表和说明。对于COMPUTE数据源，不支持以下RPN操作符：COUNT、PREV、TIME、和LTIME。此外，在定义RPN表达式时，COMPUTE数据源只能够引用在create命令中列出的数据源。这于CDEF的限制是一样的，CDEF只能够引用在同一个graph命令中前面定义的DEFs和CDEFs。
RRA:CF:cf arguments
RRD的一个目的是在一个环型数据归档中存储数据。一个归档有大量的数据值或者每个已定义的数据源的统计，而且它是在一个RRA行中被定义的。
当一个数据进入RRD数据库时，首先填入到用 -s 选项所定义的步长的时隙中的数据，就成为一个pdp值－首要数据点（Primary Data Point）。
该数据也会被用该归档的CF归并函数进行处理。可以把各个PDPs通过某个聚合函数进行归并的归并函数有这样几种：AVERAGE、MIN、MAX、LAST等。这些归并函数的RRA命令行格式为:
RRA:AVERAGE | MIN | MAX | LAST:xff:steps:rows
xff
xfiles factor定义了在被归并数值仍然是一个未知时，＊UNKNOWN＊数据中，某个归并间隔的哪个部分可以采用。
steps
定义这些PDP中的多少个可以用来构建归并的数据点。
rows
定义在一个RRA归档中保留多少次的生成数据值。
例子例 1
rrdtool create temperature.rrd --step 300 \
DS:temp:GAUGE:600:-273:5000 \
RRA:AVERAGE:0.5:1:1200 \
RRA:MIN:0.5:12:2400 \
RRA:MAX:0.5:12:2400 \
RRA:AVERAGE:0.5:12:2400
上例设置了一个名为 temperature.rrd 的RRD，它每300秒接收一个温度值。如果超过600秒没有提供数据，温度值变为＊UNKNOWN＊。其最小可接受的值为 -273,最高值为5000.
本例中同时还定义了几个归档区。第一个RRA归档区存储100小时内的温度（1200＊300秒＝100小时）。第二个RRA存储每小时的最低温度（12＊300秒＝1小时），共存储100天的数据（2400小时）。第三和第四个RRA分别存放最高温度和平均温度。
例 2
rrdtool create proxy.rrd --step 300 \
DS:Total:DERIVE:1800:0:U \
DS:Duration:DERIVE:1800:0:U \
RRA:AVERAGE:0.5:1:2016
本例是监视一个Web代理每300秒间隔（5分钟）内处理的请求的平均请求数。此例中，该代理有两个计数器，启动后处理的请求总数、以及处理请求的合计累积数。显然这些计数器都有某个回绕点，但是使用DERIVE数据源类型同时还可以处理在Web代理停止和重启时的复位。
在该RRD数据库中，存储的第一个数据源类型是间隔期内的每秒请求数。第二个数据源类型是在除以300的间隔期内的请求处理总数。
2.rrd环型数据库的更新：
rrdtool {update | updatev} filename [--template|-t ds-name[:ds-name]...] N|timestamp:value[:value...] at-timestamp@value[:value...] [timestamp:value[:value...] ...]
filename ：要更新的RRD数据库的名称。
--template|-t ds-name[:ds-name]... ：-t ds-name要更新RRD数据库中数据源的名称
N|timestamp:value[:value...]：时间：要更新的值...
$>rrdtool update tcpdump.rrd 1061811856:114:0:50:1199:0:821073
上面的 1061811856 即时间值,如果就是要现在的时间值,则可以 N 代表,但要转换成秒值,通常我们都会以
代碼:
$>timestamp=`date +%s `
来转换成现在的秒数,如果是某些特定时间,则可以
代碼:
$>timestamp=`date -d "2003/08/15 12:00" +%s`
3.如何绘制rrd环型数据库中的采集到的数据
rrdtool graph filename [option ...] [data definition ...] [data calculation ...] [variable definition ...] [graph element ...] [print element ...]
filename 要绘制的图片名称
Time range时间范围
[-s|--start time] 启始时间[-e|--end time]结束时间 [-S|--step seconds]步长
Labels
[-t|--title string]图片的标题 [-v|--vertical-label string] Y轴说明
Size
[-w|--width pixels] 显示区的宽度[-h|--height pixels]显示区的高度 [-j|--only-graph]
Limits
[-u|--upper-limit value] Y轴正值高度[-l|--lower-limit value]Y轴负值高度 [-r|--rigid]
Data and variables
DEF:vname=rrdfile:ds-name:CF[:step=step][:start=time][:end=time]
CDEF:vname=RPN expression
VDEF:vname=RPN expression
主要用处是说明您要取出那个RRD档案的 DSN 到这个 graph 的参数中来 CDEF 通过运算得到一个虚拟的变量,,其运算式需写成后序 EX: a=1+3 写成 a=1,3 + LINE{1|2|3}:vname[#rrggbb[:legend]] LINE1:your_var#rgb顏色值:图例说明,这个 "your_var" 需存在 DEF 或 CDEF 的宣告中, AREA:vname[#rrggbb[:legend]] AREA 画出样本数值至 0 之间的区块图 STACK:vname[#rrggbb[:legend]] STACK 叠在上一个值上的图形请注意,如果使用 AREA/STACK 时需特別注意图盖图的问题,一定要先画大的值, 再画小的值,这才会有层次的效果,不然,最大的数据若最后画,会盖住前面的数据 COMMENT 说明文字,如 COMMENT:"Last Updated" 将在图上产生该文字,可以用 \n 等换行符号 GPRINT GPRINT:vname:CF:format vname 即DEF 中的 your_var,而 CF 看你要输出的文字是 AVERAGE/MAX/MIN/LAST 等数值,format 如同 printf 中的格式, EX: GPRINT:telnet:AVERAGE:"%10.0lf \n" 意即要输出这段时间中 (-s ~ -e 中,telnet的平均值,%10.0lf 则是为了好算位置)。

在我看来，学习某个东西的最好办法就是实践。为什么现在不开始呢？我们会创建一个数据库，放一些数值到它里面，然后提取这些数据。
我们会从一些简单的例子入手，然后把汽车与路由器比较，或者将公里和比特、字节数比较。他们都是一样的：都是某些时段的某些数值。
假设我们有一个向互联网发送数据和接收数据的设备。该设备保留一个计数器，该计数器在开启设备时设置为 0，并在每传送一个字节就加1。该计数器可能会有一个最大值。如果该值达到最大时，在加一个字节的计数，该计数器就会再次从0开始。这与世界上的许多计数器都是一样的，比如车辆上的里程计数器。
关于网络的讨论通常用每秒比特数来衡量，因此我们要习惯这种用法。把一个字节看成是8个比特，并且开始用比特而不是字节来思考问题。不过，计数器仍然用字节数为单位来计量！在SNMP世界里，大部分的计数器都是32比特的。这就意味着他们的计数范围是 0－4294967。我们在例子里会用到这些数值。该设备在被查询时，会返回计数器的当前值。我们知道从上次查询设备开始到现在的时间，因此我们现在就知道每秒平均传输了多少字节数。这不难计算。首先用文字来描述，然后计算：
(1) 用当前查询到的计数器值，减去上一次查询的计数器值
(2)把当前查询时间和上次查询时间作上述同样操作（秒）
将（1）的结果除以（2）的结果，得到的结果就是每秒的字节数。乘以8就得到每秒的比特数（bps)
bps = (counter_now - counter_before) / (time_now - time_before) * 8
不习惯用公里/小时的人，可以将公里除以1.6来得到英里/小时（足够精确）。我会用到下面所写：
M ：米
KM：公里（1000米）
H：小时
S：秒
KM／H：公里/小时
M／S：米／秒
你现在正在开车。12：05时你看了一下仪表盘上的里程计数器，它显示这俩车已经行驶了12345公里。12：10分时，你有看了一下里程计数器，它显示12357公里。这表示你在5分钟内行驶了12公里。科技人员会把它转换成米／秒，这样可以更好的进行比较（每5分钟的字节数）和（每秒比特数）。
我们行驶了12公里，也就是12000米。我们在5分钟内，或者说是300秒内完成。我们的速度是1200米／300秒，或者说是40米/秒。
我们可以用公里/小时来计算速度：12乘以5分钟就是一个小时，因此我们必须把12公里乘以12得到144公里/小时。也就是90英里/小时，因此不要在家里或我生活的地方尝试这个速度 :)
记住：这些数值都仅仅是平均值。无法从数字中得到你是否以固定的速度在行驶。
我希望你理解在计算米/秒或者比特/秒。唯一的差别在于收集数据的方式。即使是K这个单位也是一样的，因为在网络术语中，K同样表示1000。
我们现在要创建一个数据库，在此数据库中我们能够保存所有这些有趣的数字。启动这个程序的方法可能在各个操作系统上各不相同，但是我假设你可以搞清楚它是否与你的操作系统不同，键入下面的行（为了可读性，我得把他分成几行）并且用\来分隔。
rrdtool create test.rrd \
--start 920804400 \
DS:speed:COUNTER:600:U:U \
RRA:AVERAGE:0.5:1:24 \
RRA:AVERAGE:0.5:6:10
我们创建的rrd数据库名为test (test.rrd)，它的起始时间是1999年3月7日（该日期转换成920804400秒）。我们的数据库存放一个名为 'speed' 的数据源（DS）,它表示一个计数器。该计数器每5分钟（缺省）读取一次。在同一个数据库中，保存有2个环状归档（RRA），一个是每次读取时的平均数据并保留24个样本（24乘以5分钟是2小时）。另一个RRA有6个平均值（6X5=30半小时）并包含10个这样的样本。
RRDtool使用来源于UNIX世界的特殊时间戳。该时间戳是自1979年1月1日UTC时间开始到当前逝去的秒数。该时间戳的值被转换成本地时间，它在不同的时区会不一样。
现在我们得向数据库中填入一些数字。我们希望读到以下数据：
12:05 12345 KM
12:10 12357 KM
12:15 12363 KM
12:20 12363 KM
12:25 12363 KM
12:30 12373 KM
12:35 12383 KM
12:40 12393 KM
12:45 12399 KM
12:50 12405 KM
12:55 12411 KM
13:00 12415 KM
13:05 12420 KM
13:10 12422 KM
13:15 12423 KM
我们用下面的命令把上述数据填入数据库：
rrdtool update test.rrd 920804700:12345 920805000:12357 920805300:12363
rrdtool update test.rrd 920805600:12363 920805900:12363 920806200:12373
rrdtool update test.rrd 920806500:12383 920806800:12393 920807100:12399
rrdtool update test.rrd 920807400:12405 920807700:12411 920808000:12415
rrdtool update test.rrd 920808300:12420 920808600:12422 920808900:12423
这就是说：用下面的数据来更新我们的数据库
time 920804700, value 12345
time 920805000, value 12357
等等....
正如你说看到的那样，可以在一个命令里向数据库中填入多个值。为了可读性，我得只用三个数据，实际一行里运行的最大数据与操作系统相关。
我们可以使用 rrdtool fetch 命令从数据库中提取数据。
rrdtool fetch test.rrd AVERAGE --start 920804400 --end 920809200
该命令会返回如下输出结果：
speed
920804700: nan
920805000: 4.0000000000e-02
920805300: 2.0000000000e-02
920805600: 0.0000000000e+00
920805900: 0.0000000000e+00
920806200: 3.3333333333e-02
920806500: 3.3333333333e-02
920806800: 3.3333333333e-02
920807100: 2.0000000000e-02
920807400: 2.0000000000e-02
920807700: 2.0000000000e-02
920808000: 1.3333333333e-02
920808300: 1.6666666667e-02
920808600: 6.6666666667e-03
920808900: 3.3333333333e-03
920809200: nan
如果不是像上面的输出结果，可能哪里有错误。也许你的操作系统会打印出不同的格式。 NaN 表示非数字。如果你的操作系统输出 U 或 UNKN 或者其他类似东西都是正常的。如果其他地方错误，可能是因为你的过程中的那些步骤出错了。
试试下面的命令：
rrdtool graph speed.png \
--start 920804400 --end 920808000 \
DEF:myspeed=test.rrd:speed:AVERAGE \
LINE2:myspeed#FF0000
该命令会创建名为speed.png的图像文件，该图像从12:00开始，到13:00。有一个名为myspeed的变量定义，它使用来自 test.rrd数据库的 speed RRA中的数据。绘制的线条是2像素高，表示myspeed变量。颜色是红色的.
你会注意到图像的起始不是12：00而是12:05。这是因为在此时间之前的数据不够计算出平均值。这只会在缺少某些样本的情况下发生，不会经常发生。
查看图像时，你会注意到横轴下标为 12:10、12：20、12：30、12：40、12：59。有时某些下标不适合（可能是12：00和13：00）会被忽略掉。
纵轴显示我们输入的范围。下面提供的公里数，以及除以300秒的结果，我们得到非常小的数值。为了更加精确，第一个值是12（12567－12456），除以300后得到0.04,RRDtool显示时为 40m 表示 40/1000 。其中的 m 与米、公里、或者毫米都没有任何关系！RRDtool不知道我们的数据单位，它只处理没有单位的数据。
如果我们用米来衡量我们的距离，就会是这样：(12'357'000-12'345'000)/300 = 12'000/300 = 40.
因为许多人都对这样的数值范围感觉更好，我们就来修正一下。我们将重新创建数据库，并存储正确的数据。但是有更好的办法：在创建png文件时进行一些计算！
rrdtool graph speed2.png \
--start 920804400 --end 920808000 \
--vertical-label m/s \
DEF:myspeed=test.rrd:speed:AVERAGE \
CDEF:realspeed=myspeed,1000,\* \
LINE2:realspeed#FF0000
注意：不要忘记操作符＊后面的。这个反斜杆用来将＊从操作系统可能解释的符号转义，而不是直接传递给rrdtool命令。
在查看PNG文件后，你会注意到 m 不见了。正确的结果就是这样。同样，在图像中加入了一个标注（m/s）。出了上面提到的几点外，PNG看起来应当是一样的。
计算是在CDEF部分中指定的，使用逆波兰表达式（ RPN )表示的。我们要求RRDtool所作的事情是：`取数据源myspeed(公里/秒), 以及数值1000；把他们相乘`得到(米/秒) 。在此不要被RPN表达式困扰了。
在我们的例子数据库中，我们犯了一个错误，我们需要乘以3600来补偿。使用下面的修正办法：
realspeed=myspeed * 3,600(KM/H)
下面我们来创建这个PNG文件，并加入更多的魔幻功能...
rrdtool graph speed3.png \
--start 920804400 --end 920808000 \
--vertical-label km/h \
DEF:myspeed=test.rrd:speed:AVERAGE \
"CDEF:kmh=myspeed,3600,*" \
CDEF:fast=kmh,100,GT,kmh,0,IF \
CDEF:good=kmh,100,GT,0,kmh,IF \
HRULE:100#0000FF:"Maximum allowed" \
AREA:good#00FF00:"Good speed" \
AREA:fast#FF0000:"Too fast"
这个图像看起来更好。速度用KM/H表示，有一个附加的线条表示最大允许的速度（在我行驶的道路上的最大限速）。我还修改了速度的显示颜色，把它从线条改为区块。
现在计算更加复杂一些。对于在限速内的速度good衡量方法是：
检查公里/小时是否大于100 ( kmh,100 ) GT
如果是，返回0，否则返回公里/小时。 ((( kmh,100 ) GT ), 0, kmh) IF
对于上述的限速值fast：
检查公里/小时是否大于100 ( kmh,100 ) GT
如果是，返回公里/小时，否则返回0。 ((( kmh,100) GT ), kmh, 0) IF
现在，你所需要做的只有按照常规的方式度量数值，然后更新数据库。当你想查看数据时，重新创建PNG。
大多数对RRDtool感兴趣的人会使用一个跟踪网络设备传输数据量的计数器。这样我们下一步就来作这个。我们会从解释如何收集数据开始。
本例中使用的工具在本文档前面非常简短地提到过，它就是所谓的SNMP。它是与联网设备交谈的方式。下面用到的工具名为 snmpget ，以下是关于它是如何工作的说明：
snmpget device password OID
或
snmpget -v[version] -c[password] device OID
对于device, 你要用设备的名称或者IP地址来替换。对于password, 你需要使用SNMP领域中称为 comunity read string 来替换。对于某些设备来说，缺省的 public 可以工作，但是该设置可能会被关闭，调整或者由于安全和机密的原因而被保护起来。请阅读你的设备或程序的文档。
接下来有一个称为OID的参数，它用来表示对象标识符。
刚开始学习SNMP时，它看起来有些令人困惑。在你看到MIB管理信息库时，就不会那么困难了。MIB 是用来描述数据的倒状树，它只有一个根结点，并且由根结点开始有多个分支。这些分支都以另一个结点终结，他们继续向下分支，如此继续。所有的分支都有一个名称，它们构成了一个我们能够沿着往下的路径。我们所沿着的这些分支都被命名了：iso, org, dod, internet, mgmt 和mib-2.这些名称也可以用数字方式记录，就像 1 3 6 1 2 1。
iso.org.dod.internet.mgmt.mib-2 (1.3.6.1.2.1)
有些程序会使用前导点 . ，令人感到许多困惑。在一个OID中并没有前导点。为了显示OID缩记法和OID完整记法的区别，（通常约定）在使用OID的完整记法时使用前导点。通常这些程序在返回数据给你时，会省略缺省的部分。这些程序有的有几个缺省前缀，这会让事情显得更加糟糕。
在此我会给出一个在Fedora Core 3操作系统上可用的例子。如果对你的操作系统不可用，请查看snmp的手册，并作相应的调整让它能够运行。
snmpget -v2c -c public myrouter system.sysDescr.0
该设备应当回应其自身的描述，该描述可能是一个空的。只有在你从某个设备获得响应后，你才能够继续。其中可能需要使用不同的口令、或者不同的设备。
snmpget -v2c -c public myrouter interfaces.ifNumber.0
最好你得到的结果是一个数字。如果这样的话，你就可以继续往下，并试试另一个叫做 snmpwalk 的程序。
snmpwalk -v2c -c public myrouter interfaces.ifTable.ifEntry.ifDescr
如果该命令返回一系列的接口，这就对了。以下是该命令运行的返回结果的例子：
[user@host /home/alex]$ snmpwalk -v2c -c public cisco 2.2.1.2
interfaces.ifTable.ifEntry.ifDescr.1 = "BRI0: B-Channel 1"
interfaces.ifTable.ifEntry.ifDescr.2 = "BRI0: B-Channel 2"
interfaces.ifTable.ifEntry.ifDescr.3 = "BRI0" Hex: 42 52 49 30
interfaces.ifTable.ifEntry.ifDescr.4 = "Ethernet0"
interfaces.ifTable.ifEntry.ifDescr.5 = "Loopback0"
对于cisco设备，我想监视｀Ethernet0` 接口，从上面的输出结果能够看到该接口的编号是 4。我试着运行如下命令：
[user@host /home/alex]$ snmpget -v2c -c public cisco 2.2.1.10.4 2.2.1.16.4
interfaces.ifTable.ifEntry.ifInOctets.4 = 2290729126
interfaces.ifTable.ifEntry.ifOutOctets.4 = 1256486519
这样，我就有两个OID需要监视，他们是（这次使用完整记法）:
1.3.6.1.2.1.2.2.1.10
和
1.3.6.1.2.1.2.2.1.16
这两个OID都有接口编号4。
别被糊弄了，我可不是试一次就搞定的。我花了一些数据来搞清这些数字都是什么意思。把这些编号转换成描述文字大有帮助... 至少在大家谈论MIB和OID时，你知道他们是什么东西。别忘了接口编号（如果它不是附属接口，就是0），如果用snmpget没有得到响应，试试snmpwalk。
开始有趣的东东吧。首先，创建一个新的数据库。它包含输入和输出2个计数器的数据。该数据被放入能够进行平均的归档中。他们一次使用1、6、24、或 288个样本。他们同时被存入保存最大数字的归档中。稍后会解释。样本间隔时间为300秒，也就是5分钟，这是一个好的开始。:
1个样本 “平均” 保留5分钟的周期
6个样本每30分钟进行一次平均
24个样本每2小时进行一次平均
288个样本每1天进行一次平均
我们试着与MRTG互相兼容，MRTG存储以下数据：:
600 5分钟样本数： 2天和2小时
600 30分钟样本数： 12.5天
600 2小时样本数： 50天
732 1天样本数： 732天
这些范围被补充进去，因此在数据库中保存的数据总数大约797天。RRDtool存储不同的数据，它不会在每日归档停止的地方开始每周归档。对于这两个归档，最新的数据会是在 now 附近，因此我们需要比MRTG保存更多的数据！
我们需要：:
600个5分钟的样本（2天和2小时）
700个30分钟的样本（2天和2小时，加12.5天）
775个2小时的样本（上述＋50天）
797个1天的样本 (上述＋732天，环型回绕最大797）
rrdtool create myrouter.rrd \
DS:input:COUNTER:600:U:U \
DS:output:COUNTER:600:U:U \
RRA:AVERAGE:0.5:1:600 \
RRA:AVERAGE:0.5:6:700 \
RRA:AVERAGE:0.5:24:775 \
RRA:AVERAGE:0.5:288:797 \
RRA:MAX:0.5:1:600 \
RRA:MAX:0.5:6:700 \
RRA:MAX:0.5:24:775 \
RRA:MAX:0.5:288:797
接下来要做的就是收集数据并把它保存起来。以下是一个例子。它是用伪码写的，你得根据OS调整后让它能够运行。:
while not the end of the universe
do
get result of
snmpget router community 2.2.1.10.4
into variable $in
get result of
snmpget router community 2.2.1.16.4
into variable $out
rrdtool update myrouter.rrd N:$in:$out
wait for 5 minutes
done
Then, after collecting data for a day, try to create an image using:
在收集了1天的数据后，试着用下面的命令创建图像：:
rrdtool graph myrouter-day.png --start -86400 \
DEF:inoctets=myrouter.rrd:input:AVERAGE \
DEF:outoctets=myrouter.rrd:output:AVERAGE \
AREA:inoctets#00FF00:"In traffic" \
LINE1:outoctets#0000FF:"Out traffic"
这会产生一个具有1天流量值的图像。1天有24（小时）x60（分钟）x60（秒）。我们从当前时间-86400秒开始。我们用DEF把输入和输出字节数定义成myrouter.rrd数据库中的的平均值，并且绘制输入流量区和输出流量线。

来源：

http://blog.sina.com.cn/s/blog_4e424e2101000b5s.html

快乐成长

每天进步一点点

来源：互联网

Related Posts:

发表评论 取消回复

发表评论取消回复