Netxms - системные требования

Started by inspirit, February 19, 2014, 05:43:01 PM

Previous topic - Next topic

inspirit

Виктор, приветствую. Подскажите по системным требованиям для машинки под NetXMS для мониторинга 800 коммутаторов.

столкнулись с проблемой что при установке Netxms 1.2.12 виртуальную машину с 4х-ядерным XEON

model name      : Intel(R) Xeon(TM) CPU 3.00GHz
stepping        : 1
cpu MHz         : 2992.694
cache size      : 1024 KB
5251.55
bogomips        : 5985.38


при выполнении autodiscovery по достижении ~400 хостов все 4е ядра загружены в 100%. причем видно что загружает именно процесс netxmsd а не к примеру mysql


вот вывод

netxmsd: show stats
Total number of objects:     19937
Number of monitored nodes:   549
Number of collectable DCIs:  556

sh pol
Condition poller                 : 0
Configuration poller             : 1044
Topology poller                  : 16
Data collector                   : 556
Database writer                  : 0
Database writer (IData)          : 0
Event processor                  : 0
Network discovery poller         : 0
Node poller                      : 7709
Routing table poller             : 546
Status poller                    : 549

top - 19:41:43 up 6 days,  2:48,  2 users,  load average: 5.51, 5.61, 4.79
Tasks: 124 total,   1 running, 123 sleeping,   0 stopped,   0 zombie
Cpu0  : 76.9%us,  4.9%sy,  0.0%ni,  1.8%id,  0.0%wa,  2.2%hi, 14.2%si,  0.0%st
Cpu1  : 62.8%us,  6.4%sy,  0.0%ni, 25.6%id,  0.0%wa,  0.0%hi,  5.1%si,  0.0%st
Cpu2  : 61.4%us, 10.1%sy,  0.0%ni, 23.2%id,  0.0%wa,  0.0%hi,  5.3%si,  0.0%st
Cpu3  : 62.5%us,  9.9%sy,  0.0%ni, 21.6%id,  0.0%wa,  0.0%hi,  6.0%si,  0.0%st
Mem:   4019400k total,  1997360k used,  2022040k free,   164368k buffers
Swap:  2097144k total,        0k used,  2097144k free,  1439684k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
18250 root      20   0  117m  41m 3932 S 334.6  1.1 247:09.34 netxmsd

perf top показывает:


66.49%  libnxcore.so.1.0.0        [.] InterfaceMACComparator(NetObj*, void*)
  4.40%  [kernel]                  [k] __do_softirq
  3.91%  [kernel]                  [k] finish_task_switch
  2.19%  libnxcore.so.1.0.0        [.] ObjectIndex::find(bool (*)(NetObj*, void*), void*)
  1.08%  [kernel]                  [k] _spin_unlock_irqrestore
  1.07%  perf                      [.] 0x00030cc8
  0.96%  libnxcore.so.1.0.0        [.] Interface::Type()
  0.73%  [kernel]                  [k] __alloc_skb
  0.69%  libc-2.12.so              [.] _int_malloc

Можно ли как то оптимизировать ситуацию или стоит задуматься о покупке более производительного железа ?



andrey--k

Попробуйте увеличить время опроса на несколько минут а так же "поигратся" с всевозможными таймаутами в настройках сервера...
Удалось добится на 1500 еденицах оборудования почти нулевой загрузки ЦПУ и 2mbit нагрузки сети при адекватном времени реагирования на события.

inspirit

Да вот игрался уже - пока безрезультатно :) Можете экспортировать конфиг сервера netxms с такой машины. Было бы интересно посмотреть.

inspirit

Так, вроде разобрался. Нагрузку пораждает configuration poll. Пока сделал 1 пулер. вроде все стало хорошо.

Поанализировал логи работы и вот что увидел.

Starting configuration poll for node up51-sw2 (ID: 3474)
[20-Feb-2014 13:20:20.274] [DEBUG] ConfPoll(up51-sw2): checking for NetXMS agent Flags={00022805} DynamicFlags={00000002}
[20-Feb-2014 13:20:20.274] [DEBUG] ConfPoll(up51-sw2): checking for NetXMS agent - connecting
[20-Feb-2014 13:20:20.278] [DEBUG] ConfPoll(up51-sw2): checking for NetXMS agent - failed to connect (error 910)
[20-Feb-2014 13:20:20.279] [DEBUG] ConfPoll(up51-sw2): checking for NetXMS agent - finished
[20-Feb-2014 13:20:20.279] [DEBUG] ConfPoll(up51-sw2): calling SnmpCheckCommSettings()
[20-Feb-2014 13:20:20.280] [DEBUG] SnmpCheckV3CommSettings: failed
[20-Feb-2014 13:20:20.282] [DEBUG] SnmpCheckCommSettings: trying version 1 community 'public'
[20-Feb-2014 13:20:20.356] [DEBUG] ConfPoll(up51-sw2): selected device driver GENERIC
[20-Feb-2014 13:20:21.738] [DEBUG] ConfPoll(up51-sw2): checking for CheckPoint SNMP on port 260

1)Как для всех нод пометить поле  Disable usage of Netxms Agent for all polls. (на коммутаторах его все равно нет)
2) Как выключить проверку на наличие CheckPoint SNMP. Я нашел в конфигурации сервера параметр - EnableCheckPointSNMP. он стоит в 0. Но я так понимаю проверка все равно выполняется.

3) можно ли при построении L2 topology для ноды в админке как то подсвечивать ту ноду для которой я строю топологию.

В большой сети появляется мешанина из коммутаторов и непонятно где конкретно искомый коммутатор :)

andrey--k

Высылаю конфиг.

Для того что бы значения конфига применялись ко всему оборудованию - я конфиг настроил на пустой БД и только после перезагрузки включил автообнаружение.

https://drive.google.com/file/d/0B0SS9KVzB6egaDdVdHY5LVdwbFU/edit?usp=sharing