NTP卫星时钟服务器搬迁常见故障处理思路和背景知识
一、操作不当引起故障处理
1.1常见故障
时钟服务器在搬迁中常见的故障是在搬迁中不重视时钟服务器的同步工作,设备搬迁后未矫正就接入系统,因两台时钟服务器偏差超过20ms,客户端的交叉算法无法判断哪个时间源为可信时间源,客户端时间采取自守时。
部分单位在实施时未按照实施文档配置双时间源和缓慢调整,因发现问题时间较晚,导致客户端重新大量的设备时间不统一。
1.2常见故障处理总体思路
此故障的一般处理思路是先客户端完成时钟源修改和缓慢调整配置后,在对时钟服务器进行卫星矫正时间。
如果客户端不进行缓慢调整配置,先将时间服务器时间调整后,客户端会出现时间直接和时间同步服务器时间对齐,导致客户端时间变化。
二、NTP服务器调整背景知识
2.1 任意两台网络时间服务器之间偏差不超过20ms
NTP交叉算法的阀值约20ms,客户端在配置两个时间源情况下,当两个时间源偏差超过20ms,客户端不会信任时间源,而采用自守时。现在网内设备偏差超过20ms,故出现客户端自守时。当客户端只有一个时间源情况下,客户只能信任上级时间源。
详情请查看:→关于NTP交叉阀值测试。
2.2上级时钟在调整过程中,客户端不信任调整时间源
在二级缓慢调整过程中,三级时钟认为二级时间源不可信,不会同步二级时钟。故单独在20.0.79.37上配置缓慢调整,不会对系统产任何影响,客户如果不配置缓慢调整,客户端时间仍然会出现跳变。
详情请查看:→二级服务器缓慢调整对系统的影响。
2.3各类系统的缓慢调整
客户端可以通过缓慢调整规避实施风险,一般来说Linux系统的缓慢调整范围是1000秒以内,Linux内核调整步伐为0.5ms/s,AIX为0.1s/s。window没有范围限制,但调整幅度没法计算,实验数据超过2000秒的,调整幅度约1s/s。
缓慢调整是通过调整系统内核参数使计算机步伐间隔的调整,在缓慢调整过程中不会出现时间跳变和时间回退。
各类系统的缓慢调整方法配置如下:
Linux系统修改/etc/ntp.conf文件添加tinkerstep 0
AIX系统修改/etc/ntp.conf文件添加slewalwaysyes
Window设备MaxAllowedPhaseOffset和UpdateInterval值结合偏差值具体计算。