在过去五年里,对基于LAN的网络系统的管理发生了很大变化。共享以太网基本上已是明日黄花,正在为速率从10Mb/s到1000Mb/s GigE的交换系统所取代。这些变化,以及最终设备处理能力的提高和各种应用广泛使用,正在使常规网络监测和分析达到极限,乃至超出它们的极限。
在许多情况下,测试硬件在准确捕获所需的数据速率和容量上遇到了麻烦。这意味着我们再也不能仅仅将测试设备连接到网段上,并得到表明可能是什么问题的明确指示。在没有过滤的情况下,许多千兆位分析仪上的捕获缓冲区不到一秒钟就会被填满。
这就是说,在查找故障期间,我们必须了解有关受影响的系统、它们的结构以及客户需要的大量信息。
OSI栈的分析
OSI栈是网络的基本模型。在实际实现OSI栈时,栈实际上被压缩为更像是三到四层的结构。第七层通常被认为是栈顶,而第一层在最底层。这些层之间的通信被认为是对其他层透明的。应用程序不知道自己穿过其他层通信,而是认为自己直接与目的地上的应用层通信。所有其他层都以类似的方式工作。因此,如果LAN管理人员希望解决复杂的问题,他们必须能分析被测试数据的所有七层。
“代码18”问题
客户是最难的LAN网络测试参数。客户一般将经过桌面系统的各种东西看作是一个神奇地满足他需要的云团。当设备停止运行时,客户通常的感觉是设备肯定“坏了”。然而,发源于桌面系统的问题常常是由于客户做了什么事引起的。
这类问题通常被叫做“代码18”问题,这个术语表示客户的屏幕亲近度。代码18问题在客户报告的故障中占大约70%。在使用传统的协议分析时,使用采集客户桌面上的线索的分析是“猜测”故障查找后的最后一招。
应用开端
LAN管理员必须不断地通过“应用开端”来减轻应用程序的不利影响。新应用程序被引入,并且在许多情况下,引入新应用程序没有得到管理层的批准,通常必须测试它们。这种情况会常常确实影响到其他应用程序以及网络。其中的一些应用程序影响原始带宽,改变服务器和工作站配置并影响工作人员生产所需的其他程序。
问题的解决
当LAN上出现异常情况时,解决问题一般从故障单开始。故障单由回应投诉者的操作员开出。在任务问题的开始阶段中,先有一个信息收集阶段,随后是导致问题被纠正和终结的许多行动。这些行动一般由使用工具并对其他决策人负责的人员来实施。但是,随着LAN复杂性的增加,这类互动开始表现出规模不能扩展的迹象。这意味着必须让硬件和软件承担解决问题的任务。
网络监测
监测LAN一般利用企业或大型管理器以一种自动化的方式来执行。这种SNMP管理器通常查询特定的网络设备并向能够对看到的情况做出决定的操作员显示检测到的状态。
SNMP存在的问题是它不具有一种确定的状态。SNMP利用一种不可靠的提交协议:UDP协议。这意味着企业管理器中的停机指示只表示没有收到响应。由于许多原因都会出现这种情况(包括目标设备上的代理程序停止运行,尽管设备仍在工作),因此我们需要故障的进一步证据。
摘自《网络世界》网络故障测试的问题
在过去五年里,对基于LAN的网络系统的管理发生了很大变化。共享以太网基本上已是明日黄花,正在为速率从10Mb/s到1000Mb/s GigE的交换系统所取代。这些变化,以及最终设备处理能力的提高和各种应用广泛使用,正在使常规网络监测和分析达到极限,乃至超出它们的极限。
在许多情况下,测试硬件在准确捕获所需的数据速率和容量上遇到了麻烦。这意味着我们再也不能仅仅将测试设备连接到网段上,并得到表明可能是什么问题的明确指示。在没有过滤的情况下,许多千兆位分析仪上的捕获缓冲区不到一秒钟就会被填满。
这就是说,在查找故障期间,我们必须了解有关受影响的系统、它们的结构以及客户需要的大量信息。
OSI栈的分析
OSI栈是网络的基本模型。在实际实现OSI栈时,栈实际上被压缩为更像是三到四层的结构。第七层通常被认为是栈顶,而第一层在最底层。这些层之间的通信被认为是对其他层透明的。应用程序不知道自己穿过其他层通信,而是认为自己直接与目的地上的应用层通信。所有其他层都以类似的方式工作。因此,如果LAN管理人员希望解决复杂的问题,他们必须能分析被测试数据的所有七层。
“代码18”问题
客户是最难的LAN网络测试参数。客户一般将经过桌面系统的各种东西看作是一个神奇地满足他需要的云团。当设备停止运行时,客户通常的感觉是设备肯定“坏了”。然而,发源于桌面系统的问题常常是由于客户做了什么事引起的。
这类问题通常被叫做“代码18”问题,这个术语表示客户的屏幕亲近度。代码18问题在客户报告的故障中占大约70%。在使用传统的协议分析时,使用采集客户桌面上的线索的分析是“猜测”故障查找后的最后一招。
应用开端
LAN管理员必须不断地通过“应用开端”来减轻应用程序的不利影响。新应用程序被引入,并且在许多情况下,引入新应用程序没有得到管理层的批准,通常必须测试它们。这种情况会常常确实影响到其他应用程序以及网络。其中的一些应用程序影响原始带宽,改变服务器和工作站配置并影响工作人员生产所需的其他程序。
问题的解决
当LAN上出现异常情况时,解决问题一般从故障单开始。故障单由回应投诉者的操作员开出。在任务问题的开始阶段中,先有一个信息收集阶段,随后是导致问题被纠正和终结的许多行动。这些行动一般由使用工具并对其他决策人负责的人员来实施。但是,随着LAN复杂性的增加,这类互动开始表现出规模不能扩展的迹象。这意味着必须让硬件和软件承担解决问题的任务。
网络监测
监测LAN一般利用企业或大型管理器以一种自动化的方式来执行。这种SNMP管理器通常查询特定的网络设备并向能够对看到的情况做出决定的操作员显示检测到的状态。
SNMP存在的问题是它不具有一种确定的状态。SNMP利用一种不可靠的提交协议:UDP协议。这意味着企业管理器中的停机指示只表示没有收到响应。由于许多原因都会出现这种情况(包括目标设备上的代理程序停止运行,尽管设备仍在工作),因此我们需要故障的进一步证据。
摘自《网络世界》
|