|
网络信息监测与封堵技术的研究
网址:http://www.lunwentianxia.com/product.sf.3223729.1/
中文摘要: 随着信息时代的来临,互联网上的海量信息给人们的工作、学习、生活带来了诸多便利,但是网络上还充斥着许多含有色情、反动、暴力等内容的敏感信息,对青少年的成长甚至对社会秩序的安定有序带来不可忽视的威胁。网络信息监测与封堵技术就是针对这一社会现象,从海量的Web文本中识别出敏感信息,并将其封堵的技术。 为了营造一个绿色的网络环境,本课题在研究了数据包捕获分析原理以及信息过滤技术的基础上,将其应用到敏感信息封堵技术上来。利用WinPcap实现在Windows平台上对网络数据包的捕获,利用TCP/IP的封装原理,自下而上的对数据包进行协议解析,对Web文本信息进行还原。 为了提高系统的性能以及敏感信息的封堵效率,本系统结合了基于IP地址过滤、关键词过滤和基于文本分类过滤的分级过滤策略。本课题提出了合法IP地址数据库优先的概念降低了系统的误判率,提高了系统的整体性能。 基于文本分类过滤策略的基础是信息过滤技术,本文在研究了国内外信息过滤发展现状的基础上,采用向量空间模型对Web文本进行数学抽象,并使用KNN(K近邻法)文本分类算法识别敏感信息文本并进行封堵。使用国际通用的过滤性能评价方法对实验结果进...
英文摘要: With the coming of information era, the mass information on the Internet bringsmuch convenience to our work, study and life, but there is still much sensitiveinformation on the Internet which contains erotic, retroactive and violent contents,and brings negative influence to the youngsters even to social stabilization. Thetechnology of Network Information Monitoring and Blockading finds out illegal textthat contains sensitive information and to block it. To create a healthy network environment, this arti...
目录:摘要 3-4
ABSTRACT 4
第1章 绪论 8-15
1.1 互联网信息安全现状 8-10
1.2 网络信息监测与封堵的意义 10-11
1.3 网络信息监测与封堵技术研究的国内外现状 11-12
1.3.1 国内研究现状 11-12
1.3.2 国外研究现状 12
1.4 本课题的背景、目的和主要研究内容 12-15
1.4.1 本课题的背景 12-13
1.4.2 本课题的主要研究内容 13
1.4.3 本课题采用的主要技术路线 13-15
第2章 数据捕获与过滤的技术研究 15-25
2.1 网络监测技术原理 15
2.2 以太网网卡工作模式 15-16
2.3 NIDS 网络驱动程序的概念 16-17
2.4 BPF 和 NPF 模型概述 17-19
2.5 WinPcap 原理 19-24
2.5.1 WinPcap 体系结构 19-20
2.5.2 WinPcap 的常用数据结构 20-21
2.5.3 Wpcap.dll 库函数介绍 21-22
2.5.4 使用 WinPcap 接口程序的流程 22
2.5.5 对 WinPcap 的几点优化 22-24
2.6 过滤规则 24-25
第3章 网络数据包协议分析技术的研究 25-32
3.1 TCP/IP 参考模型 25-26
3.2 数据包封装 26-27
3.3 主要协议的数据包格式 27-30
3.3.1 以太网帧头格式 27
3.3.2 网际协议 IP 27-28
3.3.3 传输控制协议 TCP 28-30
3.4 协议分析实现过程 30-32
第4章 敏感信息过滤相关技术 32-47
4.1 信息过滤的体系结构 32-33
4.2 信息过滤系统的分类 33
4.3 中文分词 33-35
4.4 信息过滤的主要数学模型 35-39
4.4.1 布尔模型 36
4.4.2 向量空间模型 36-38
4.4.3 概率推理模型 38-39
4.5 敏感信息文本的特征及文本表示 39-41
4.5.1 敏感信息文本的传播方式 39-40
4.5.2 敏感信息文本内容的结构特征 40
4.5.3 文本表示与权重 40-41
4.6 敏感文本特征提取 41-43
4.7 文本自动分类技术 43-45
4.7.1 常用的文本自动分类算法 43-44
4.7.2 KNN(K-Nearest Neighbor)算法 44-45
4.8 信息过滤系统性能评价 45-47
第5章 系统的实施与实验结果 47-65
5.1 系统总体设计 47-49
5.2 监听程序放置位置 49-50
5.3 使用 Winpcap 实现捕获数据包 50-52
5.4 协议分析 52-55
5.4.1 主要协议数据包数据类型的定义 52-53
5.4.2 主要数据包的解析 53-55
5.5 基于网址的敏感信息过滤 55-57
5.6 信息过滤预处理系统 57-59
5.6.1 中文分词词库 57-58
5.6.2 敏感信息文本的提取 58-59
5.7 基于文本分类的过滤模型 59-61
5.8 实验结果及性能评估 61-62
5.9 TCP 连接的关闭 62-63
5.10 系统界面 63-65
第6章 结论与展望 65-67
6.1 工作总结 65-66
6.2 后续工作的展望 66-67
致谢 67-68
参考文献 68-70
攻读学位期间的研究成果 70
—————————————————————————————————————————————
谁有钱可以买下来,请免费送我一份,呵呵。估计“墙”和这篇论文有很大关联! |
|