
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
人工智能技术往往会应用在以下几个领域,如图像识别、模式识别、自然语言处理等。这样的应用同样也可以落地在网络安全领域,来应对高级威胁。
技术层面可以通过以下思路来逐步实现:把一个文件映射成一张图像,把网络流量按照模式识别的方式去做一个建模;对于一些web类的攻击行为或者一些恶意的域名,可以通过自然语言的方法去对它进行处理。经过研究和实践,人工智能技术应用在以下几个检测能力上,效果明显。
1)对恶意软件建模。人工智能技术擅长语音识别,比如苹果的Siri程序,它的建模过程从样本的采集,采集语音流量,把语音通过数字化变成数字信号,再进行特征提取来提取语音线性参数,最后生成特征向量,作为模型的输入来源,最后再到建模、设置参数、训练学习和最后的识别过程。同理,对木马数据的外泄流量,可以用相似的过程:采集网络流量,对流量进行协议的解析和数据的统计,再把协议解析和统计后的数据提取特征,生成特征向量,再进行一个学习和识别。可以类比于一个语音识别过程,把木马数据外泄流量的过程进行建模。进一步可以把木马文件映射成图像,这样就可以用人工智能中的神经网络有效对图像进行识别,间接识别样本本身。
2)检测暗网的Tor流量。所谓Tor流量,就是通过在环境中模拟Tor浏览器产生的流量并进行捕获。这之中,关键要提取Tor流量的指纹向量,包括会话中的数据包大小、时间间隔和统计特征,都是有效的数据来源。之后再通过步态指纹方式进行建模。
3)检测DGA域名。DGA域名是通过算法生成的随机域名,它可以规避我们把一个域名或IP写死在受控木马样本并被发现之后,整个僵尸网络会被阻断的风险。首先需要升级大量的DGA域名,在收集了百万量级的域名之后,再去建立深度学习的模型,把样本放到模型里做训练,那么这个模型就具备了识别这类DGA算法生成新域名的能力。
4)检测web类攻击。像SQL注入、XSS和Webshell都是文本类的数据,要检测的内容实际上是通过语法来判断它是否属于攻击。结合之前的流程,首先要收集大量的数据,可以通过SQL map产生真实的SQL注入流量,也可以用相同的方法产生其他流量,还有内部积累和网站。下一步对数据进行预处理,首先是解码,解码后就可以形成可读懂和提取数据的格式,然后进行特征的编码,可以通过预训练的语言模型来提取特征向量,然后就成了我们后续训练模型的输入来源。最后再用机器学习模型检测新产生的web攻击。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!更多内容请添加danei0707学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。