
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
信噪比是我们在判断数据质量高低经常用到的一个考核指标,今天我们就通过案例分析来了解一下,提高数据质量都有哪些方法。
噪声数据是指数据集中存在错误或异常数据,一般是指偏离期望数值较大的数据。此类数据一般源自设备出现故障、在数据传输过程中出现错误等特殊情况,对其处理的一般性方法是使用“光滑”的数据进行替代。
网络安全数据集成可以从以下三个方面进行。先是实体方面,要统一实体命名,即对不同维度采集的实体名字进行统一,也就是对标识符进行统一。其次是数据格式方面,常用的方法为通过对数据格式进行合并,即将数据格式按照统一以后的属性进行合并。后是数据自身的集成方面。对于不同数据源采集的相同数据,将冗余的数据消除,保留一份数据即可。
样本规约是指从完整的数据集中选取具有代表性的样本子集,从而降低数据集规模。特征规约是指剔除原始数据集中无关紧要的数据特征。维度规约的主要目的是减少分析过程中随机变量或属性的个数。
目前的网络攻击按照攻击方式可以分为单步攻击、多步攻击等,按照攻击危害可以分为有效攻击和无效攻击等。针对传统的单步攻击(如SQL注入攻击)和多步攻击(如APT攻击),分析师可以根据攻击行为的特征、规则对攻击事件进行检测,许多态势感知系统也可根据相应的特征、规则对攻击行为进行检测和发现。
【免责声明】:本内容转载于网络,转载目的在于传递信息。文章内容为作者个人意见,本平台对文中陈述、观点保持中立,不对所包含内容的准确性、可靠性与完整性提供形式地保证。请读者仅作参考。更多内容请加danei0707学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。