分类: 数据算法

7 篇文章

基于模式识别的电能表监测数据的处理(DPC密度峰值聚类)
基于模式识别的电能表监测数据的处理 基于模式识别的电能表监测数据的处理 DPC密度峰值聚类 输入:用于模型训练的数据集 输出:划分 计算任意两点间的距离 计算局部密度 计算相对距离 以为横轴,为纵轴画出决策图 利用决策图,和大为簇中心点,小但大为噪声点 把剩余点分配到最近邻且中心局部密度比它大的簇中 基于两步分配策略和共享近邻相似度的密度峰值聚类方法 输入:样本数据集,其中是样本数量,样本近邻数 …
卡尔曼滤波
卡尔曼滤波(Kalman Filter) 卡尔曼滤波(Kalman Filter) 卡尔曼滤波器的背景 火箭在发射过程中需要时刻预测自己的状态(此处所述的状态包括火箭的位置与速度),对于火箭的状态数据可以通过一些传感器来获取这两个测量,但是由于存在电离层和大气干扰,传感器的测量值有时误差会比较大,这样就需要通过一种方法来预测一个新的更加准确的、且不完全依赖传感器返回值的状态信息。 在事实上,如果传…
基于频繁项集的数据关联规则挖掘算法-Apriori
Apriori-基于频繁项集的数据关联规则挖掘算法 Apriori-基于频繁项集的数据关联规则挖掘算法 算法目的 已知:数据集,其中每一个对应个变量(即个统计指标),如果该变量的取值满足设定的条件,则在该变量上可转化为分类数据或示性数据。 待求:数据集的频繁项集和关联规则(用于分析原始数据和推断新的数据) 算法文字步骤 第一步:输入数据集。 第二步:确定数据集中所包含的项集,并具体化到每一个数据点…
无监督的数据异常检测算法(3)- INFLO
无监督的数据异常检测算法(3)- INFLO 无监督的数据异常检测算法(3)- INFLO   1. INFLO原论文 Ranking Outliers Using Symmetric Neighborhood Relationship 1.1 综述(Abstract) 挖掘数据集中的异常值是为了找到偏离数据集其余部分的异常对象。除了经典的异常值分析算法之外,最近的研究还集中在挖掘局部异…
无监督的数据异常检测算法(2)- COF
无监督的数据异常检测算法(2)- COF 无监督的数据异常检测算法(2)- COF 1.COF-基于连通性的局部异常因子检测方法 在LOF中,距离邻域默认是根据欧式距离来进行计算的,这样也间接性地假定了数据是以球形的方式分布在样本周围。但如果特征有一个直接线性相关,那这个密度的估算就会出现问题。在《Enhancing effectiveness of outlier detections for …
无监督的数据异常检测算法(1)- LOF
无监督的数据异常检测算法(1)- LOF 无监督的数据异常检测算法(1)- LOF   1.1 LOF简介 在众多的离群点检测方法中,LOF方法是一种典型的基于密度的高精度离群点检测方法。在LOF方法中,通过给每个数据点都分配一个依赖于邻域密度的离群因子LOF,进而判断该数据点是否为离群点。若LOF,则该数据点为离群点;若LOF接近于1,则该数据点为正常数据点。 1.2 距离度量尺度 设…