无监督的数据异常检测算法(2)- COF 无监督的数据异常检测算法(2)- COF 1.COF-基于连通性的局部异常因子检测方法 在LOF中,距离邻域默认是根据欧式距离来进行计算的,这样也间接性地假定了数据是以球形的方式分布在样本周围。但如果特征有一个直接线性相关,那这个密度的估算就会出现问题。在《Enhancing effectiveness of outlier detections for …
无监督的数据异常检测算法(1)- LOF 无监督的数据异常检测算法(1)- LOF 1.1 LOF简介 在众多的离群点检测方法中,LOF方法是一种典型的基于密度的高精度离群点检测方法。在LOF方法中,通过给每个数据点都分配一个依赖于邻域密度的离群因子LOF,进而判断该数据点是否为离群点。若LOF,则该数据点为离群点;若LOF接近于1,则该数据点为正常数据点。 1.2 距离度量尺度 设…
图像处理(6)-傅立叶变换在图像处理中的应用、短时傅立叶变换与小波变换 图像处理(6)-傅立叶变换在图像处理中的应用、短时傅立叶变换与小波变换 7.3 傅里叶变换在图像处理中的应用 傅里叶变换的实质是将一个信号分离为无穷多个正弦/复指数信号的加成,也就是说,把信号变成正弦信号相加的形式——既然是无穷多个信号相加,那对于非周期信号来说,每个信号的加权应该都是零——但有密度上的差别,你可以对比概率论中…
图像处理(4)-傅立叶变换 图像处理(4)-傅立叶变换 7. 傅里叶变换 7.1 理解傅里叶分析(摘自知乎专栏) 以下内容摘自作者韩昊发在知乎上的傅里叶分析之掐死教程 知乎:Heinrich 微博:@花生油工人 7.1.1 什么是频域 从我们出生,我们看到的世界都以时间贯穿,世间唯一不变的就是万事万物都在变化,而且都是在时间轴上发生变化。这种以时间作为参照来观察动态世界的方法我们称其为时域分析。我…
图像预处理(3)-图像金字塔 图像预处理(3)-图像金字塔 6. 图像金字塔 图像金字塔实际上是一张图片在不同尺度下的集合,即原图的上采样和下采样。常见的图像金字塔包括高斯金字塔和拉普拉斯金字塔,但是也有一些其他算法衍生的金字塔,并不一定要高斯模糊,可以根据自身的应用场景来进行定义。 图像金字塔时图像中多尺度表达的一种,最主要用于图像的分割,是一种以多分辨率来解释图像的有效但概念简单的结构。图像金…
图像预处理(2)-滤波处理 图像预处理(2)-滤波处理 5. 各种滤波 5.1 线性滤波 线性滤波包括:方框滤波,均值滤波,高斯滤波。总的来说,这三种线性滤波原理:每个像素的输出值是输入像素的加权和。其处理方式都是将图像像素与相应的核进行卷积,核即是权重,其作用是将原图像素按权重进行分配。 5.1.1 方框滤波和均值滤波的卷积核 如下所示,k即为方框滤波的核,可以看到无论a为何值,矩阵内的每一个元…
图像聚类方法整理-基于密度的聚类方法 图像聚类方法整理-基于密度的聚类方法 K-means系算法对于凸性数据具有良好的效果,能够根据距离来讲数据分为球状类的簇,但对于非凸形状的数据点就有些无能为力了,当K-means算法在环形数据的聚类时,分类效果如下所示: 1. DBSCAN 从上图可以看出,K-means聚类产生了错误的结果,这个时候就需要用到基于密度的聚类方法了,该方法需要定义…
图像聚类方法整理-划分式聚类方法 图像聚类方法整理-划分式聚类方法 划分式聚类方法需要事先指定簇类的数目或者聚类中心,通过反复迭代,直到最后达到“簇内的点足够近,簇间的点足够远”的目标。经典的划分式聚类方法有K-means及其变体K-means++、bi-Kmeans、kernel K-means等 1. K-means 1.1 经典的K-means算法的流程如下: 选择初始化的个样本作为初始聚类…
一种基于分布式计算的疾病大数据挖掘分析系统 一种基于分布式计算的疾病大数据挖掘分析系统 G16H50/00:专门用于医疗诊断,医学模拟或医疗数据挖掘的信息和通讯技术;专门适用于检测、监测或建模流行病或传染病。 场景分析 疾病大数据的数据类型 在疾病大数据的数据挖掘预处理中(数据清洗过程中)有什么场景特征 对疾病大数据进行数据清洗的过程中有什么适用的算法,算法中有什么问题 医疗机构间信息不连通,导致…
OpenCV笔记-图像预处理1 OpenCV笔记 一. 图像预处理 1. 图像显示与存储 1.1 颜色空间 颜色空间(RGB) 加法混色 三通道:RGB 一个像素的颜色值:(b,g,r) 取值范围:[0,255] or [0.0,1.0] 颜色空间(CMY(K)) 减法混色,用于印刷 四通道 Cyan通道 Magenta通道 Yellow通道 black通道(key通道…