第300章丸辣

间只有少数边连接。社团发现的目的是就要找到网络内部不同群组之间的自然分割线。简而言之，它是一个把网络自然划分为顶点群组的问题，从而使得群组内有许多边，而群组之间几乎没有边。然而，“许多”和“几乎没有”到底是多少，这个问题值得商榷，为此提出了多种不同的定义，从而产生了不同的社团发现算法8基于层次聚类的算法。

第一阶段：称为Modularity Optimization，主要是将每个节点划分到与其邻接的节点所在的社区中，以使得模块度的值不断变大；第二阶段：称为Community Aggregation，主要是将第一步划分出来的社区聚合成为一个点，即根据上一步生成的社区结构重新构造网络。重复以上的过程，直到网络中的结构不再改变为止。步骤：1.初始化，将每个点划分在不同的社区中； 2.对每个节点，将每个点尝试划分到与其邻接的点所在的社区中，计算此时的模块度，判断划分前后的模块度的差值ΔQ是否为正数，若为正数，则接受本次的划分，若不为正数，则放弃本次的划分； 3.重复以上的过程，直到不能再增大模块度为止； 4.构造新图，新图中的每个点代表的是步骤3中划出来的每个社区，继续执行步骤2和步骤3，直到社区的结构不再改变为止。！在2中计算节点的顺序对模块度的计算是没有影响的，而是对计算时间有影响。

数据缺失的原因数据采集过程可能会造成数据缺失；数据通过网络等渠道进行传输时也可能出现数据丢失或出错，从而造成数据缺失；在数据整合过程中也可能引入缺失值删除法删除法通过删除包含缺失值的数据，来得到一个完整的数据子集. 数据的删除既可以从样本的角度进行，也可以从特征的角度进行。删除特征：当某个特征缺失值较多，且该特征对数据分析的目标影响不大时，可以将该特征删除删除样本：删除存在数据缺失的样本。该方法适合某些样本有多个特征存在缺失值，且存在缺失值的样本占整个数据集样本数量的比例不高的情形缺点：它以减少数据来换取信息的完整，丢失了大量隐藏在这些被删除数据中的信息；在一些实际场景下数据的采集成本高且缺失值无法避免，删除法可能会造成大量的资源浪费均值填补计算该特征中非缺失值的平均值（数值型特征）或众数（非数值型特征），然后使用平均值或众数来代替缺失值缺点一：均值填补法会使得数据过分集中在平均值或众数上，导致特征的方差被低估

本章未完，请点击下一页继续阅读！第2页 / 共3页

相关小说

都市 /

战神王爷夜夜来爬墙,王妃她怒了: 微茫的砂砾; 七八小说免费提供作者(微茫的砂砾)的经典小说：《战神王爷夜夜来爬墙,王妃她怒了》...; 1244383字06-14

都市 /

透视不赌石,你又在乱看: 迟暮流年; 七八小说免费提供作者(迟暮流年)的经典小说：《透视不赌石,你又在乱看》最新章节全...; 4147110字04-17

都市 /

你透视眼不去赌石,乱看什么呢！: 迟暮流年; 【小人物逆袭+透视+赌石+鉴宝+捡漏+神豪】秦朝阳,一个普通大学毕业生,社会晃荡两年...; 3795767字10-02

都市 /

热血：用拳头称霸世界: 爱吃油泼黄骨鱼的炎铭; 七八小说免费提供作者(爱吃油泼黄骨鱼的炎铭)的经典小说：《热血：用拳头称霸世界...; 711248字12-20

都市 /

霁月难逢: 子鹿; 534385字09-09

都市 /

影帝捡到软糯白月光: 夜夜南波; 601418字09-09

第300章 丸辣

相关小说

第300章丸辣