一种大规模样本数据的特征提取方法

一种大规模样本数据的特征提取方法

一、一种大规模样本数据的特征提取方法(论文文献综述)

冯栋[1](2021)在《基于机器视觉的目标检索方法研究》文中研究说明随着新一代信息技术的蓬勃发展,服务于城市治理的智能高清摄像头建设规模日渐庞大,催生出爆炸式增长的视频图像数据,同时高清的视图画面中不同尺度目标和场景细节也得以呈现。如何高效处理海量视频和图像数据,从中建立目标个体和群体的联系,并挖掘出更多有价值的信息变得愈发重要。基于视觉的目标图像检索技术正是解决这一问题的关键钥匙。视觉目标检索是计算机视觉领域和数字图像处理任务中最具有挑战性的工作之一,它的研究内容包含如何高效地构建待检索目标特征数据库和精准且快速地检索出相同或相似的目标图像两项任务。在实际工业应用环境中,受数据接入规模和复杂场景影响,使得待检索库庞大(亿级以上)且噪声数据干扰严重,从而导致构建快速、精准的视觉目标检索系统面临更严峻的考验。本学位论文围绕目标建库和目标检索两个环节来展开研究,主要有以下四方面的创新型工作:(1)针对待检索目标特征数据库噪声数据干扰严重的问题,在目标建库环节加入目标检测任务的研究,提出了一种EASNet网络的单阶目标检测方法。分别从主干网络结构设计、特征融合模块设计、损失函数设计三个方面开展深度优化工作,实验表明,该方法有利于克服不同分辨率下多尺度干扰、定位不精确、样本不均衡的问题;(2)为保障精准返回检索结果,提出了一种基于深度神经网络的多层特征融合方法,可融合底层局部特征和高层语义特征。该方法使用词袋模型和汉明嵌入方法对特征进行聚合以及细粒度量化,并采用正则化扩散方法对相似度得分结果重排序来提高检索精度。实验表明,该方法可有效提高检索精度;(3)针对海量视觉目标检索底库下的计算开销大和返回结果慢的问题,提出了一个分块多叉字典树MBNT的特征索引结构方法,并将其用来加速汉明空间下目标矢量特征的检索比对。通过对比实验表明,该方法在解决查找不命中问题的同时内存占用和计算开销更小。此外,本文还发现当二值矢量特征越来越紧凑且细节区分度更好时,精确r近邻搜索比近似r近邻搜索对视觉目标检索的速度优势越来越明显;(4)面向公安视频实战侦察场景,搭建视频目标检测和检索应用系统。该系统包含视图解析和目标检索两个子系统,其中EASNet视觉目标检测算法在视图解析子系统中被实现和使用,而基于深度神经网络的多层特征融合方法和分块多叉字典树MBNT的特征索引结构在目标检索子系统中被集成。该系统已在多地公安系统上测试,并取得了一定实战效果。

陶晓玲[2](2021)在《基于深度学习的网络安全分域态势评估研究》文中研究指明为了应对日益复杂、隐蔽的网络安全威胁,组织机构部署了大量的网络安全设备和系统,如防火墙、入侵检测、防病毒、安全审计等,这些措施和手段在一定程度上保证了网络系统的正常运行,但是其仍然具有一定的局限性,如它们大都属于被动的静态防护,不能适应当前网络复杂动态变化的安全需求;各种安全工具各自为战、功能分散,它们之间缺乏统一、有效的管理调度机制等,因此,业界产生了对实现跨域、全局把握网络安全状况的理论及工具的迫切需求。网络安全态势评估技术作为应对网络安全威胁较为有效的主动防御技术之一,近年来成为了业界研究的热点。当前网络呈现体系结构复杂、网络规模庞大、具有动态虚拟化管理方式等新特点,且面临的攻击行为逐渐呈现出大规模、协同、多阶段等特性,另外,内部用户威胁行为不容忽视,且愈演愈烈,致使已有的网络安全态势评估技术面临评估不够全面、准确、效率低等诸多问题。基于此,综合分析网络构成及运行状态、用户行为及操作过程存在或出现的安全状况,并结合深度学习技术,开展网络安全态势评估模型、态势要素提取、评估指标体系、网络域态势评估、用户行为威胁检测与评估方面的研究,论文的主要工作和贡献如下:(1)设计一种层次化的网络安全态势分域评估模型。由于内部用户行为的安全威胁对网络系统安全产生了不容忽视的影响,而很少有研究将用户行为作为安全态势评估因素,这也间接导致了评估结果的不全面和不可靠。基于此,引入分域的思想,设计一种层次化的网络安全分域态势评估模型。该模型加入并区分了基于用户行为的评估数据、因素及指标,实现了评估对象的相对完整性和全面性,分别从网络域和行为域两个方面对网络进行评估;采用了分层的体系结构,按照评估工作流程将模型分成了数据层、评估层及知识层。(2)提出一种基于逐层损失补偿深度自编码器的网络态势要素提取方法。由于当前网络环境下态势评估原始数据呈现多特征、高维度等特点,而且采用深度神经网络对其进行要素提取的过程中,随着数据维度降低,逐层的特征信息损失也不断加剧,最终影响态势评估的准确性。借鉴残差神经网络和拉普拉斯金字塔思想,提出一种改进深度自编码器的态势评估要素提取方法。该方法在深度自编码器的每个编码层都添加一个损失补偿模块,该模块首先利用编码层对应的解码层进行数据还原,其次,将计算得到的特征信息损失值补偿到对应的编码层输出中。实验结果表明,相比原始深度自编码器方法,该方法的loss收敛效果更好,且与其他方法相比,该方法对BP神经网络分类性能提升较显着。(3)提出一种基于层次聚类和层次分析法的态势评估指标体系构建方法。针对目前评估指标选取主观性强、指标体系缺乏完整性,导致态势评估不全面、评估结果可信度低等问题,结合层次聚类和层次分析法,创新性地提出一种态势评估指标体系构建方法。首先,建立分域指标体系层次结构模型,确定目标层和准则层中的综合性指标。其次,采用层次分析法量化评估因素,以减少属性赋值时的主观性;然后使用层次聚类将作用相似的评估因素自动聚类,并与综合性指标形成层次关系。最后,利用层次分析法筛选出有代表性的评估因素并构建优化的指标体系。通过真实网络环境中采集的数据进行实验,结果表明,与k-means聚类相比,层次聚类能自动形成评估因素之间的层次关系,且通过构建的指标体系得出的态势值可以反映实际网络的安全态势变化。(4)提出一种基于集成学习和GRU的网络域安全态势评估方法。针对机器学习评估模型因存在较大方差和均方误差使得决策过程不平滑,进而影响评估性能的问题,结合评估数据具有时间依赖特性,提出一种基于集成学习Subagging和GRU的安全态势评估方法。该方法利用GRU网络处理评估数据中的长时期依赖问题,并对其高维特征进行有效学习和表征;基于子采样方案的Subagging算法可以提升模型的泛化能力;同时,结合遗传算法对GRU网络的训练参数进行自动寻优。实验结果表明,基于GA的参数优化方法优于基于PSO的方法;与其他方法相比,提出的方法明显具有均方误差减少效应,评估性能更佳,且评估结果能较准确地拟合出真实的网络安全态势。(5)提出一种改进生成对抗网络的用户行为威胁检测与评估方法。由于用户行为评估正负样本数据分布极其不均衡,以及用户行为存在随机多变且不可预测等特点,结合生成对抗网络在小样本数据生成方面的优势,提出一种自适应滑动窗口的用户行为威胁检测与评估方法。该方法采用了滑动窗口算法,使得序列化的用户行为数据转换成能让生成对抗网络直接处理的矩阵数据,且考虑了用户行为之间的前后关联性,设计基于属性相似度的自适应滑动窗口机制,实现不同细粒度的用户行为威胁检测,在此基础上,根据设立的准则对检测结果进行行为威胁等级评估。实验结果表明,自适应滑动窗口的检测方法性能更佳;与其他典型方法相比,提出的方法准确率较高、误报率明显降低,且能有效评估用户威胁行为。

管庆吉[3](2021)在《胸部X射线图像中疾病识别与定位方方法研究》文中进行了进一步梳理胸部X射线检查是临床医学中诊断胸部疾病性价比最高的检查之一。胸部疾病在X射线图像上成像往往非常相似,如肺炎、胸腔积液等都表现为X射线图像的不透明性增加。另外受患者位置和吸气深度等因素影响,胸片质量参差不齐。这都使胸片的解释与诊断更加困难。同时,在实际临床应用中,医生不仅关注图像中存在哪些疾病,更加注重发现病变区域位置。胸部X射线图像中疾病病变区域面积小,图像之间相似度高,难以进行病理分析。另外,胸部疾病种类多且具有多发性。目前的研究尚缺少可靠的对疾病区域关键特征提取的方法,也很少有方法探索多种疾病之间的内部关系。研究胸部X射线图像中疾病识别与病变区域定位能够为疾病分类、病灶区域定位等计算机辅助诊断提供技术支持,也能提高医生诊断的效率,具有非常重要的临床实际应用价值。本文以胸部X射线图像为主要研究对象,深入研究了与病变区域位置相关的疾病识别方法和面向多标签疾病识别问题的方法。主要创新性工作包括:(1)目前,大多数基于深度学习的X射线图像疾病识别方法主要以学习整幅图像的全局特征为主。然而,使用全局图像进行疾病特征学习和疾病识别并没有考虑以下因素:首先局部病变区域往往面积非常小,容易受到图像中其他健康组织区域影响,其次图像中往往存在着较大面积的噪声问题。针对以上问题,本文提出了一种结合图像全局特征和局部特征进行图像疾病识别的方法,并在弱监督框架下定位局部判别区域。首先,提出了一种基于视觉注意机制的局部关键区域定位方法,以避免图像中与疾病无关区域或者噪声区域的影响。然后,结合图像全局特征和局部特征进行图像疾病识别。局部特征能集中关注到图像中具备判别能力的区域,全局特征能够补偿局部特征中丢失的信息,联合二者进行疾病识别有助于提高深度学习系统对病变区域较小的样本的特征学习能力,同时也能够降低噪声数据的影响。在Chest X-ray14数据集上的实验结果表明了该方法在病变区域定位和疾病识别任务上的有效性。(2)实际情况中,胸部X射线图像中往往存在多种疾病,不同病理之间存在一定的相关性,即某些疾病之间更容易存在合并症或并发症等情况。对此,本文从多种疾病图像特征学习角度出发,探索多种疾病之间的内在关联,旨在通过增强多种疾病之间的依赖关系来提高计算机辅助诊断识别水平。本文设计了一种基于视觉注意机制的多标签疾病图像特征学习方法,利用视觉注意机制学习特征之间的相关性,增强疾病相关特征之间的联系,排除不相关特征的干扰。与在样本空间学习疾病类别分布的方法相比,在图像特征空间学习多种疾病之间的关联能够缓解样本不足或者分布不平衡所带来的不利影响。在Chest X-ray14数据集上的疾病识别实验结果表明了多标签疾病特征学习方法的有效性。(3)学习与病变区域位置相关特征和提高特征空间依赖性有助于提升胸部疾病识别和定位性能。本文进一步将二者统一在一个框架下并提出了一种面向多标签胸部疾病识别与定位的判别特征学习方法。一方面设计了一种基于选择性信息瓶颈的方法实现端到端的判别区域定位。选择性变分信息瓶颈在传统的变分信息瓶颈约束的基础上,引入对特征的空间位置和通道选择性机制,尽可能地学习与疾病相关的图像特征,排除图像中大部分非病变区域的干扰,进而提高病变区域定位的准确性。另一方面通过对疾病图像特征进行空间-通道编码,自动学习图像特征在两个维度上更大范围内的关联,以此增强多种疾病特征空间内的依赖性。最终结合二者进行多标签胸部疾病识别。在Chest X-ray14数据集上的实验结果表明选择性信息瓶颈方法和特征空间-通道编码能够协同地学习图像判别特征,并提升疾病识别和病变区域定位任务的性能。

杨阳[4](2021)在《基于机器学习的程序路径可达性判定方法研究与实现》文中进行了进一步梳理结构测试中,不可达路径会浪费大量测试成本,极大降低测试用例的生成效率。若能提前确定路径可达性,则能将有限测试资源充分用于可达路径用例求解。传统的不可达路径判定方法有静态法、动态法和混合法。静态法与编程语言耦合,路径求解代价昂贵;动态法依赖测试数据生成,执行效率低;混合法虽然提高了求解效率,但仍受传统方法的限制。当前没有一种高效且通用的不可达路径判定方法。尤其对大规模程序而言,路径可达性求解难度极大。针对上述问题,本文提出了一种基于机器学习的程序路径可达性判定方法。该方法将路径求解问题转化为路径可达性分类问题,利用机器学习提高判定效率,具有一定通用性。围绕该方法,本文主要做了以下研究:(1)提出一种基于路径约束的程序路径特征提取方法。首先基于符号执行提取路径约束,并采取约束原子化、无效约束删减等方式对约束进行简化,然后进行约束编码,编码约束与关键词词频共同组成特征空间。(2)提出一种基于机器学习的程序路径可达性判定解决方法。首先在预处理阶段生成程序路径,通过区间运算、动态执行、人工确认的方式标注路径可达性。然后进行特征提取及向量化。最后,基于特征进行分类模型训练,获取不同模型的判定效果。通过机器学习的方法判定路径可达性,能够适用于过程内路径与过程间路径,且扩展性相对较好。本文基于上述方法,构建了逻辑回归模型、支持向量机模型、随机森林模型以及三种集成分类模型,选取了 10个开源C语言工程生成程序路径,对路径可达性进行了判定与交叉验证。实验结果表明,上述方法能为上万行的程序提供路径可达性判定,且所有模型判定结果精确率均能达80%以上。

吴鹏[5](2021)在《多形态软件代码同源判定技术研究》文中研究指明近年来,以软件代码为载体的网络安全问题频频发生,软件代码同源判定作为解决网络攻击溯源等安全问题的共性关键技术变得尤为重要,准确定位软件代码来源已成为各方关注的焦点。由于当前软件代码具备运行平台多样、变形手段繁多、表现形式复杂等多形态特点,导致其同源判定极为困难。如何有效的发现多形态软件代码同源,对增强我国网络空间安全的防护力、威慑力至关重要。面向多形态软件代码的同源判定,首先需厘清软件代码同源的概念及边界,实现其定性定量描述;其次需关注软件代码同源特征表示及其处理效率,研究新方法解决其时空开销大的问题;再次需考虑软件代码同源特征损失的应对措施,探索新思路解决其表征困难的问题;最后需针对新形态软件易变形的特点,设计新算法解决其同源判定方法适应性不足的问题。本文围绕多形态软件代码同源判定问题,深入分析了相关领域的技术发展趋势及面临的主要挑战,重点研究了多种形态软件代码的同源判定方法,并基于此构建了原型系统。主要贡献如下:(1)针对大规模软件代码同源判定时空效率不高的问题,提出了基于Motif结构的软件代码同源快速判定方法,通过对大规模软件语义结构图的有效表征,实现了大规模软件代码同源的快速判定。提出了基于函数调用图Motif结构的特征表示方法以及Motif结构提取算法,实现了Motif结构对软件代码函数调用图的表征,并设计了Motif结构及其频率分布的相似度计算方法,实现了软件代码同源快速判定。实验结果表明,本文方法在准确率、鲁棒性及耗时等方面均有明显优势,使其可应用于大规模软件代码同源的快速判定。(2)针对软件代码变形导致同源特征难以表征的问题,提出了基于混合语义的二进制代码同源判定方法,通过对多形态二进制代码潜在同源特征挖掘,实现了多形态二进制代码同源的准确判定。提出了文本语义及结构语义混合的特征表示方法,实现了文本嵌入与图嵌入相结合的混合语义表达,设计了混合语义模型嵌入孪生神经网络框架的方法,实现了二进制代码同源判定模型构建。实验结果表明,本文方法有效提升了二进制代码同源判别效果,该算法在多种测试条件下具有良好的稳定性,可支持多种形态二进制软件代码同源的准确判定。(3)针对新形态软件代码同源判定方法适应性不足的问题,提出了多维度的移动应用同源判定方法,通过对移动应用分区域的特征表示与计算,实现同源移动应用的准确识别。提出了移动应用整体、资源及代码等多维度的特征表示及针对性的处理算法,实现了不同侧面的同源判定,设计了多种相似度算法的联合及优化策略,实现了移动应用同源的准确判定。实验结果表明,本文方法在同源判定准确率和速度等方面具有显着优势,并在真实环境中表现良好,且不依赖有监督数据,可作为移动应用市场安全策略的有效补充。

王珂珂[6](2021)在《计及新能源的电力现货市场交易优化研究》文中研究说明能源是社会进步和人类生存的物质基础,随着能源资源约束日益加剧,绿色低碳发展成为我国经济社会发展的重大战略和生态文明建设的重要途径,我国亟需加快建设以可再生能源为主导的清洁低碳、安全高效的能源体系,实现“30·60”双碳目标。电力工业在现代能源体系中处于核心地位,在减少温室气体排放方面发挥着重要作用,应加大力度发展以风电、太阳能为代表的绿色电力。但由于中国风能、光能富集区与需求区逆向分布,市场在优化资源配置中的作用发挥不够充分,亟需完善新能源参与的电力现货市场交易机制,构建高比例新能渗透的电力现货市场交易决策支持方法,以实现资源有效配置,促进新能源消纳。鉴于以上考虑,本文从新能源参与对电力现货市场影响、新能源发电功率预测与电力现货市场电价预测、计及新能源的中长期合约与现货日前市场的衔接与出清机制、电力现货市场各阶段市场的衔接与出清机制、碳交易权市场与电力现货市场的耦合机制等多个方面展开研究。本文主要研究成果与创新如下:(1)对新能源参与对电力现货市场的影响进行研究,基于电力现货市场价格信号的复杂性,构建由三个模块构成的新能源对电力现货市场影响分析模型,包括基于数据统计的相关性分析、基于小波变换与分形理论的全部特征值分析与基于关键因素提取的相关性分析。以丹麦两地区现货市场的历史数据进行验证,证实新能源发电对于电价影响高于常规历史数据;基于小波变换分析与分形理论求得全部特征值方法,计算两地区分类准确率为分别为80.35%,82.30%,分类结果表明负荷、新能源发电量序列与新能源发电量占比分类错误率较高;通过关键特征提取的相关性分析结果,重要程度位于前三的因素均存在新能源发电相关因素。因此研究中仅考虑负荷等常规因素不足以支撑电力现货市场电价预测、交易匹配与出清问题的研究。(2)对电力现货市场中新能源发电功率与电价预测进行研究,构建基于完全集成经验模态分解(complementary ensemble empirical mode decomposition,CEEMD)与样本熵(sample entropy,SE)的数据预处理策略,基于和声搜索(harmony searchm,HS)算法优化的核极限学习机(kernel extreme learning machine,KELM)的混合新能源发电功率预测模型,基于相似日筛选与长短期记忆模型(long short-term memory,LSTM)的电力现货市场电价预测模型。针对非线性、非稳态的短期新能源发电功率预测,首先通过皮尔森相关系数筛选模型输入数据,减少数据冗余;而后,采用CEEMD-SE的组合数据预处理策略,对发电功率时间序列进行分解和重构,消除数据噪声,减少模型计算量;其次,采用HS-KELM模型对重构后的多个子序列进行建模预测,集成处理后得到最终的新能源发电功率预测值。基于CEEMD-SE-HS-KELM新能源发电功率预测模型具有更高的预测精度。针对电力现货市场电价预测,将新能源出力指标纳入电力现货市场电价预测中,首先采用CEEMD-SE对电价序列进行分解与重构;而后,构建基于随机森林(random forest,RF)与改进灰色理想值逼近(improved approximation ofgrey ideal values,IAGIV)的新能源出力影响量化模型,筛选出与待预测天数关联性较强的历史天作为输入集;其次,采用LSTM模型对重构后的多个子序列分别进行预测,基于CEEMD-SE-RF-IAGIV-LSTM预测模型对于电价序列的拟合效果较好,可为电力现货市场参与主体制定交易策略、现货市场出清撮合提供支撑,降低电力现货市场中的风险。(3)对计及新能源与中长期市场影响的现货日前电力市场优化模型进行研究。本文提出计及中长期合约电量分解与新能源参与的日前电力市场交易优化模型,首先构建考虑火电厂合约电量完成进度偏差的中长期合约电力分解模型,将分解得到的每日中长期合约电量作为约束引入日前市场的优化模型中,保证中长期合约电量物理执行;针对系统不确定性进行建模,在电力现货市场价格模拟中加入新能源渗透率,更精准地刻画能源参与对于电力现货市场的影响;构建新能源参与的日前市场多目标出清优化模型,利用模糊优选方法对多目标进行转换,较好地平衡经济性与节能减排目标;最后采用基于GA-PSO组合优化模型对构建模型进行求解。模型求解结果表明,本文构建的多目标优化函数能够在保证系统运行经济效益的基础上,实现环境效益最大化,达到节能减排的效果;同时随着新能源渗透率的增加,系统不确定性增加,常规机组的成交电量有所下降。(4)对计及新能源的日前市场与日内市场的衔接机制进行分析,并构建相应的出清优化模型。在日前市场与实时市场之间增加日内市场,以减少系统辅助服务成本、降低用于平衡间歇性、波动性新能源的化石燃料容量、灵活性资源配置与储能成本,以提高现货市场效率,更好的发挥市场对资源优化配置的作用。采用基于模型预测结果与误差分布函数结合的不确定性刻画模型,而后构建了基于拉丁超立方采样进行场景集生成法与改进谱聚类分析的场景集削减策略,能够选择出最具代表性的场景集。基于电力现货市场出清流程,将含有新能源较多的系统将引入日内市场,以减小实时市场的功率偏差,提高系统运行的经济性和稳定性,采用预测模型对新能源出力、电力负荷进行预测,结合预测误差分布函数刻画系统不确定性;构建日前市场和模拟日内市场联合出清优化模型,在各个日内市场考虑对应实时市场新能源偏差功率的不确定性、电价不确定性,建立各日内市场和模拟实时市场联合优化模型。(5)考虑到中国“30·60”双碳目标与宏观发展规划,本文构建一个基于STIRPAT模型碳排放影响因素分析与改进烟花算法(improved fireworks algorithm,IFWA)优化的广义回归神经网络(general regression neural network,GRNN)预测模型。基于不同的社会环境与政策环境,对碳排放影响因素进行模拟并设定,预测结果表示中国的碳排放总量将于2031年达到峰值。以此为基础分析现行政策下中国的碳减排压力,并进行相应的建设全国统一的碳交易权市场必要性分析。而后,基于电力市场和碳市场的建设现状,利用系统动力学模型进行碳交易对电力现货市场的影响分析,系统动力学模型分析结果证实电力市场价格与碳交易价格呈现正相关关系;最后,基于对于碳交易对电力市场作用机理的分析,提出碳交易机制与电力现货市场机制协同建设建议。

冯文轩[7](2021)在《基于非线性特征提取算法的ECG身份识别研究》文中进行了进一步梳理伴随着现今时代高新技术的进步,个人身份识别技术在各个领域所起到的作用也越来越关键,如金融、安防、保密等领域。而传统的身份识别技术逐渐暴露出各种缺陷。如此一来,基于人体生理特征的身份识别技术以其安全性和便利性成为了新的热门技术。而基于心电信号(ECG)的身份识别技术越来越得到重视,有着广阔的应用前景。经过多年研究,心电信号在医学领域已经成为一种成熟可靠的数据,为临床诊断提供信息,而对于身份识别领域,心电信号相比其它的生理信号有着采集技术成熟、一维数据处理简单的优势,同时因其体内特征不暴露在外的特点,数据极难伪造。目前针对基于ECG的身份识别技术研究已经取得了很多进展,但现有的识别技术依然存在诸多问题。目前大量的研究都是在规模仅有几十人或一两百人的小数据库上进行的,因此虽然识别准确率接近100%,但距离实际应用场合的数据规模差距很大,当同样的算法应用到更大规模的数据集上时识别的准确率和效率均会明显下降,传统方法计算量大、模型泛化能力的问题暴露出来,需要对身份识别技术的时效性和模型泛化性进行改进。针对这些问题,本文从心拍分割、特征处理和分类识别方面进行了以下研究:1、提出了一种基于t-分布随机邻近嵌入(t-SNE)算法结合随机森林分类器(Random Forest,RF)的ECG身份识别方法。首先定位输入信号的R点,并进行心拍分割及归一化。然后利用t-SNE算法结合PCA特征向量进行特征提取,最后根据降维后的特征,使用随机森林算法构建并训练分类器。其中t-SNE算法能有效压缩心电信号数据处理的维度,本文降维后的特征维度仅为二维,这样能加显着提高分类器的训练速度,在降低冗余度的同时并且保留了心电信号数据的特征,增强了ECG身份识别的准确率,随机森林算法有着非常好的抗过拟合能力,能够增强识别模型的泛化性能。为了检验本方法的性能,本文在Physio Net/CinC 2017数据库上进行了实验,结果表明,本文提出的ECG身份识别方法有着优异的识别准确率和时效性能,并且在大数据集上相比传统方法的泛化性能更好,在样本量达到1000的时候,识别准确率依然有91%,而这时基于PCA+SVM、PCA+Adaboost等方案的传统方法准确率已经降低到85%以下。2、提出了一种基于TriMAP降维算法的ECG身份识别方案。通过对非线性降维算法的进一步研究,针对t-SNE算法在降维过程中迭代时间过长,时效性不强的缺点,本文提出了使用更好的非线性降维算法TriMAP进行降维的方法。TriMAP算法在时效性上有效克服了t-SNE算法耗时过长的缺陷,与别的非线性降维算法(如t-SNE、Large Vis和UMAP)相比拥有最低的时间耗费,并且在运算时占用的空间资源也最低。实验表明,在实验个体数量为1000的情景下,本方案的耗费相比t-SNE算法缩减了95%以上,同时依然保持了90%的准确率。综上所述,本文提出的ECG身份识别方法有着优异的识别准确率和时效性能,并且在大数据集上相比传统方法的泛化性能更好。是对基于ECG的身份识别技术的一次实用化探索。

甘吉[8](2021)在《手写文字识别及相关问题算法研究》文中研究说明作为信息表达和交流的重要工具,文字被广泛地应用于人们的日常生活和工作中。同时,手写也是每个人在社会中赖以生存的技能。随着计算机的发展和普及,手写文字识别作为一种高级的人机交互方式在近几十年来引起了人们的广泛关注。虽然研究者们在手写识别领域已经取得了大量突破性的进展,但是基于深度学习的手写识别算法仍然有很大的改进空间,因此如何设计更为准确高效的手写识别算法是本文的核心研究内容。另外,随着传感技术的发展,一种新型人机交互方式下的空中手写被提出,即用户可以直接使用手或手指在三维空间中自由地书写。然而,目前的空中手写识别研究仍然处于起步阶段,特别是针对空中手写中文文本识别的研究还处于一片空白。因此,空中手写识别也是本文的主要研究目标之一。本文主要的贡献总结如下:1.本文从一个全新的角度提出了一种基于一维卷积网络的联机手写汉字识别算法,即使用一维卷积网络直接对手写汉字轨迹的时序结构进行建模。本文提出的方法完全不同于目前主流的手写识别算法(包括基于二维卷积网络或循环神经网络的识别算法),并且具有显着的优势:(1)相比于二维卷积网络,提出的方法避免了经验化的领域知识来提取复杂的方向特征图,同时我们的模型参数更少且识别精度更高;(2)相比于循环神经网络,提出的方法能够并行地处理时序数据,其对于长序列手写轨迹的识别速度更快。2.本文提出了一种基于注意力机制的手写英文单词识别算法,该方法采用了编码-解码的架构并通过结合注意力机制迭代地输出目标字符串。同时,本文使用以下策略来进一步改进模型,包括:(1)我们使用一维卷积网络替代循环神经网络编码手写轨迹,显着地提升了模型的编码速度;(2)我们采用了词典约束的解码算法,显着地提升了模型的识别准确率。另外,我们构建了首个大规模的空中手写英文单词数据集IAHEW-UCAS2016用于促进后续的空中手写英文单词识别研究。最后,本文搭建了一个实用的空中手写英文单词识别系统。3.为了有效地识别联机手写中文文本,本文提出了一种新颖的时序卷积循环神经网络,其相比于现有的识别算法更具优势:(1)相比于主流的循环神经网络,提出的方法具有更快的计算速度和更高的识别准确率;(2)相比于最先进的全卷积循环网络,提出的方法避免了经验化的领域知识来提取复杂的特征图,同时模型的训练效率更高(包括更低的计算复杂度,更少的内存消耗,更快的收敛速度)且模型参数更少。为了进一步探究新型的空中手写,本文搭建了世界上首个三维空中手写中文文本识别系统。据我们所知,目前学术界还没有任何针对空中手写中文文本识别的研究。为此,我们构建并公开了首个大规模的空中手写中文文本数据集IAHCT-UCAS2018,从而促进后续的空中手写中文文本识别研究。4.本文提出了一种新颖的基于生成对抗网络的手写文本生成算法。现有的手写生成方法还没有完全地解决手写文本生成任务,因为它们都局限于生成较短的手写单词或者随机风格的手写文本图片。相反,本文提出的模型能够根据给定的任意文本生成任意长度的手写图片,其不局限于事先定义好的语料库或任何词汇表外的单词。同时,我们的模型能够从给定的参考样本中准确地提取出书写风格,从而进一步模仿生成具有相似风格的其它手写文本。实验分析表明本文提出的模型针对手写文本生成具有很好的泛化性,而不是单纯地记忆训练集中的真实手写样本。5.针对基于卷积神经网络的手写汉字识别模型,本文提出了新颖的一体化网络压缩算法。本文提出的压缩算法结合了通道裁剪和参数量化两种策略,能够在保证识别精度的前提下最大限度地压缩识别模型。具体地,在通道裁剪阶段,我们采用了粗细粒度相结合的裁剪策略来迭代地裁剪掉卷积网络中冗余的通道;在参数量化阶段,我们引入了权值丢弃和迭代式量化策略来最大限度地量化模型参数。在公开手写数据集(包括ICDAR-2013,IAHCC-UCAS2016,以及MNIST)上的实验结果表明提出的方法能够显着地压缩基于卷积神经网络的手写汉字识别模型。

万超群[9](2021)在《行人重识别不变性特征学习》文中研究表明行人重识别是指在有限时空范围的监控场景下,跨越监控范围内不同的监控摄像头,对其中拍摄截取的行人图像进行行人身份识别与检索的任务。行人重识别任务的关键在于如何克服行人图像内容丰富的变化,提取具有不变性的、能够描述行人身份信息的特征表达。这些变化主要包含三个方面。一是由于行人行走动作和监控摄像头拍摄视角引起的,称为人体的变化。二是由于监控范围内的环境和监控摄像头的偏置引起的,称为风格的变化。三是由于监控摄像头非正常工作或者人为恶意攻击导致的,称为噪声的变化。目前已有的不变性特征学习方法主要从整张行人图像出发,容易产生以下三种问题。(1)全局不变性特征学习容易忽略图像中人体的变化,导致细节信息的丢失。(2)全局不变性特征学习难以应对未知的风格的变化,限制模型应用于未知监控场景的能力。(3)全局不变性特征学习容易受到噪声,特别是特殊设计的对抗噪声的影响,导致识别错误。因此,如何应对行人图像中复杂多样的变化,是行人重识别亟待解决的问题。因此,本论文针对性地分析三种变化在行人图像中的特点,并分别设计新的不变性特征学习方法:针对人体变化的不变性特征研究——行人局部学习,针对风格变化的不变性特征研究——网络解耦学习,针对噪声变化的不变性特征研究——流形空间学习。对于行人局部学习,虽然目前已有工作进行了针对性研究,但是现有的方法难以获取精确的行人身体部位,并对身体部位的特征充分表达。这导致了行人身体部位无法对齐,从而产生错误的比对,造成相同行人的特征具有较大的类内差异。同时不充分的特征表达又会造成不同行人的特征具有较小的类间距离。两点原因极大限制了现有局部学习方法的有效性。故而,本论文强调了行人身体局部区域定位和局部区域描述的重要性,并设计了带集中性约束和区分性约束的注意力机制模块,提出了基于统计、位置、关联的特征描述子,从而对行人身体局部实现更加精确的定位和更加细致的描述。该人体局部学习方法极大提高了行人重识别算法对于人体变化的稳定性,能够提取保有不变性的行人局部细节特征。对于风格的变化,绝大多数目前的工作都是从整张行人图像出发挖掘目标监控场景下未知的图像风格。这些方法借助已有行人图像数据和模型,利用这些先验知识进行迁移学习。然而由于目标场景风格的特殊性,已有的先验知识无法直接应用于未知风格的监控场景之中,限制了现有算法的迁移效果。本论文提出区分行人身份的信息既存在于行人主体部分也存在于图像风格部分。而行人主体部分是场景间相似的,因此行人主体的特征提取是可以在不同监控场景间共享的;而图像风格部分是场景间特异的,因此图像风格的特征提取需要基于目标监控场景重新挖掘。为了实现场景间共享特征和特异特征的解耦,本论文基于网络结构层面提出网络解耦学习,利用不同的模块实现对行人主体和图像风格的特征提取。该方法充分利用了已有的先验知识,并尽可能挖掘目标场景特有的内容,可以在任意目标监控场景下达到更高的行人重识别效果,并且在不利用数据标注的条件下,识别准确率非常逼近有标注的识别准确率。对于噪声的变化,目前鲜有工作针对这项需求进行研究,限制了行人重识别技术在实际生活中的应用扩展。因此,本论文基于“噪声导致样本脱离数据分布流形”的假设,提出流形空间学习。所谓流形空间,即真实世界的高维数据实际上分布在一个低维的流形上。换句话说,流形上的数据都是无噪数据,而噪声使得数据脱离流形,脱离了模型训练学习的数据分布范围。因此,本论文提出估计真实数据的流形空间,并定义流形投影操作将带噪数据重新投影回流形空间之上。这种方式构建了噪声数据和真实无噪数据之间的联系,从而能够减小因噪声带来的分布的改变,提高模型进行特征提取时对于噪声的稳定性,获取具有不变性的特征。本论文的主要工作和创新之处总结如下:·针对行人图像人体的变化,本论文提出了带集中性约束和区分性约束的注意力机制模块和丰富的特征描述子,证明了人体局部学习中局部区域精确的定位和细致的描述的重要性。该算法改善了传统局部定位响应分散、无意义、以及特征描述简单等问题,极大提升了行人重识别算法的效果;·针对行人图像风格的变化,本论文首次提出网络解耦的方法分别学习行人主体特征和图像背景特征。该算法充分利用了行人图像的时空关系,在无数据标注的条件下,行人重识别算法效果非常接近有数据标注的结果。·针对行人图像噪声的变化,本论文首次提出流形学习结构层和流形网络,通过建模特征的流形空间,并引入流形投影来消除噪声干扰,极大提高了行人重识别算法模型对于噪声的稳定性。

陈振铎[10](2021)在《面向大规模媒体检索的监督哈希方法研究》文中研究指明近似近邻检索在科研和实践中都扮演着重要的角色。然而,随着互联网和日常生活中多媒体数据的爆发式增长,针对给定的查询样本,在可接受的时间和存储消耗下从如此大规模的数据集中检索其确切的最近邻逐渐变得难以实现。因此,研究者们开始转向近似近邻检索的思想,试图在检索精度和效率之间寻求一个平衡,基于哈希技术的检索方法也因其快速的检索速度和较低的存储消耗而受到了越来越多的关注。经过一段时间的发展,现在利用语义标签等监督信息来更好地获得数据样本之间相似关系的监督哈希方法逐渐成为了当下基于哈希的检索方法研究的主流。尽管现有的监督哈希检索方法已经取得了良好的效果,但是依然有着许多有价值的问题有待进一步研究。首先,监督哈希方法的关键是如何充分发挥监督信息的作用来学习更好的哈希码和哈希函数,但是目前这一问题依然是没有完美答案的开放问题。此外,随着深度学习技术的发展,也有许多方法尝试设计基于深度网络的监督哈希方法,但是,除了像普通方法那样利用监督信息来构建学习目标之外还能以何种方式发挥监督信息的作用,以及如何有效的结合深度神经网络和哈希检索方法进而能够在充分发挥深度特征提取网络的优势的同时尽可能利用现有哈希方法设计经验,依然是有待进一步研究的问题。最后,一项技术的关键仍然在于应用,如何有效应用监督哈希的思想解决更加困难但也更加重要的实际问题,也是研究者需要重点考虑的问题。基于以上讨论,本文针对面向大规模媒体检索的监督哈希方法展开了深入研究,并且尝试将哈希检索技术应用于更加困难也更有价值的实际任务,即细粒度数据检索。具体来说,本文的主要工作包括:(1)本文提出了一种简单且有效的策略来实现深度特征提取网络和现有传统非深度哈希方法的融合,并在此基础上设计了一种新的策略来发挥监督信息的作用,即哈希编码重构。本文提出了双深度神经网络跨模态哈希方法,其中包含三个训练阶段和两个作为哈希函数的深度网络。具体来说,该方法首先选择一种现存的单模态哈希方法来为一个数据模态(比如文本)生成初始二进制编码;然后,这些生成的哈希码被用作监督信息来训练作为另一个模态(比如图像)哈希函数的深度网络;最后,利用训练得到网络获取对应模态的哈希码,将这些哈希码根据特定的重构过程进行重构,然后作为监督信息来训练作为文本模态哈希函数的网络。该方法可以被视作一种能够将任意单模态哈希方法扩展为深度跨模态哈希方法的框架,同时该方法的效果还将会随着所选择的单模态方法的效果提升而提升。(2)本文优化了以哈希码和哈希函数分开训练为特点的传统两步哈希学习策略,并提出了一种新的方法来充分利用监督信息。本文设计了一种新的两步跨模态哈希方法,即类别关系及语义相似保持的两步哈希方法。该方法首先直接根据语义标签学习哈希码,同时尝试发掘和利用不同标签类别之间的相关性信息;然后在第二步中,不同于其他两步方法只关注哈希码学习而忽视哈希函数训练,该方法改进并集成了前一段所述方法中的哈希编码重构过程的思想,尝试在哈希函数的学习过程同样引入语义关系信息。到目前为止,该方法是第一个尝试利用标签类别相关性的哈希方法,也是第一个尝试在两步中都引入监督信息的两步哈希方法。(3)在综合上述研究的基础上,本文进一步尝试解决一个更加困难但也更具实用价值的问题,即细粒度哈希,并结合细粒度数据的特点提出了有监督的特征优化思想。细粒度哈希方法应用于细粒度数据集的检索任务,在这类数据集中数据样本之间的差异往往非常细微。细粒度哈希是哈希检索领域的一个新问题,目前仅有非常少的相关工作。本文首先总结了三个细粒度哈希方法需要关注的要点:细粒度特征提取、特征优化以及损失函数设计,然后提出了双重过滤细粒度哈希方法。该方法采用基于代理的损失函数和特别设计的特征提取网络,同时继承了前述方法的两步学习策略。该方法的核心即为双重过滤机制,其主要包含两部分,分别是用于提取更高质量细粒度特征的空间过滤模块和用于进一步优化特征的特征过滤模块。该方法高效且有效的同时也非常易于实现,从这个角度来说,本文的研究充分证明了监督哈希方法在细粒度检索这一新领域的潜力。

二、一种大规模样本数据的特征提取方法(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、一种大规模样本数据的特征提取方法(论文提纲范文)

(1)基于机器视觉的目标检索方法研究(论文提纲范文)

致谢
摘要
ABSTRACT
1 绪论
    1.1 研究背景及意义
    1.2 当前研究现状
    1.3 主要研究内容
    1.4 论文组织结构
2 相关研究基础
    2.1 引言
    2.2 目标检测方法研究
        2.2.1 双阶目标检测技术
        2.2.2 单阶目标检测技术
    2.3 特征表达
        2.3.1 基于传统的手工特征提取
        2.3.2 基于深度学习的特征提取
    2.4 目标检索
        2.4.1 简单相似图像检索
        2.4.2 多标签图像检索
        2.4.3 相似性度量方法
        2.4.4 图像检索数据集
        2.4.5 性能评价指标
    2.5 本章小结
3 基于空洞卷积和上下文信息的目标检测算法研究
    3.1 引言
    3.2 空洞卷积
    3.3 条纹池化
    3.4 基于空洞卷积和上下文信息的目标检测方法研究
        3.4.1 EASNet主干网络结构的构建
        3.4.2 EASModule特征融合
        3.4.3 EASHead损失函数设计
    3.5 实验结果与分析
        3.5.1 实验设置
        3.5.2 实验结果及对比
    3.6 本章小结
4 基于多层级的特征融合方法研究
    4.1 引言
    4.2 多层级特征融合结构
    4.3 基于卷积神经网络的分层池化和量化
    4.4 多层级特征融合方法
    4.5 实验与分析
        4.5.1 实验设置
        4.5.2 实验结果与评价
    4.6 本章小节
5 基于哈希索引的大规模目标快速检索方法研究
    5.1 引言
    5.2 哈希算法
    5.3 汉明空间近邻搜索
    5.4 基于分块字典树的精确r近邻搜索
        5.4.1 目标搜索流程
        5.4.2 分块多叉字典树
        5.4.3 基于MBNT的精确r近邻搜索
    5.5 实验结果与分析
        5.5.1 数据集选择和评测指标
        5.5.2 多尺度目标搜索的平均准确率
        5.5.3 MBNT索引结构关键参数设置
        5.5.4 多尺度目标搜索的平均检索时间
        5.5.5 近似搜索和精确搜索算法对比
    5.6 本章小结
6 面向公安场景的视频目标检测与检索应用
    6.1 引言
    6.2 视频目标检测与检索应用系统设计
        6.2.1 系统架构设计
        6.2.2 视图解析子系统
        6.2.3 目标检索子系统
    6.3 实验应用效果
        6.3.1 硬件环境配置
        6.3.2 验证场景说明
        6.3.3 验证方案设计
        6.3.4 验证结果说明
    6.4 本章小节
7 总结与展望
    7.1 工作总结
    7.2 工作展望
参考文献
作者简历及攻读博士学位期间取得的研究成果
学位论文数据集

(2)基于深度学习的网络安全分域态势评估研究(论文提纲范文)

摘要
Abstract
缩略词对照表
第一章 绪论
    §1.1 研究背景及意义
    §1.2 国内外研究现状
        §1.2.1 评估模型研究现状
        §1.2.2 态势要素提取研究现状
        §1.2.3 评估指标体系研究现状
        §1.2.4 评估方法研究现状
        §1.2.5 用户行为评估研究现状
    §1.3 研究问题及挑战
        §1.3.1 研究问题
        §1.3.2 研究挑战
    §1.4 研究内容及贡献
    §1.5 论文组织结构
第二章 网络安全态势评估技术及分域评估模型设计
    §2.1 网络安全态势评估基本概念
    §2.2 网络安全态势评估模型
        §2.2.1 JDL数据融合处理模型
        §2.2.2 Tim Bass模型
        §2.2.3 层次化态势评估模型
    §2.3 网络安全态势评估方法
        §2.3.1 基于数理统计的评估方法
        §2.3.2 基于知识推理的评估方法
        §2.3.3 基于模式识别的评估方法
    §2.4 层次化的网络安全态势分域评估模型设计
        §2.4.1 评估模型的分层描述
        §2.4.2 评估模型的特点分析
    §2.5 本章小结
第三章 基于逐层损失补偿深度自编码器的态势评估要素提取
    §3.1 引言
    §3.2 系统模型及问题定义
        §3.2.1 态势评估要素提取模型
        §3.2.2 问题定义
    §3.3 LC-DAE态势评估要素提取方法设计
        §3.3.1 方法架构
        §3.3.2 DAE结构
        §3.3.3 损失补偿算法设计与实现
    §3.4 LC-DAE态势评估要素提取方法实现
        §3.4.1 方法流程设计与伪代码实现
        §3.4.2 时间复杂度分析
    §3.5 实验及结果分析
        §3.5.1 实验环境
        §3.5.2 实验数据
        §3.5.3 对比实验及结果分析
    §3.6 本章小结
第四章 基于层次聚类和层次分析法的态势评估指标体系构建
    §4.1 引言
    §4.2 问题定义
    §4.3 分域指标体系构建方法设计
    §4.4 网络域指标体系构建方法设计与实现
        §4.4.1 基于AHP的评估因素量化方法
        §4.4.2 基于层次聚类的指标聚类方法
        §4.4.3 基于AHP的指标优化方法
    §4.5 网络域指标体系合理性理论分析
    §4.6 实验及结果分析
        §4.6.1 实验环境及数据采集
        §4.6.2 评估指标计算过程
        §4.6.3 实验结果分析
    §4.7 本章小结
第五章 基于Subagging和GRU的网络域安全态势评估
    §5.1 引言
    §5.2 系统模型及问题描述
        §5.2.1 态势评估模型
        §5.2.2 问题描述
    §5.3 Sb-GRU网络域安全态势评估方法设计
        §5.3.1 方法架构设计
        §5.3.2基于Subagging的采样及训练方法
        §5.3.3 基于GA的参数优化方法
        §5.3.4 基于GRU的网络域安全态势评估方法
    §5.4 Sb-GRU网络域安全态势评估方法实现
        §5.4.1 方法实现
        §5.4.2 时间复杂度分析
    §5.5 实验及结果分析
        §5.5.1 实验环境
        §5.5.2 实验数据
        §5.5.3 实验结果及分析
    §5.6 本章小结
第六章 基于自适应滑动窗口GAN的用户行为威胁检测与评估
    §6.1 引言
    §6.2 系统模型及问题定义
        §6.2.1 任务模型
        §6.2.2 行为模型
        §6.2.3 威胁检测及评估模型
        §6.2.4 问题定义
    §6.3 ASW-GAN用户行为威胁检测与评估方法设计
        §6.3.1 方法框架
        §6.3.2 基于属性相似度的自适应滑动窗口算法
        §6.3.3 基于GAN的威胁检测设计
        §6.3.4 用户行为评估方法设计
    §6.4 ASW-GAN用户行为威胁检测与评估方法实现
        §6.4.1 方法实现
        §6.4.2 时间复杂度分析
    §6.5 实验及结果分析
        §6.5.1 实验环境
        §6.5.2 实验数据
        §6.5.3 实验结果分析
    §6.6 本章小结
第七章 总结与展望
    §7.1 论文研究工作总结
    §7.2 下一步研究工作展望
参考文献
致谢
作者攻读博士学位期间取得的学术成果

(3)胸部X射线图像中疾病识别与定位方方法研究(论文提纲范文)

致谢
摘要
ABSTRACT
主要符号对照表
1 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 胸部X射线图像公共数据及特点
        1.2.2 疾病识别
        1.2.3 病变区域定位
    1.3 研究难点
    1.4 研究内容及创新点
    1.5 论文框架与结构安排
2 相关理论基础与方法
    2.1 疾病识别方法
        2.1.1 病变位置相关的疾病识别方法
        2.1.2 面向多标签疾病识别的方法
    2.2 病变区域弱监督定位方法
        2.2.1 基于图像类别标签的弱监督病变区域定位方法
        2.2.2 引入额外信息的弱监督病变区域定位
    2.3 本章小结
3 结合全局与局部特征的胸部疾病识别与定位方法
    3.1 引言
    3.2 结合全局与局部特征的X射线图像疾病识别方法
        3.2.1 网络架构
        3.2.2 视觉注意机制引导下的图像局部判别区域定位方法
        3.2.3 模型优化与训练策略
    3.3 实验结果与分析
        3.3.1 数据集与实验设置
        3.3.2 实验细节
        3.3.3 结果与分析
        3.3.4 实验讨论
    3.4 本章小结
4 面向多标签胸部疾病识别的图像特征学习方法
    4.1 引言
    4.2 基于视觉注意机制的相关性特征学习方法
        4.2.1 相关性特征学习策略
        4.2.2 方法框架和流程
    4.3 实验结果与分析
        4.3.1 实验设置和评价指标
        4.3.2 不同视觉注意机制比较
        4.3.3 与其他方法的比较结果
        4.3.4 消融实验
        4.3.5 可视化结果
        4.3.6 多种疾病识别性能分析
    4.4 本章小结
5 面向多标签胸部疾病识别与定位的判别特征学习方法
    5.1 引言
    5.2 面向多标签胸部疾病识别与定位的判别特征学习
        5.2.1 问题定义与方法框架
        5.2.2 选择性变分信息瓶颈
        5.2.3 空间通道特征编码
        5.2.4 模型优化
    5.3 实验结果与分析
        5.3.1 数据集与实验设置
        5.3.2 疾病识别实验结果与分析
        5.3.3 病变区域定位实验结果与分析
    5.4 本章小结
6 总结与展望
    6.1 工作总结
    6.2 未来展望
参考文献
作者简历及攻读博士学位期间取得的研究成果
学位论文数据集

(4)基于机器学习的程序路径可达性判定方法研究与实现(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 研究背景及意义
    1.2 研究内容
    1.3 本文创新点
    1.4 本文工作
    1.5 论文结构
第二章 相关概念和技术
    2.1 引言
    2.2 结构测试技术
    2.3 路径生成相关概念和技术
        2.3.1 基本路径生成
        2.3.2 过程间路径生成
    2.4 不可达路径检测相关概念和技术
        2.4.1 静态检测法
        2.4.2 动态检测法
        2.4.3 混合检测法
    2.5 分类学习相关概念及技术
        2.5.1 逻辑回归
        2.5.2 支持向量机
        2.5.3 决策树与随机森林
    2.6 本章小结
第三章 基于约束的程序路径特征提取方法
    3.1 引言
    3.2 相关定义
    3.3 约束提取
        3.3.1 基于符号执行的约束提取
        3.3.2 约束原子化
        3.3.3 约束化简
        3.3.4 约束编码方式
    3.4 其他特征提取
        3.4.1 特征选择
        3.4.2 特征真值化
    3.5 本章小结
第四章 程序路径可达性判定模型
    4.1 引言
    4.2 数据预处理
        4.2.1 程序路径生成
        4.2.2 路径可达性标注
    4.3 特征提取及向量化
        4.3.1 特征选取
        4.3.2 特征编码
    4.4 模型构建与集成
        4.4.1 模型构建
        4.4.2 模型集成
    4.5 本章小结
第五章 原型系统的设计与实现
    5.1 引言
    5.2 需求分析
        5.2.1 功能性需求
        5.2.2 非功能性需求
    5.3 系统架构
    5.4 模块设计与实现
        5.4.1 数据集处理模块
        5.4.2 特征处理模块
        5.4.3 模型训练模块
        5.4.4 模型评估与展示模块
    5.5 界面展示
    5.6 本章小结
第六章 实验结果及分析
    6.1 实验环境
    6.2 评价指标
    6.3 小规模程序可达性实验
        6.3.1 数据集
        6.3.2 结果及分析
    6.4 大规模程序可达性实验
        6.4.1 数据集
        6.4.2 结果及分析
    6.5 本章小结
第七章 总结与展望
    7.1 研究工作总结
    7.2 进一步研究工作
参考文献
致谢

(5)多形态软件代码同源判定技术研究(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 研究背景与意义
    1.2 研究现状
        1.2.1 软件代码同源判定研究
        1.2.2 软件代码相似度研究
        1.2.3 软件代码抄袭及克隆研究
    1.3 研究面临的挑战
    1.4 研究内容及创新
        1.4.1 论文研究内容
        1.4.2 论文主要创新
    1.5 论文组织结构
第2章 软件代码同源理论模型
    2.1 软件代码同源定义
    2.2 软件代码同源模型
    2.3 软件代码同源特征模型
    2.4 软件代码相似度度量模型
    2.5 软件代码同源判别模型
    2.6 本章小结
第3章 基于Motif结构的大规模软件代码同源快速判定方法
    3.1 引言
    3.2 方法框架描述
        3.2.1 总体框架
        3.2.2 软件Motif结构及频率分布
    3.3 基于软件Motif结构的同源判定算法
        3.3.1 函数调用图构建
        3.3.2 Motif结构构建
        3.3.3 软件代码同源判定
    3.4 实验评估
        3.4.1 实验数据集
        3.4.2 源代码同源实验
        3.4.3 可执行代码同源实验
        3.4.4 混淆代码同源判定实验
        3.4.5 方法对比实验
    3.5 本章小结
第4章 基于混合语义的二进制代码同源判定方法
    4.1 引言
    4.2 方法框架描述
        4.2.1 总体框架
        4.2.2 语义结构图表征
    4.3 混合语义的同源判定算法
        4.3.1 文本语义表征
        4.3.2 结构语义表征
        4.3.3 端到端孪生网络模型
    4.4 实验评估
        4.4.1 实验数据集
        4.4.2 同源二进制代码实验
        4.4.3 不同源二进制代码实验
        4.4.4 恶意软件家族实验
        4.4.5 方法对比实验
    4.5 本章小结
第5章 基于多维相似度的移动应用同源判定方法
    5.1 引言
    5.2 方法框架描述
        5.2.1 总体框架
        5.2.2 联合策略原理
    5.3 多维相似度判定算法
        5.3.1 基于LSH头部索引相似度
        5.3.2 基于Minhash相似度
        5.3.3 基于Motif结构相似度
        5.3.4 多维度算法联合规则
    5.4 实验评估
        5.4.1 实验数据集
        5.4.2 多维度算法有效性实验
        5.4.3 多维度算法时间开销实验
        5.4.4 方法对比实验
        5.4.5 恶意软件家族及应用市场环境验证
    5.5 本章小结
第6章 软件代码同源判定原型系统
    6.1 引言
    6.2 原型系统架构
        6.2.1 需求分析
        6.2.2 系统架构选型
    6.3 原型系统功能
        6.3.1 原型系统框架
        6.3.2 基于Motif结构的同源判定模块
        6.3.3 基于混合语义的同源判定模块
        6.3.4 基于多维相似度的同源判定模块
    6.4 原型系统实现
    6.5 本章小结
第7章 总结和展望
    7.1 论文的主要工作及贡献
    7.2 下一步工作开展
参考文献
攻读学位期间取得的研究成果
致谢

(6)计及新能源的电力现货市场交易优化研究(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 研究背景及意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 新能源对电力现货市场的影响研究
        1.2.2 新能源发电功率预测研究
        1.2.3 电力现货市场电价预测研究
        1.2.4 新能源参与电力现货市场交易研究
        1.2.5 计及碳交易的电力现货市场研究
    1.3 论文主要研究内容和技术路线
        1.3.1 主要研究内容
        1.3.2 研究技术路线
        1.3.3 主要创新点
    1.4 本章小结
第2章 电力现货市场交易优化相关理论基础
    2.1 典型国家电力现货市场发展概述
        2.1.1 美国电力现货市场
        2.1.2 英国电力现货市场
        2.1.3 北欧电力现货市场
    2.2 中国电力现货市场发展概述
        2.2.1 能源电力现状分析
        2.2.2 电力现货市场现状分析
        2.2.3 建设基本原则
        2.2.4 建设关键问题
        2.2.5 未来发展方向
    2.3 电力预测理论基础
        2.3.1 经典预测方法
        2.3.2 机器学习预测方法
        2.3.3 深度学习预测方法
    2.4 系统优化理论基础
        2.4.1 模糊规划
        2.4.2 鲁棒优化
        2.4.3 随机规划模型
    2.5 SD模型及其应用
    2.6 本章小结
第3章 新能源对电力现货市场的影响分析
    3.1 新能源对电力现货市场的影响分析模型
        3.1.1 基于统计数据的影响分析
        3.1.2 基于小波变换与分形理论的特征表示
        3.1.3 基于SVM的特征因素分类
        3.1.4 基于因子分析的特征提取
        3.1.5 影响分析模型框架与流程
    3.2 新能源对现货市场电价影响的实证分析
        3.2.1 数据收集
        3.2.2 基于统计数据的影响实证分析
        3.2.3 基于全部特征的影响实证分析
        3.2.4 基于关键特征的影响实证分析
    3.3 本章小结
第4章 电力现货市场中新能源发电功率预测与电价预测
    4.1 基于CEEMD-SE-HS-KELM的新能源发电功率预测模型
        4.1.1 CEEMD-SE模型
        4.1.2 HS-KELM模型
        4.1.3 CEEMD-SE-HS-KELM
        4.1.4 实例分析
    4.2 基于相似日筛选与LSTM的现货市场电价预测模型
        4.2.1 电价影响因素初选
        4.2.2 基于RF的新能源影响量化
        4.2.3 基于改进灰色关联的相似日筛选
        4.2.4 RF-IAGIV-CEEMD-SE-LSTM模型
        4.2.5 实例分析
    4.3 本章小结
第5章 计及新能源与中长期市场影响的现货日前市场交易优化
    5.1 计及新能源与中长期市场的日前市场交易模式
    5.2 中长期合约电量分解模型
        5.2.1 目标函数
        5.2.2 约束条件
    5.3 系统不确定性分析及建模
        5.3.1 新能源出力不确定性
        5.3.2 电力现货价格不确定性
    5.4 计及新能源与中长期合约电量分解的现货日前市场出清模型
        5.4.1 目标函数与约束条件的建立
        5.4.2 多目标函数的模糊优选处理
        5.4.3 基于GA-PSO的优化模型求解算法
    5.5 实例分析
        5.5.1 算例设置
        5.5.2 中长期合约电量分解结果
        5.5.3 系统不确定性求解
        5.5.4 现货日前电力市场出清结果
        5.5.5 惩罚系数对多目标优化结果的影响
        5.5.6 新能源渗透率对多目标优化结果的影响
    5.6 本章小结
第6章 计及新能源的现货日前与日内、日内与实时市场交易优化
    6.1 现货日前、日内与实时市场的组合及及关联分析
    6.2 系统不确定性建模
        6.2.1 系统不确定性模拟
        6.2.2 拉丁超立方生成场景集
        6.2.3 基于改进谱聚类算法的场景削减策略
    6.3 计及新能源的电力现货市场两阶段交易优化模型
        6.3.1 计及新能源的日前与日内市场联合优化模型
        6.3.2 计及新能源的日内与实时市场联合优化模型
    6.4 实例分析
        6.4.1 算例设置
        6.4.2 场景集生成与削减
        6.4.3 日前与日内市场联合优化出清结果
        6.4.4 日内与实时市场联合优化出清结果
    6.5 本章小结
第7章 计及碳市场影响的电力现货市场建设路径分析
    7.1 碳排放相关政策梳理
    7.2 现行政策下碳排放压力分析
        7.2.1 碳排放预测模型
        7.2.2 碳排放预测效果检验
        7.2.3 碳排放总量及碳排放强度预测
        7.2.4 基于碳排放预测结果的政策建议
        7.2.5 碳排放市场建设必要性分析
    7.3 碳交易实施对电力现货市场的影响分析
        7.3.1 碳交易市场现状
        7.3.2 碳交易对电力现货市场的影响分析
    7.4 碳交易与电力现货市场的协同建设建议
    7.5 本章小结
第8章 研究成果与结论
参考文献
攻读博士学位期间发表的论文及其它成果
攻读博士学位期间参加的科研工作
致谢
作者简介

(7)基于非线性特征提取算法的ECG身份识别研究(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 传统ECG身份识别的难点及局限性
    1.4 论文研究内容
    1.5 论文结构安排
第2章 心电信号及ECG身份识别常用算法介绍
    2.1 心电信号概述
    2.2 心电信号的主要噪声
    2.3 特征降维方法概述
        2.3.1 PCA降维
        2.3.2 LDA降维
        2.3.3 t-SNE降维
    2.4 常用分类算法概述
        2.4.1 决策树
        2.4.2 支持向量机
        2.4.3 Boosting算法
        2.4.4 KNN算法
        2.4.5 随机森林算法
    2.5 实验数据库介绍
    2.6 本章小结
第3章 基于t-SNE算法+随机森林的ECG身份识别
    3.1 预处理算法
        3.1.1 心电信号去噪
        3.1.2 R点检测及心拍归一化
    3.2 t-SNE特征提取
        3.2.1 t-SNE算法原理
        3.2.2 t-SNE算法实流程
    3.3 分类算法
    3.4 实验过程与结果分析
        3.3.1 实验平台及参数设置
        3.3.2 实验结果分析
    3.5 本章小结
第4章 基于TriMAP算法+完全随机森林的ECG身份识别
    4.1 TriMAP算法介绍
        4.1.1 TriMAP算法原理
        4.1.2 TriMAP算法的实现步骤
        4.1.3 TriMAP算法的优势
    4.2 完全随机森林算法
    4.3 实验过程及分析
    4.4 本章小结
第5章 总结与展望
    5.1 本文工作总结
    5.2 展望
参考文献
作者简介及科研成果
致谢

(8)手写文字识别及相关问题算法研究(论文提纲范文)

摘要
Abstract
第1章 引言
    1.1 研究背景
    1.2 国内外研究现状
        1.2.1 手写识别发展现状
        1.2.2 相关问题的发展现状
    1.3 主要研究内容及创新点
    1.4 论文组织结构
第2章 基于一维卷积的联机手写汉字识别
    2.1 引言
    2.2 基于一维卷积的联机手写汉字识别算法
        2.2.1 手写轨迹预处理
        2.2.2 基于1D-CNN的手写识别架构
    2.3 实验结果
        2.3.1 数据集设置
        2.3.2 不同配置下1D-CNN的识别结果
        2.3.3 1D-CNN与RNN之间的比较
        2.3.4 各种策略的消融实验分析
        2.3.5 在公开数据集上的最终性能比较
    2.4 结论
第3章 基于注意力机制的空中手写英文单词识别
    3.1 引言
    3.2 空中手写英文单词数据集
        3.2.1 空中手写英文单词的样本采集
        3.2.2 空中手写英文单词的特点
    3.3 基于注意力机制的手写单词识别算法
        3.3.1 空中手写英文单词预处理
        3.3.2 基于注意力机制的编码-解码识别架构
    3.4 实验结果
        3.4.1 实验配置细节
        3.4.2 词典约束解码策略的性能分析
        3.4.3 注意力机制的可视化分析
        3.4.4 用户独立性实验分析
        3.4.5 识别模型的消融实验分析
        3.4.6 与其它空中手写英文单词识别工作的比较
        3.4.7 不同方法的最终识别准确率比较
        3.4.8 识别案例分析
    3.5 结论
第4章 基于时序卷积循序网络的空中手写中文文本识别
    4.1 引言
    4.2 空中手写中文文本数据集
        4.2.1 空中手写中文文本的样本采集
        4.2.2 空中手写中文文本的特点
    4.3 基于时序卷积循环网络的手写文本识别算法
        4.3.1 空中手写中文文本预处理
        4.3.2 基于时序卷积循环网络的识别架构
    4.4 实验结果
        4.4.1 实验配置细节
        4.4.2 模型的整体性能评估
        4.4.3 消融实验分析
        4.4.4 与基于神经网络的主流识别方法比较
        4.4.5 不同方法在公开数据集上的最终性能比较
        4.4.6 错误案例分析
    4.5 结论
第5章 基于生成对抗网络的手写文本生成
    5.1 引言
    5.2 基于生成对抗网络的手写文本生成算法
        5.2.1 HiGAN的框架
        5.2.2 训练损失函数
    5.3 实验结果
        5.3.1 实验配置细节
        5.3.2 手写文本生成效果
        5.3.3 模型的鲁棒性分析
        5.3.4 与现有的GAN方法比较
        5.3.5 使用GAN提升手写识别性能
    5.4 结论
第6章 基于卷积神经网络的手写汉字识别模型压缩
    6.1 引言
    6.2 基于卷积神经网络的手写汉字识别模型压缩算法
        6.2.1 相关知识介绍
        6.2.2 二维卷积神经网络的一体化压缩方法
        6.2.3 提出方法与前人工作的比较优势
    6.3 实验结果
        6.3.1 实验配置细节
        6.3.2 通道裁剪性能评估
        6.3.3 参数量化性能评估
        6.3.4 整体压缩算法性能
        6.3.5 错误案例分析
    6.4 本章小结
第7章 总结与展望
    7.1 总结
    7.2 展望
参考文献
致谢
作者简历及攻读学位期间发表的学术论文与研究成果

(9)行人重识别不变性特征学习(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究概况与发展趋势
        1.2.1 基于表征学习的方法
        1.2.2 基于度量学习的方法
        1.2.3 基于深度学习的方法
        1.2.4 行人重识别算法中其他研究内容
        1.2.5 基于视频的行人重识别算法
        1.2.6 行人重识别不变性特征学习
        1.2.7 现有方法的不足
    1.3 研究内容和研究方法
    1.4 本文的结构安排和创新点
第2章 基于人体不变性特征的行人局部学习
    2.1 引言
    2.2 研究动机
    2.3 相关工作
        2.3.1 局部区域定位方法
        2.3.2 局部区域描述方法
        2.3.3 现有方法的不足
    2.4 研究方法
        2.4.1 带约束的注意力机制模块
        2.4.2 网络训练
    2.5 实验与分析
        2.5.1 行人重识别的数据集
        2.5.2 行人重识别的评估方法
        2.5.3 实验设置
        2.5.4 与经典方法的对比
        2.5.5 消融实验
        2.5.6 超参数的影响
        2.5.7 可视化结果
        2.5.8 行人局部学习算法在其他数据集上的泛化能力
    2.6 本章小结
第3章 基于风格不变性特征的网络解耦学习
    3.1 引言
    3.2 研究动机
    3.3 相关工作
        3.3.1 纯无监督行人重识别方法
        3.3.2 无监督跨域行人重识别方法
    3.4 研究方法
        3.4.1 网络解耦学习和风格感知网络
        3.4.2 内容知识学习
        3.4.3 风格知识学习
    3.5 实验与分析
        3.5.1 数据集和评价指标
        3.5.2 实验设置
        3.5.3 与经典方法的对比
        3.5.4 消融实验
        3.5.5 超参数的影响
    3.6 本章小结
第4章 基于噪声不变性特征的流形空间学习
    4.1 引言
    4.2 研究动机
    4.3 相关工作
        4.3.1 对抗攻击
        4.3.2 对抗防御
    4.4 研究方法
        4.4.1 流形估计
        4.4.2 流形投影
    4.5 实验与分析
        4.5.1 实验设置
        4.5.2 与经典方法的对比
        4.5.3 对抗样本产生的原因
        4.5.4 动态攻击验证模型鲁棒性
        4.5.5 行人重识别任务中的对抗样本
    4.6 本章小结
第5章 总结与展望
    5.1 本文工作小结
    5.2 未来工作展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果

(10)面向大规模媒体检索的监督哈希方法研究(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 研究背景及意义
    1.2 哈希检索研究现状
    1.3 本文主要工作和创新点
        1.3.1 双深度神经网络跨模态哈希方法
        1.3.2 类别关系及语义相似保持的两步哈希方法
        1.3.3 双重过滤细粒度哈希方法
    1.4 论文内容安排
第2章 双深度神经网络跨模态哈希方法
    2.1 引言和动机
    2.2 跨模态哈希方法概述
        2.2.1 传统跨模态哈希方法
        2.2.2 深度跨模态哈希方法
    2.3 双深度神经网络跨模态哈希模型
        2.3.1 符号和问题描述
        2.3.2 方法和优化
        2.3.2.1 初始文本哈希码生成
        2.3.2.2 图像网络训练
        2.3.2.3 哈希码重构与文本网络训练
        2.3.3 样本外扩展
        2.3.4 多模态扩展
    2.4 实验和分析
        2.4.1 数据集
        2.4.2 对比方法和实验设置
        2.4.3 实验结果和讨论
        2.4.4 方法分析
        2.4.4.1 编码重构过程与文本网络的必要性
        2.4.4.2 单模态哈希方法的影响
    2.5 小结
第3章 类别关系及语义相似保持的两步哈希方法
    3.1 引言和动机
    3.2 两步哈希方法概述
    3.3 类别关系及语义相似保持的两步哈希模型
        3.3.1 符号
        3.3.2 哈希码学习
        3.3.2.1 优化算法
        3.3.2.2 收敛性分析
        3.3.3 哈希函数学习
        3.3.3.1 训练样本外扩展
        3.3.4 时间和空间复杂度分析
    3.4 实验和分析
        3.4.1 数据集
        3.4.2 对比方法和实验设置
        3.4.3 实验结果和讨论
        3.4.4 方法分析
        3.4.4.1 消融实验
        3.4.4.2 参数分析
        3.4.4.3 收敛性分析
        3.4.4.4 训练时间比较
        3.4.4.5 与深度方法比较
    3.5 小结
第4章 双重过滤细粒度哈希方法
    4.1 引言和动机
    4.2 细粒度哈希方法概述
        4.2.1 细粒度特征学习
        4.2.2 细粒度哈希
    4.3 双重过滤细粒度哈希模型
        4.3.1 框架和符号
        4.3.2 双重过滤机制
        4.3.2.1 空间过滤模块
        4.3.2.2 特征过滤模块
        4.3.3 基于代理的哈希码学习
        4.3.4 目标函数与优化
        4.3.4.1 第一步优化
        4.3.4.2 第二步优化
        4.3.5 样本外扩展
    4.4 实验和分析
        4.4.1 数据集
        4.4.2 对比方法与评价指标
        4.4.3 实现细节与实验设置
        4.4.4 实验结果和讨论
        4.4.5 方法分析
        4.4.5.1 消融实验
        4.4.5.2 收敛性分析
        4.4.5.3 测试复杂度分析
    4.5 小结
第5章 总结与展望
    5.1 总结
    5.2 展望
参考文献
致谢
攻读学位期间发表的学术论文目录
攻读学位期间参与科研项目情况
学位论文评阅及答辩情况表

四、一种大规模样本数据的特征提取方法(论文参考文献)

  • [1]基于机器视觉的目标检索方法研究[D]. 冯栋. 北京交通大学, 2021(02)
  • [2]基于深度学习的网络安全分域态势评估研究[D]. 陶晓玲. 桂林电子科技大学, 2021(02)
  • [3]胸部X射线图像中疾病识别与定位方方法研究[D]. 管庆吉. 北京交通大学, 2021(02)
  • [4]基于机器学习的程序路径可达性判定方法研究与实现[D]. 杨阳. 北京邮电大学, 2021(01)
  • [5]多形态软件代码同源判定技术研究[D]. 吴鹏. 四川大学, 2021(01)
  • [6]计及新能源的电力现货市场交易优化研究[D]. 王珂珂. 华北电力大学(北京), 2021(01)
  • [7]基于非线性特征提取算法的ECG身份识别研究[D]. 冯文轩. 吉林大学, 2021(01)
  • [8]手写文字识别及相关问题算法研究[D]. 甘吉. 中国科学院大学(中国科学院计算机科学与技术学院), 2021(01)
  • [9]行人重识别不变性特征学习[D]. 万超群. 中国科学技术大学, 2021(09)
  • [10]面向大规模媒体检索的监督哈希方法研究[D]. 陈振铎. 山东大学, 2021(11)

标签:;  ;  ;  ;  ;  

一种大规模样本数据的特征提取方法
下载Doc文档

猜你喜欢