一、利用即时功率谱进行声纹鉴定的研究(论文文献综述)
陈文强[1](2019)在《基于振动信号的智能感知技术研究》文中进行了进一步梳理本文作者认为在即将到来的智能世界里,到处都是传感器,比如嵌入到地面和墙上,以及在用户的可穿戴设备里,让世界充满了隐形的按钮。当用户改变自身状态或者进入某一特定位置便会自动触发相应的按钮。小到手表、信用卡,大到汽车、道路甚至整个城市,它们都能感知人类的行为并作出相应的举动。本文作者首先利用在地面的振动传感器搭建了一套室内定位系统,利用行人的脚步声振动来定位行人。该系统首先通过树莓派和地震检波器来采集地面振动信号,再利用巴特沃兹高通滤波器滤除背景噪声,然后通过SWIM(Speed-based adaptive Weight Increment Model)模型来区别脚步声和其他振动噪声,最后计算时间差并通过TDOA(Time Difference of Arrival)算法来定位行人。该系统还检测地面的振动,提取梅尔倒谱系数作为特征,利用Q聚类算法和随机森林算法来识别行人身份和行为活动,比如老人摔倒。另外,由于传感器的体积太小,导致缺少和用户的交互界面。本文作者提出定位人的手指在身体皮肤表面敲击的振动位置来为传感器提供交互界面。本文通过压电陶瓷片和智能手表里的加速度计和陀螺仪来采集手指敲击手背的振动信号,并提取振动信号的时域和频域的特征,依据特征相关点和特征敏感点对特征进行优化,再利用最近邻算法和人工神经网络识别不同的敲击位置。进一步,该系统利用基于密度的一类分类器对用户进行身份验证。本文对以上两个系统都搭建了硬件系统,并通过真实搭建实验环境对系统的有效性进行验证。室内定位系统平均误差7cm,手指敲击位置识别系统识别精度为96%,同时能在极低的等误率(2.4%)下,通过单次敲击对用户进行身份验证,并且系统在各种真实场景(如地铁、飞机)的干扰下展现出较强的鲁棒性。
强俊超[2](2019)在《司法语音同一性鉴定系统的设计与实现》文中研究说明随着科学进步和网络技术的不断深入发展,利用计算机及网络作为犯罪工具的各类犯罪显着增多,而其产生的电子数据已经成为当前司法鉴定研究热点问题之一。语音电子数据作为电子数据中获取最便捷的司法证据之一,在司法证据中占据了相当大的比重,这也使自动化语音鉴定技术的理论意义和实用价值越来越受到人们重视。本文以司法语音同一性鉴定系统的设计与实现为基础开展工作,通过查阅大量国内外相关文献资料,学习并深入研究了语音识别的相关理论与技术,设计了一套适合司法鉴定中使用的智能语音同一性鉴定系统。该系统主要分为说话人分割聚类和语音同一性鉴定两部分,前者是对检材语音进行预处理,后者是对处理后的目标语音进行说话人同一性鉴别,其主要工作内容如下:第一,针对司法语音材料的特点,本文采用着名的K均值聚类算法来实现说话人分割聚类,然后在此基础上提出了一种改进的球型K均值(SPK)聚类算法来提升聚类效果。实验证明,相比一般K均值聚类的做法,改进的球型K均值(SPK)聚类算法具有更好的分类效果及抗干扰性。第二,针对目前语音同一性鉴定中,说话人特征提取一般选用的都是MFCC特征,本文提出了一种新的基于源滤波器模型的特征提取方法。这种做法根据语音滤波器生成模型,首先提取表达声道特征的LPC系数;然后根据Bark子带划分,对源滤波器模型中的激励信号进行子带感知滤波;最后将LPC系数和子带滤波能量特征组合作为新的说话人识别特征,解决了特征提取中传统MFCC特征易受噪声影响的问题。然后将这种新特征引入到适用性更广泛的GMM-UBM模型进行语音同一性鉴定,实验证明在系统等错误率(EER)上比传统MFCC特征降低了30.69%。第三,结合提出的改进SPK聚类算法和源滤波器模型特征提取方法,本文构建了基于GMM-UBM模型的司法语音同一性鉴定系统。并在该系统中加入语音信号可视化模块,通过检测共振峰的方法,让使用者可以直观的观察不同说话人语音特点,以起到人工辅助鉴定的作用来确保鉴定的准确性。
董慧[3](2019)在《微信语音的提取及真实性鉴定方法研究》文中研究指明在信息获取如此便利的社会环境下,并非只有专业人员才能进行音频处理,非专业人员也可以通过多种途径来学习音频处理,如观看免费网络教程、阅读书籍等。虽然在一定程度上满足了人们日常生活中对于音频制作或修改的需要,但是也有不法分子恶意篡改音频进行非法营利或损害他人利益的活动。当今是互联网时代,网络即时通讯软件正在逐渐取代传统的通话工具,成为人们沟通交流的新方式。虽然发送文字信息在视觉上具有直观性,但是语音消息能以其简便快捷性满足人们即时、直接的交流需求。在很多网络纠纷或诈骗案件中,当事人之间会通过发送微信语音消息进行对话,因而语音消息中往往包含许多与案件事实相关的关键信息,成为侦破案件的重要证据,但是微信语音存在被篡改的可能性,在很多时候需要对其进行真实性鉴定以证其效力。基于以上背景,本文对微信语音的提取以及真实性鉴定方法进行深入研究。对微信语音进行真实性鉴定的前提是获得完整、真实有效的微信语音文件,因此从硬件和软件两个方面列举了当前手机取证中常用的工具,并介绍了手机取证过程中所必须遵守的原则和手机数据提取的步骤。以Android系统为例,通过实验对微信语音文件在手机中的存放路径进行分析。虽然微信语音文件在iOS系统与Android系统下的存储格式不相同,分别为AUD与AMR格式,但通过分析发现AUD文件是对AMR文件的变形,只是改变了文件头的内容,二者在本质上并无差别。本文主要的研究重点是微信语音的真实性鉴定方法。常见的音频篡改方式主要有复制、拼接、删除、重采样、重压缩等,但是检测音频是否被篡改并无通用的方法,面对不同的篡改手段,不同音频格式的真实性鉴定方法也各不相同。微信语音文件的存储格式为AMR,通过对语音信号的特性以及AMR的编解码原理进行分析后,着重分析了当前研究中针对AMR文件篡改的检测方法。目前的研究方法对于检测AMR语音文件是否被篡改,集中于检测AMR音频是否经过双压缩。通过对当前AMR音频双压缩检测的方法总结后发现,由于双压缩AMR音频中的低频成分较少,因此提取AMR音频信号的频谱特征参数作为特征向量,利用支持向量机或深度学习算法进行分类,检测AMR音频是否经过双压缩有一定的效果。本文主要对检测双压缩AMR所用到的频谱分析原理进行了分析,并提取频谱幅值均值作为特征向量进行验证,得到单压缩AMR音频在低频区间的频谱幅值均值要普遍高于双压缩音频,因此对频谱特征参数的分析可以作为判断AMR音频双压缩的依据。
胡健松,殷启新,陈丁文[4](2019)在《语音资料真实性(完整性)的系统鉴定研究》文中研究指明使用10名话者的12种信道录制实验语音资料,用Adobe Audition CS6进行剪辑编辑处理,用数字音频分析鉴定系统"VS-99 (4. 0)计算机语音工作站,阳宸IV-12智能语音工作站V8. 0"研究其听觉特征、属性特征、波形图谱特征和开展了频谱分析工作,表明数字音频文件的真实性(完整性)鉴定是一个系统检验工作。通过检验音频文件的听觉特征、属性、时域特性和频域特性,综合评断的结果可以明确得出"发现或未发现音频文件存在剪辑编辑的痕迹"的判断。
窦云峰[5](2018)在《基于特征映射的耳语音转换为正常语音的研究》文中研究表明耳语音是人与人之间一种特殊的语言交流方式,耳语音在发声时候,声带不会振动,激励源是噪声,致使耳语音缺少基频,并且能量一般比正常音低20dB。耳语音转换是一种研究将耳语音转换为正常音的技术,广泛使用于移动通信、医疗设备、安全监控及犯罪鉴定等领域。因此耳语音转换技术的研究拥有重要的理论意义和应用前景。本文主要研究怎样选取有利于转换的语音特征来进行耳语音转换,主要的研究内容如下:首先,提出了一种基于美尔频率倒谱系数(MFCC)特征反演的耳语音转换方法。近年来,越来越多的学者开始研究利用语音特征统计分布的特性来实现语音的转换,因此大多使用高斯模型这种概率方法来实现从源特征向量到目标特征向量的预测。但高斯模型通常适合对低维的语音特征建模,难以描述高维的原始语音特征信息,因此,在使用高斯混合模型(GMM)进行耳语音转换时,语音特征的选取尤为重要。与其它特征参数相比,MFCC模拟了人耳的听觉特性,所以本文考虑语音的稀疏性,提出L1/2算法利用MFCC特征反演来重建语音,在模型建立阶段,从平行语料中分别提取耳语音和参考正常音的每一帧语音的MFCC参数,然后通过高斯混合模型建立帧特征参数之间的联合概率分布。在转换阶段,将耳语音的帧特征参数输入模型,估计出正常音特征参数后,再利用MFCC特征参数反演方法直接重建正常音。其次,提出了一种基于低维特征映射的耳语音向正常音转换方法。由于使用自适应加权谱内插分析-合成模型进行语音谱包络的提取时,其谱包络维数过于冗余,对于后续的耳语音转换效果不佳,因此本文首先使用自编码器对语音的谱包络进行降维处理,得到耳语音和正常音的低维特征,然后使用神经网络拟合耳语音和正常音低维特征之间的函数关系以及正常音基频和耳语音低维谱包络特征之间的关系。转换时,根据耳语音低维谱包络特征获得对应正常音的低维谱包络特征和基频,然后对低维谱包络特征进行解码后获得相应的正常音谱包络,最后根据谱包络和基频重建出原始正常音。实验结果表明,相比传统的耳语音转化方法,该模型转换后语音的自然度和可懂度都有所提升。
陈维娜,李同,张肖肖[6](2017)在《长时平均功率谱在声纹鉴定中的应用研究》文中认为声纹鉴定是一项对语音的同一性问题作出判断的法庭科学技术。进行声纹鉴定的关键是尽可能多地提取有价值的语音特征。长时平均功率谱(LTAS,Long Term Average Spectrum)是语音的频谱特征之一,能够反映出一段语流中说话人的全部频率分量,以及各频率分量与强度之间的关系,是表征个人语音特性的参量之一,可采用线性预测分析技术获得。通过系统实验,找出同一人发音LTAS的稳定性,不同人发音LTAS的差异性;并讨论信道、文本、语境、时长、噪音等因素对LTAS的影响;确定LTAS的应用范围和条件,以期为声纹鉴定实践工作提供新思路。
邓剑然[7](2016)在《基于人脸和声纹组合身份验证的研究与实现》文中指出随着信息化、智能化技术得到普及,人们在生活中对信息安全和个人隐私保护越来越重视。很多场合都需要对身份进行验证,同时认证的需求也逐渐发生改变,如何提高身份验证的安全、精确以及实用等性能,已经成为验证过程中不可忽视的问题。针对这些问题,本课题主要做了以下研究:(1)分析了传统身份验证和单一生物特征身份验证中存在的缺点和局限性问题,提出基于人脸和声纹组合身份验证的解决方案。(2)研究了人脸、声纹的常用识别算法,分别实现了基于LDA的Fisherface人脸识别和基于VQ的声纹识别。其中,对人脸识别中的人脸处理阶段进行改进,采用一种改进型的人脸区域直方图均衡化方法,以减少光照不均衡带来的影响。另外在数据处理过程中采用AES算法对数据进行加密存储和传输,以防止生物特征数据被非法篡改和攻击。(3)研究了基于人脸和声纹混合身份验证方案的设计,混合验证阶段,在匹配层对多个单生物特征的逻辑输出采用基于SVM融合算法进行数据融合,经实验验证,该方法有效提高了系统整体识别效率。并提出了具有多安全级别的混合验证形式的身份验证方案,在混合验证的决策层采用与或规则进行融合验证。展现的形式为Android客户端,该客户端以传统的ID验证为入口,通过验证后可根据需求进行多种选择验证。多种验证形式包括单一的人脸身份验证或声纹身份验证,也包括组合身份验证,可以根据不同情况不同需求进行选择设定。经研究测试,基于人脸和声纹组合验证的设计方案可行有效,其优点如下:(1)验证凭借项是人脸和声纹,以两种较常见的生物特征组合验证和传统密钥验证相比,形式更加简洁方便。(2)在人脸识别的数据预处理中采用一种改进的人脸区域直方图均衡化融合方法,提高了识别的准确性。(3)在数据传输和处理中采用AES加密算法,防止数据被非法获取、攻击和篡改,提高了数据和系统的安全性。(4)提出的多安全级别混合身份验证方案,增加了身份验证的多样性、新颖性和趣味性。
郝晓雪[8](2016)在《Android平台声纹解锁系统的研究》文中研究指明移动互联网技术逐渐渗透到人们生活、工作的各个领域,而手持终端设备在人们的生活中起着越来越重要的作用。手机打电话、发短信、MP3、照相等功能早已不能满足现代人的需求,如今的移动平台产品日益更新,越来越符合消费者的需求,例如上网购物、转账、手机银行等功能,人们通过手机和外界完成各种信息的交换,因此手机安全以及手机本身的保密性愈来愈重要。本文结合当前身份认证技术、手机主流操作系统Android系统的研究热点,提出了将生物认证技术中的声纹识别技术应用于手机机主的身份认证,并针对于将声纹识别技术应用于Android系统平台所涉及的相关问题进行了分析和研究。本论文主要创新点在于:(1)手机随时随地都在使用,随时都可能进行解锁使用手机中的各种功能,由于环境的复杂多变,各种噪声都将影响是否能够准确解锁手机。针对噪声环境下研究语音增强技术,并且深入研究解锁算法。为了提高算法在手机噪声应用环境的鲁棒性,通过实验的方式,对比多种滤波器的性能,确定LMS自适应滤波器为声纹降噪算法;并且针对带噪语音问题对端点检测的方法进行改进。(2)手机解锁时,通常情况下密码不会太长,密码繁琐冗长机主容易遗忘缺少用户体检度,由于手机运算能力有局限性,在声纹识别算法上要求时间短且识别率要高,重点研究针对小语音库且与文本有关的动态时间规整(DTW)和矢量量化(VQ)分类方法,以实验数据对比声纹识别效果。(3)本文设计了一种基于Android平台的声纹锁,手机解锁时不仅需要一个人的声纹信息,还需要提供正确的语义信息的双重保障,如此,即使手机失窃,手机中的重要信息不至泄露。
张晓[9](2013)在《即时通讯语音特征研究 ——以语音同一性鉴定为基准》文中研究说明随着互联网的高速发展,其在覆盖率和传输速率等硬件方面以及基于互联网的应用等软件方面均有了显着进步。即时通讯语音软件在人们的日常生活和工作中的使用率也越来越高,以QQ、MSN、飞信等为代表的即时通讯语音软件在人们的信息交流中发挥着重要的作用。然而伴随着即时通讯语音用户数量的激增,随之而来的是越来越多的即时通讯语音材料作为证据进入到司法领域,成为诉讼过程中呈堂证供的重要依据。但是由于即时通讯语音资料中说话人的身份难以确定,以致于其证明力遭到质疑,目前在诉讼中并未充分发挥出它的价值。因此为了确定即时通讯语音资料中的说话人,有必要对其进行司法鉴定,但是如何准确地对即时通讯语音资料进行语音同一性鉴定成为一个难题。即时通讯语音不同于普通语音的特殊性在于经过网络传输的过程中即时通讯软件可能会对采集到的语音信号进行相关处理,以使输出的语音信号精简、有效。由于这个原因,决定了即时通讯语音的鉴定具有特殊性,对即时通讯语音资料的鉴定不同于一般的语音同一性鉴定。即时通讯语音具有什么特征,以及如何运用即时通讯语音的特征进行语音同一性鉴定,以前并未有专门的研究。研究即时通讯语音的特征,本论文有针对性地设计了相关的实验。选择当前流行的10款软件:飞信、ICQ、MSN、网易泡泡、QQ、Skype、UC、雅虎通、歪歪语音、阿里旺旺等,分不同的采样率进行实验。同时设计语音样本管理程序便于管理此次实验的语音样本,具备样本存储、查询、录音播放、图片显示等多项功能。本文从多个角度分析和概括不同采样率下每款即时通讯语音软件的特征,归纳出规律运用于语音同一性司法鉴定中,并详细阐述如何将此特征运用于司法实践中。语音鉴定技术在诉讼中有着广泛的应用,在法官对证据的认定方面发挥着积极的意义随着网络的日益普及,即时通讯语音软件的使用范围也将越来越广。本文总结并归纳出了即时通讯语音的特征,将此特征应用于语音同一性司法鉴定实务中,可以弥补司法鉴定领域的空白,解决之前即时通讯语音资料难以用于鉴定的困惑,增强了民事诉讼中语音资料证据的证明力,同时也为刑事诉讼中侦查机关抓捕犯罪嫌疑人提供重要的线索。本论文共分为五个章节。第一章语音鉴定概述。介绍国内外语音鉴定的发展现状。第二章语音同一性鉴定。阐述语音鉴定的理论以及鉴定方法。第三章即时通讯语音特征研究实验描述实验内容以及实验步骤,介绍语音样本数据库的设计思路与功能实现。第四章即时通讯语音特征分析。重点分析了8000Hz采样率的即时通讯语音的特征,并概括其他采样率的的语音特征。第五章研究结果在语音同一性鉴定中的应用。将归纳的即时通讯语音的特征运用到语音同一性鉴定的案例中。文章的创新点在于:(1)开发出一套语音样本管理程序,便于统一管理实验中所有的语音样本;(2)从多个角度分析实验得出的数据,归纳出即时通讯语音的特征;(3)解决司法语音鉴定中如何进行即时通讯语音鉴定的难题。
李旭飞[10](2013)在《说话人识别在身份认证中的应用研究》文中认为信息时代,信息安全成功上位,并与核技术、空间技术齐名,成为新时期三大支柱技术之一。一个国家没有信息安全,就没有政治、经济、军事等方面的安全。而网络,作为信息的主要载体,其安全是信息安全的核心。网络安全为国家的信息和通信保密安全提供保障,身份认证技术则是网络安全的第一关。生物特征认证技术提供了比传统身份认证技术更为简单便捷的方式,它避免了人们记忆许多复杂的密码和口令,也避免了USBKey等物理证件被复制、窃取。一直以来,声纹在身份认证生物特征领域比起DNA、指纹长期被冷落,是因为其识别率不高,难以将声纹特征参数与说话人一一对应起来。但随着语音识别技术的如日中天,声纹识别技术方兴未艾,为基于声纹生物特征的身份认证打破了尴尬局面,基于说话人识别的身份认证便迎来了光明前景。本文通过对说话人识别技术的系统研究,针对传统模型算法DTW因小失大的缺陷,将其对齐方式由两端扩展到三点,设计了一个特定文本说话人识别系统,并结合软硬件测试了其可用性。最后将说话人识别应用到通信身份认证中,引入可信任的第三方,提出了两种基于说话人识别的身份认证方案,通过对其性能的研究分析,新的方案是安全有效的。
二、利用即时功率谱进行声纹鉴定的研究(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、利用即时功率谱进行声纹鉴定的研究(论文提纲范文)
(1)基于振动信号的智能感知技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 室内定位 |
1.2.2 文本输入 |
1.2.3 身份识别 |
1.2.4 基于振动信号的研究 |
1.3 本文的主要研究内容 |
1.4 本文的组织结构 |
第2章 基于振动的室内定位系统 |
2.1 G-eyes室内定位系统概述 |
2.2 应用前景 |
2.2.1 老人院监护系统 |
2.2.2 家庭监控系统 |
2.2.3 智能家居系统 |
2.3 数据采集 |
2.3.1 接线设计模块 |
2.4 脚步声识别 |
2.4.1 SWIM模型的实现 |
2.4.2 SWIM模型的校正 |
2.5 室内定位 |
2.5.1 时延估计 |
2.5.2 多人定位 |
2.6 身份识别 |
2.7 行为识别 |
第3章 室内定位系统的性能评估 |
3.1 实验一:系统的灵敏性和SWIM模型性能 |
3.1.1 系统对脚步声振动信号提取的灵敏性 |
3.1.2 SWIM模型对脚步声振动信号的识别准确率 |
3.2 实验二:定位精度和PCC算法性能 |
3.2.1 系统在复杂环境下的单人定位精度 |
3.2.2 PCC算法对系统定位精度的影响 |
3.3 实验三:多人定位精度 |
3.4 实验四:身份识别精度 |
3.4.1 身份识别的精度 |
3.5 实验五:行为识别精度 |
3.5.1 行为识别的精度 |
3.6 本章小结 |
第4章 基于振动的可穿戴安全交互系统 |
4.1 基于振动的可穿戴交互系统概览 |
4.2 基于人体的敲击振动信号理论分析 |
4.2.1 人体初始振动信号分析 |
4.2.2 振动信号的人体传播模型 |
4.3 可行性实验验证 |
4.3.1 敲击信号的不同 |
4.3.2不同手指的敲击振动 |
4.3.3 不同力度的敲击振动 |
4.3.4 不同位置的敲击振动 |
4.5 敲击信号检测 |
4.5.1 振动信号采集与处理 |
4.5.2 敲击信号提取 |
4.5.3 敲击信号对齐 |
4.6 敲击振动信号特征分类 |
4.6.1 功率谱密度 |
4.6.2 加权功率谱密度 |
4.6.3 振动信号敲击定位 |
4.7 实时校准 |
4.7.1 用户干预模式 |
4.7.2 自动校准模式 |
4.8 系统实体界面 |
4.8.1 主页面 |
4.8.2 创建用户 |
4.8.3 输入模式 |
4.8.4 身份验证模式 |
第5章 交互系统的性能评估 |
5.1 基本分类精度 |
5.2 身份认证精度 |
5.3 鲁棒性 |
5.3.1 敲击力度 |
5.3.2 位移弹性 |
5.3.3 手臂旋转 |
5.4 本章小结 |
第6章 总结与展望 |
参考文献 |
致谢 |
攻读硕士学位期间的研究成果 |
(2)司法语音同一性鉴定系统的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
1.绪论 |
1.1 背景及意义 |
1.2 国内外现状 |
1.3 语音同一性鉴定的问题与挑战 |
1.4 论文主要内容与结构安排 |
2.语音同一性鉴定的关键技术 |
2.1 概述 |
2.2 预处理 |
2.2.1 采样量化 |
2.2.2 预加重 |
2.2.3 分帧加窗 |
2.2.4 端点检测 |
2.3 常用说话人特征提取 |
2.3.1 基频F0 特征 |
2.3.2 线性预测系数LPC特征 |
2.3.3 梅尔频率倒谱系数MFCC特征 |
2.4 说话人分割聚类技术 |
2.4.1 说话人分割技术 |
2.4.2 说话人聚类技术 |
2.5 说话人确认系统 |
2.6 本章小结 |
3.基于球型K均值的说话人分割方法 |
3.1 说话人分割聚类系统框架 |
3.1.1 语音活性检测 |
3.1.2 特征提取 |
3.2 司法语音鉴定数据的特征 |
3.3 K均值分割聚类算法 |
3.4 球型K均值分割聚类算法 |
3.5 改进的球型K均值分割聚类算法 |
3.6 说话人分割聚类系统实验 |
3.6.1 测试语音库 |
3.6.2 实验设置 |
3.6.3 实验结果分析 |
3.7 本章小结 |
4.基于源滤波器模型特征的说话人确认方法 |
4.1 引言 |
4.2 源滤波器模型框架 |
4.2.1 Bark子带划分 |
4.3 模型匹配 |
4.3.1 GMM-UBM模型 |
4.4 司法语音同一性鉴定实验 |
4.4.1 测试语音库 |
4.4.2 实验设置 |
4.4.3 实验评估方法 |
4.4.4 实验结果分析 |
4.5 本章小结 |
5.语音同一性鉴定系统的实现 |
5.1 语音分割聚类 |
5.2 语音同一性鉴定 |
5.3 语音信号可视化 |
5.3.1 共振峰提取 |
5.3.2 实验效果图 |
5.4 本章小结 |
6.全文总结与工作展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
(3)微信语音的提取及真实性鉴定方法研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 本论文的主要研究内容与结构安排 |
2 相关基础知识 |
2.1 语音信号分析 |
2.1.1 语音信号的特点 |
2.1.2 语音信号的分析方法 |
2.1.3 语音信号的预处理 |
2.1.4 语音信号的时域分析与频域分析 |
2.2 AMR 编解码分析 |
2.2.1 AMR概述 |
2.2.2 AMR编码原理 |
2.2.3 AMR解码原理 |
3 微信语音的提取 |
3.1 手机语音文件取证的工具 |
3.1.1 手机取证的硬件设备 |
3.1.2 手机取证的软件产品 |
3.2 微信语音的提取要求及路径 |
3.2.1 微信语音的提取要求 |
3.2.2 微信语音的提取路径及实例——以Android手机为例 |
4 微信语音篡改检测方法 |
4.1 常见音频篡改方式 |
4.2 微信语音真实性鉴定常用检测方法 |
4.3 基于频谱分析的AMR双重压缩检测方法 |
4.3.1 频谱分析的原理 |
4.3.2 实验及结果分析 |
5 总结与展望 |
致谢 |
参考文献 |
攻读学位期间的研究成果 |
(4)语音资料真实性(完整性)的系统鉴定研究(论文提纲范文)
引言 |
一、实验设计 |
(一) 发音人及实验录音内容 |
(二) 实验设备 |
1. 数字音频文件分析设备 |
2. 录音设备及方法、条件 |
(三) 剪辑编辑处理 |
1. 剪辑编辑处理方法 |
2. 有关实验语料的命名 |
(四) 实验语音材料的处理分析方法 |
1. 语音工作站直接打开分析: |
2. 模拟录音采集方式得到音频文件: |
3. 卡式录音机得到的录音文件: |
二、实验过程及其结果 |
(一) 音频文件是否经过剪辑编辑的听觉检验 |
1. 实验理论基础 |
2. 实验过程及结果分析 |
(二) 音频文件的属性检验 |
1. 数字音频文件的属性信息检验 |
2. 录音资料属性和格式研究过程及结果 |
(三) 剪辑编辑音频文件的波形研究及结果 |
1. 署名为“H1X12 (X1) .mp3的波形研究及结果 |
2. 署名为“H6X12 (X6) .m4a”的波形研究及结果 |
3. 署名为“H9X12 (X9) .aac的波形研究及结果 |
(四) 剪辑编辑痕迹检验中的频谱分析 |
1. 宽带语图分析 |
2. 窄带语图和功率谱分析 |
三、结果与讨论 |
(一) 听觉检验是一种有效而重要的主观检验方法 |
(二) 音频文件的属性或元数据分析, 可以从宏观上发现剪辑编辑的痕迹 |
(三) 波形分析是宏观检验中的一个有力手段 |
(四) 频谱分析是数字录音资料真实性 (完整性) 鉴定的重要检验方法 |
(5)基于特征映射的耳语音转换为正常语音的研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题研究的背景和意义 |
1.2 国内外耳语音转化研究的现状 |
1.3 本文主要研究内容 |
1.4 本文结构安排 |
第二章 耳语音转换的关键技术介绍 |
2.1 耳语音的特点 |
2.1.1 耳语音的发音机理 |
2.1.2 耳语音的时频特点 |
2.2 耳语音转换的关键技术 |
2.2.1 语音信号的预处理 |
2.2.2 线性预测分析 |
2.2.3 同态处理和倒谱分析 |
2.2.4 语音的分析-合成模型 |
2.3 耳语音转换的评价方法 |
2.3.1 客观评价方法 |
2.3.2 主观评价方法 |
2.4 本章小结 |
第三章 基于MFCC特征反演的耳语音转换 |
3.1 MFCC特征反演 |
3.1.1 能量谱的估计 |
3.1.2 相位谱的估计 |
3.2 耳语音转换模型 |
3.2.1 动态时间规整 |
3.2.2 高斯混合模型 |
3.2.3 基于GMM进行耳语音转换流程 |
3.3 实验仿真与结果分析 |
3.3.1 实验条件 |
3.3.2 实验结果分析 |
3.4 本章小结 |
第四章 采用低维特征映射的耳语音向正常音的转换方法 |
4.1 基于自编码的低维特征表示 |
4.1.1 语音谱包络的提取 |
4.1.2 自编码器进行降维处理 |
4.2 耳语音转换模型 |
4.2.1 耳语音转换的整体流程 |
4.2.2 耳语音和正常音低维特征映射 |
4.2.3 耳语音向正常音重建 |
4.3 实验仿真与结果分析 |
4.3.1 实验条件 |
4.3.2 参数选取 |
4.3.3 实验结果分析 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 本文总结 |
5.2 工作展望 |
参考文献 |
附图 |
The appended figures |
附表 |
Tables |
致谢 |
攻读硕士期间发表的论文 |
(6)长时平均功率谱在声纹鉴定中的应用研究(论文提纲范文)
0 引言 |
1 实验原理 |
2 实验设计 |
2.1 语音样本的录制及处理 |
2.1.1 录音对象的选择 |
2.1.2 录音条件的设置 |
2.1.3 语音样本的处理 |
2.2 长时功率谱的提取和分析 |
2.2.1 长时功率谱的提取 |
2.2.2 长时功率谱的分析 |
3 研究结果与分析 |
3.1 长时功率谱的稳定性 |
3.2 长时功率谱的特殊性 |
3.3 长时功率谱的影响因素 |
3.3.1 信道的影响 |
3.3.2 文本的影响 |
3.3.3 语境的影响 |
3.3.4 时长的影响 |
3.3.5 噪音的影响 |
4 结语 |
(7)基于人脸和声纹组合身份验证的研究与实现(论文提纲范文)
致谢 |
摘要 |
Abstract |
1 绪论 |
1.1 课题研究意义 |
1.2 课题研究现状 |
1.3 研究内容及结构安排 |
1.3.1 论文主要工作 |
1.3.2 论文结构安排 |
2 相关理论基础 |
2.1 生物特征识别 |
2.2 人脸图像 |
2.2.1 图像形成 |
2.2.2 图像增强 |
2.2.3 人脸数据 |
2.2.4 人脸特征 |
2.3 声纹信号 |
2.3.1 概念 |
2.3.2 语音信号分析 |
2.3.3 声纹特征 |
2.4 本章小结 |
3 人脸识别算法研究及实现 |
3.1 人脸检测 |
3.1.1 人脸检测方法 |
3.1.2 人脸校准 |
3.2 人脸识别 |
3.2.1 人脸识别技术 |
3.2.2 人脸识别方法 |
3.2.3 人脸识别实现 |
3.3 本章小结 |
4 声纹识别算法研究与实现 |
4.1 声纹识别技术 |
4.2 声纹识别方法 |
4.3 声纹识别实现 |
4.3.1 数据预处理 |
4.3.2 特征提取 |
4.3.3 训练模型 |
4.3.4 声纹识别 |
4.4 本章小结 |
5 人脸声纹身份验证设计与实现 |
5.1 支持向量机 |
5.1.1 统计学习理论 |
5.1.2 支持向量机 |
5.1.3 核函数 |
5.1.4 实验测试 |
5.2 多安全级别混合身份验证方案 |
5.2.1 系统流程 |
5.2.2 业务设计 |
5.2.3 结果分析 |
6 总结与展望 |
6.1 工作总结 |
6.2 工作展望 |
参考文献 |
作者简介 |
(8)Android平台声纹解锁系统的研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 论文背景和意义 |
1.1.1 论文背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 声纹识别基本知识 |
1.3.1 声纹识别分类 |
1.3.2 声纹识别系统结构 |
1.4 手机平台声纹解锁研究难点 |
1.5 研究工作及论文组织结构 |
第2章 声纹识别方案分析与设计 |
2.1 语音信号预处理及语料库 |
2.1.1 预处理 |
2.1.2 语料库 |
2.2 特征提取技术 |
2.2.1 LPCC特征参数提取 |
2.2.2 MFCC特征参数提取 |
2.2.3 实验分析及结果 |
2.3 声纹识别分类算法 |
2.3.1 动态时间规整 |
2.3.2 矢量量化]35[ |
2.3.3 实验分析及结果 |
2.4 本章小结 |
第3章 声纹解锁语音去噪技术 |
3.1 带噪语音及预处理 |
3.1.1 纯净语音和带噪语音 |
3.1.2 带噪语音的预处理 |
3.2 带噪语音降噪算法 |
3.2.1 谱减法降噪原理]41[ |
3.2.2 LMS自适应滤波器降噪]42[ |
3.2.3 维纳滤波法降噪 |
3.3 降噪算法实验及分析 |
3.4 本章小结 |
第4章 声纹解锁语音的端点检测 |
4.1 传统端点检测方法 |
4.1.1 短时能量 |
4.1.2 短时过零率 |
4.1.3 双门限法 |
4.2 带噪语音的端点检测 |
4.2.1 频带方差端点检测 |
4.2.2 改进频带方差法的端点检测 |
4.3 本章小结 |
第5章 声纹解锁系统的设计与实现 |
5.1 声纹解锁系统[47]的设计 |
5.2 声纹解锁系统的实现 |
5.2.1 安卓应用开发 |
5.2.2 声纹解锁的实现 |
结论 |
参考文献 |
攻读硕士学位期间学术成果 |
致谢 |
(9)即时通讯语音特征研究 ——以语音同一性鉴定为基准(论文提纲范文)
摘要 |
Abstract |
引言 |
第一章 语音鉴定概述 |
第一节 语音鉴定的发展历史 |
一、 国外语音鉴定的发展状况 |
二、 我国语音鉴定的发展状况 |
第二节 语音鉴定的内容 |
一、 语音同一性鉴定 |
二、 语音资料真实性鉴定 |
三、 语音内容辨识 |
四、 语音增强与降噪 |
第二章 语音同一性鉴定 |
第一节 语音同一性鉴定的理论基础 |
一、 语音同一性鉴定的基本原理 |
二、 语音的物理基础 |
三、 元音的声学特征分析 |
第二节 语音同一性鉴定的方法 |
一、 听觉鉴别法 |
二、 视觉鉴别法 |
三、 定量比对法 |
四、 动态分析法 |
五、 语音分析工具 |
第三章 即时通讯语音特征研究实验 |
第一节 即时通讯 |
第二节 即时通讯语音软件 |
第三节 实验条件 |
一、 实验环境 |
二、 硬件 |
三、 软件 |
四、 录音采集对象 |
第四节 实验语音样本的设计 |
一、 语音样本的设计 |
二、 语音样本(示范) |
第五节 实验内容及步骤 |
一、 实验内容 |
二、 标准语音样本的录制 |
三、 实验语音样本的采集 |
第六节 语音样本管理程序的设计 |
一、 语音样本管理程序功能介绍 |
二、 My SQL 数据库表的设计 |
第四章 即时通讯语音特征分析 |
第一节 采样率为 8000Hz 时即时通讯语音的特征分析 |
一、 宽带语图整体特征分析 |
二、 LPC 图谱特征分析 |
三、 频率特征分析 |
四、 带宽特征分析 |
五、 峰值特征分析 |
第二节 几种典型采样率即时通讯语音的特征分析 |
一、 6000Hz 采样率即时通讯语音的特征分析 |
二、 11025Hz 采样率即时通讯语音的特征分析 |
三、 22050Hz 采样率即时通讯语音的特征分析 |
四、 44100Hz 采样率即时通讯语音的特征分析 |
第三节 即时通讯语音特征 |
一、 宽带语图特征 |
二、 LPC 图谱特征 |
三、 频率特征 |
四、 带宽特征 |
五、 峰值特征 |
第五章 研究结果在语音同一性鉴定中的应用 |
第一节 司法鉴定模拟实验 |
一、 案情介绍 |
二、 鉴定过程 |
三、 鉴定意见 |
第二节 研究结果对语音同一性鉴定的指导意义 |
第三节 面临的问题及发展趋势 |
参考文献 |
在读期间发表的学术论文与研究成果 |
后记 |
(10)说话人识别在身份认证中的应用研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 课题相关技术 |
1.2.1 说话人识别系统结构 |
1.2.2 说话人识别特征提取 |
1.2.3 说话人识别模式匹配 |
1.2.4 说话人识别系统评价 |
1.2.5 说话人识别技术瓶颈 |
1.3 文章结构和内容 |
1.4 本文创新点 |
第二章 语音信号特征分析 |
2.1 语音信号的产生模型 |
2.1.1 激励模型 |
2.1.2 声道模型 |
2.1.3 辐射模型 |
2.1.4 数学模型 |
2.2 语音信号的数字化 |
2.2.1 预滤波 |
2.2.2 采样 |
2.2.3 量化 |
2.3 语音信号的预处理 |
2.3.1 预加重 |
2.3.2 分帧 |
2.3.3 加窗 |
2.4 语音信号的时域分析 |
2.4.1 短时能量分析 |
2.4.2 短时平均过零率 |
2.4.3 短时自相关函数 |
2.4.4 短时平均幅度差函数 |
2.4.5 端点检测 |
2.5 语音信号的频域分析 |
2.5.1 频谱 |
2.5.2 功率谱 |
2.6 语音信号的倒谱分析 |
2.6.1 同态信号处理的基本原理 |
2.6.2 复倒谱和倒谱 |
2.6.3 美尔频率倒谱系数(MFCC) |
2.7 语音信号的线性预测分析 |
2.7.1 线性预测分析的基本原理 |
2.7.2 线性预测倒谱系数(LPCC) |
2.8 本章小结 |
第三章 说话人识别模式研究 |
3.1 应用DTW的说话人识别模式 |
3.2 应用VQ的说话人识别模式 |
3.3 应用HMM的说话人识别模式 |
3.4 应用GMM的说话人识别模式 |
3.5 应用ANN的说话人识别模式 |
3.6 基于说话人识别的DTW算法研究 |
3.7 本章小结 |
第四章 基于三齐DTW的说话人识别设计 |
4.1 语声采集及预处理 |
4.2 特征提取和训练 |
4.3 模式匹配与判决 |
4.4 硬件平台 |
4.5 软件平台 |
4.6 本章小结 |
第五章 基于说话人识别的身份认证方案 |
5.1 方案建立的理论依据 |
5.2 对称会话密钥身份认证方案 |
5.2.1 身份认证方案的建立 |
5.2.2 身份认证方案安全性分析 |
5.3 非对称会话密钥身份认证方案 |
5.3.1 身份认证方案的建立 |
5.3.2 身份认证方案安全性分析 |
5.4 身份认证方案的网络拓展 |
5.5 两种身份认证方案比较 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 课题总结 |
6.2 课题展望 |
致谢 |
参考文献 |
研究成果 |
四、利用即时功率谱进行声纹鉴定的研究(论文参考文献)
- [1]基于振动信号的智能感知技术研究[D]. 陈文强. 深圳大学, 2019(09)
- [2]司法语音同一性鉴定系统的设计与实现[D]. 强俊超. 东华理工大学, 2019(01)
- [3]微信语音的提取及真实性鉴定方法研究[D]. 董慧. 甘肃政法学院, 2019(01)
- [4]语音资料真实性(完整性)的系统鉴定研究[J]. 胡健松,殷启新,陈丁文. 云南警官学院学报, 2019(01)
- [5]基于特征映射的耳语音转换为正常语音的研究[D]. 窦云峰. 安徽大学, 2018(08)
- [6]长时平均功率谱在声纹鉴定中的应用研究[J]. 陈维娜,李同,张肖肖. 中国人民公安大学学报(自然科学版), 2017(02)
- [7]基于人脸和声纹组合身份验证的研究与实现[D]. 邓剑然. 中国计量大学, 2016(04)
- [8]Android平台声纹解锁系统的研究[D]. 郝晓雪. 哈尔滨理工大学, 2016(03)
- [9]即时通讯语音特征研究 ——以语音同一性鉴定为基准[D]. 张晓. 华东政法大学, 2013(02)
- [10]说话人识别在身份认证中的应用研究[D]. 李旭飞. 西安电子科技大学, 2013(01)