基于 SGNN 的纳税申报欺诈检测

基于 SGNN 的纳税申报欺诈检测

一、基于SGNN的报税欺诈检测(论文文献综述)

孙维远[1](2021)在《基于预训练模型的海关商品异常申报检测研究》文中认为随着经济全球化的发展,我国海关进出口商品总量逐年增加,对进出口商品征税成为海关的一项繁重的任务。我国海关目前对商品税号的审核主要采用人工方式,关员根据商品的文本信息对税号进行判断,但人工核查费时费力且存在标准不一致等问题。因此,如何快速准确地对大量申报数据进行异常申报检测成为如今海关急需解决的问题。为了能快速准确检测海关进出口商品的异常申报,本文使用自然语言处理中的预训练模型,得到包含海关语义信息的商品文本嵌入表示,利用嵌入表示得到海关文本的同义要素表,在同义要素表的帮助下,改进过采样算法实现异常申报检测算法,最后为验证上述算法,设计并实现了海关进出口商品异常申报检测系统。本文主要工作如下:第一,使用传统预训练模型得到海关商品的嵌入表示不包含语义信息,为了得到包含海关专有知识的同义要素表,本文对SBERT(Sentence-BERT)进行改进后,通过在海关进出口商品文本语料上微调,得到具有海关语义信息且能进行相似度比较的要素嵌入表示。该嵌入表示一方面可将同一类要素通过聚类操作得到该类要素对应的同义要素表,通过该表可在异常检测前对申报数据进行数据增强以提高分类效果;另一方面可以将构成申报商品的要素嵌入表示求平均后送入分类算法中,作为商品的向量化表示。第二,海关数据中异常申报占比较小,海关商品异常检测问题属于类别不平衡的二分类问题。经典的SMOTE过采样算法由于没有考虑样本分布,导致合成样本的包含的有效信息较少,本文对SMOTE算法进行改进,提出了I-SMOTE(Improved Synthetic Minority Oversampling Technique)算法。I-SMOTE算法在合成样本时通过考虑样本分布,使合成点更符合原数据分布,包含更多有效信息。选取四个UCI不平衡数据集,选用三种经典单分类器算法对SMOTE算法和I-SMOTE算法进行对比实验,实验结果证明I-SMOTE算法较SMOTE算法可更有效的提升分类算法模型的分类能力。对于海关真实的申报数据,分别用随机森林、XGboost和Light GBM三种集成学习分类器对SMOTE算法、I-SMOTE算法、使用同义要素表进行数据增强+I-SMOTE算法三种方法进行实验,实验结果证明使用同义要素表对申报数据进行数据增强可以提升异常检测效果。第三,为了使异常检测技术服务于海关,解决人工进行申报商品异常检测耗时耗力的问题,本文设计并实现了海关进出口商品异常申报检测原型系统,该系统可对指定税号的申报数据进行异常检测分析,辅助关员快速高效的进行异常检测。

韩殿威[2](2021)在《保险欺诈检测与系统优化设计(二)》文中指出人寿保险推荐系统人寿保险是一种投资。随着中国金融市场的不断完善,以及国民收入的提高,购买寿险、股票、债券、国债、商品房等,成为很多人投资的新选择。一般来说,人寿保险费一般分为三类:意外事故保险费、疾病死亡保险费和增值保险费。人寿保险是一种非常复杂的金融产品,面对纷繁多样的保险产品,以及冗长难懂的理赔条款,准确地选出适合自己的人寿保险产品,并不是一件轻松的事。

张凯[3](2020)在《基于兰州银行客户关系管理的大数据分析平台构建研究》文中认为在云计算、大数据、人工智能技术、区块链技术、互联网金融快速发展的环境下,商业银行传统营销的不足日益突显。营销决策,尤其是客户关系管理依赖于经验而不是数据,信息不对称、广撒网的粗放模式使得营销成本很高。风险防范方面,伴随着客户范围的不断扩大、传统以人工干预、现场检查为核心的风险防范和应对模型,从成本和反应速度上来说都无法适应新格局的需求。商业银行的数据挖掘技术是一种全新的信息处理手段,其关键技术是对海量数据进行批量加工、转换和模型化处理,从中筛选出有价值的数据。一方面,可以通过客户数据分析中客户的行为偏好、财务状况、资产结构、收入结构等,实现客户分层和客户视图创建,有效实施客户资源细分和客户精准营销;另一方面,通过整合银行内外部数据以构造更完整的客户画像,从而进行更为精准的风险管理,实现客户异常信息的自动抓取、监测和预警。本文将立足于兰州银行现阶段客户关系管理方面的发展现状及存在的问题,充分运用大数据资源,制定出符合兰州银行实际情况的客户关系管理体系。本文基于大数据、客户关系价值理论和客户关系营销理论,将大数据技术运用到客户关系管理中,构建以客户标签体系为基础,以机器学习模型为支撑的客户关系管理系统。依托该系统从真正意义上实现差异化的精准营销和智能化的风险信息预警,为兰州银行提升盈利能力,拓展业务结构,提高风险管控水平,增强核心竞争力提供保障。

唐颂[4](2020)在《H公司跨境支付业务竞争战略研究》文中研究指明近年来凭借全球跨境电商行业的快速发展以及国内一系列支持性政策出台,带来商户对于跨境支付服务更大的需求,H公司跨境支付业务和收入也获得了非常良好的发展。但由于跨境支付业务起步较晚,和行业领先企业相比,交易规模较小,品牌影响力较弱。本文将据此对H公司跨境支付业务竞争战略进行研究,结合目前的外部竞争环境,通过制定有效的竞争战略,充分利用企业内部资源和能力,最大限度地利用机会来创造竞争优势,实现竞争优势持续更新,以适应外部环境快速而连续变化。本文以H公司跨境支付业务为研究对象,结合动态竞争战略理论基础和分析模型,对其内外部环境分析,识别出目前产生竞争优势的核心资源和能力。通过对比行业内主要竞争对手,对H公司跨境支付业务的竞争现状进行分析,得出目前竞争战略存在的问题。通过对其竞争战略进行研究后指出,H公司跨境支付业务目前的集中成本领先战略已经不适合当前的外部竞争环境,需要向整合竞争战略进行转化,发挥差异化竞争优势的同时降低成本,并且不断开发国际市场。结合竞争战略的选择,确定出企业内部资源和能力对应的发展策略,并对竞争战略的实施提出具体建议,从业务市场、业务模式、科技创新、运营建设、成本结构、营销传播六个方面进行竞争战略的实施,以此实现竞争战略转化的目标。本文对H公司跨境支付业务竞争战略进行研究,通过对内部资源和能力进行识别与开发,研究制定有效竞争战略以持续创造竞争优势,对H公司战略调整、组织变革等具有实际可操作性的指导意义。同时,整个分析过程和结论可以为同类企业提供参考和借鉴。本文图20幅,表24个,参考文献49篇。

郑一明[5](2020)在《大数据视角下基于文本挖掘的电商问答系统持续使用意向研究》文中认为随着互联网技术的不断发展和完善,越来越多的人在购物时将京东、淘宝等电商平台作为自己的首要选择。但是,由于电商产品质量的参差不齐,存在的信息不对称问题严重阻碍了双方信任的建立,商家提供的商品信息逐渐失去了用户的信任,这在很大程度上也阻碍了电商的持续健康发展。针对电商平台存在的信息不对称和信任问题,主要的一种解决方法是在线评论,虽然其在降低信息不对称上起到了不可小觑的作用,但评论数量激增、商家不正当干扰等行为所造成的在线评论信息超载与失真问题也同样不容忽视。鉴于此,电商平台推出了问答系统。与评论相比,通过问答系统得到商品信息的可信度要更高、所耗费的时间和精力更少。然而,由于电商问答系统的发展时间较短,如何最大化地利用问答系统增加用户的满意度、保持用户的持续使用意向是平台和学者目前较为关注的重要问题。针对以上问题,本文在大数据视角下开展基于文本挖掘的电商问答系统持续使用意向研究。首先,采用文本挖掘技术从问答系统的文本中提取信息内容特征,以京东自营笔记本电脑数据为数据集,结合长短期神经网络(LSTM)和K-means算法,得到问答系统为消费者提供的信息服务类别;其次,对相同商品的在线评论进行文本挖掘,对比两者挖掘结果后分析并提炼出问答系统信息内容的属性,即影响电商问答系统用户持续使用意向的关键因素;最后,以ECM-IT作为基础模型,根据文本挖掘提取的影响因素,结合用户在选择和使用电商问答系统时的具体情境构建电商问答系统持续使用意向模型,进行模型和假设检验。将文本挖掘技术与结构方程模型相结合,综合应用电商文本数据和问卷调查数据,科学有效的探究消费者持续使用电商问答系统的影响因素和作用机制。本研究共得到3点结论:(1)电商问答系统为消费者提供的信息服务主要有五类:商品对比、赠品、质量、功能和售后服务,其中消费者提问最多的内容是质量,最少的是售后服务;(2)问答系统和在线评论不仅是信息互补的关系,且问答系统为在线评论的信息提供了验证。通过进一步地分析,得到电商问答系统信息内容的属性,即用户持续使用意向的三个影响因素:感知内容有用性、感知内容可靠性和认知成本;(3)感知内容可靠性对于问答系统的持续使用意向是没有显着影响的,但是通过满意度的中介效应对于持续使用意向的影响是显着的。在所有影响电商问答系统持续使用意向的因素中,影响程度最大的是感知内容有用性,其次是信任,而认知成本对于电商问答系统的持续使用意向产生了消极影响。本文创新性地通过文本挖掘的方式提取电商问答系统持续使用意向的影响因素,且改进了ECM-IT模型,使其更适合用于本文的研究。本研究有利于商家明确用户真正的需求,有助于平台改进完善问答系统,帮助消费者确认疑惑的信息进而快速做出购买的决策等。

张月[6](2019)在《基于数据挖掘的商业医疗保险疑似欺诈识别研究》文中提出国内医疗保险欺诈问题十分严峻,但由于全国各大医疗机构的医疗数据不能全面共享,导致医疗保险欺诈以及欺诈识别的研究较少。本文借助咨询公司和保险公司所掌握的医疗数据库,运用数据挖掘方法对商业医疗保险的相关利益者——投保人和医疗机构的疑似欺诈行为进行识别,并分别建立针对投保人和医疗机构的疑似欺诈识别模型,可应用于实际商业医疗保险欺诈识别,并为社会医疗保险欺诈识别研究提供参考,达到减少医疗资源浪费的目的。对打算实行欺诈的投保人来说,在就医和索赔过程中会出现疑似欺诈行为,因此会产生特有的规律性和独特性行为,本文通过构建Logit回归分析模型寻找出哪些特征因子与是否欺诈高度相关。将高度相关的特征因子变成Back-Propagation反向传播网络模型的输入变量,通过模型的运行结果判断投保人是否存在疑似欺诈的嫌疑。对打算实施欺诈的医疗机构来说,实现欺诈的形式多为和患者(投保人或被保险人)合谋。医疗机构的欺诈可以有多种,这主要是因为医疗过程的复杂性,医疗机构(医生)可以在诊断作假、开药作假、故意延长住院时长、同意不同患者使用同一人的相关信息进行索赔、或者将一个医疗处理过程拆成多个处理过程以增加索赔金额等等,故因医疗机构欺诈行为较投保人欺诈更为多样化和多变化,也因本文篇幅有限,本文选择识别医疗机构是否在费用清单上作假行为以检验该医疗机构是否存在与投保人合谋欺诈的嫌疑,以此为例对医疗机构合谋欺诈形式模型的识别研究提供一种思路。因此,为了针对医疗机构此类型的欺诈,本文根据医疗保险索赔金额和支出满足Benford定律这样的思路,建立了K-Means聚类模型来识别这种模式的欺诈。最后,针对投保人和医疗机构的疑似欺诈识别模型经过实际数据检验和验证,完全可以用其识别欺诈行为,并且提出我国应完善医疗保险的立法体系,建立和完善医疗保险欺诈识别的关键指标,医疗数据实现逐步共享,开发和推广医疗保险欺诈智能识别技术以及加强保险公司与医疗机构的合作机制,强化对医疗行为和医疗费用的监管等实际建议。

朱凯敏[7](2018)在《JS银行“税E融”产品管理优化研究》文中研究表明小微企业对国民经济的发展具有重要作用。长期以来,“融资难、融资贵”的问题一直制约着小微企业的健康发展。商业银行传统的小微信贷产品又存在成本高、风险大等问题。2015年,银税互动政策的出台为商业银行创新小微信贷产品,开拓小微信贷市场提供了新动能。JS银行作为中小银行,结合自身服务小微的战略,积极落实银税互动政策,率先开发了纳税信用贷款产品“税E融”,开拓小微信贷市场。“税E融”产品的核心特征,一是纳税信用与金融授信挂钩;二是无抵押信用贷款。相比传统的小微信贷产品,“税E融”借助银税合作,JS银行可以充分利用税务部门提供的小微企业纳税信用信息,打破信息壁垒,实现自动授信,降低业务风险,提高贷款决策的有效性和科学性。本文采用综合分析法、实地调查法、比较分析法等研究方法,以交易成本理论和信息不对称理论来阐述商业银行开发小微信贷市场的难点,使用市场细分理论、客户生命周期理论,PEST分析法、波特五力模型等工具,分析了 JS银行在银税合作持续深化、金融科技日益成熟的情况下,开发“税E融”进军小微信贷市场的必要性和可行性。以江苏省C市近三年的市场数据为数据样本,将“税E融”与其他银行的同类产品进行比较研究,分析“税E融”在发展过程中取得的成果与产品管理中面临的问题,结合管理学的相关理论,对“税E融”存在问题的原因进行分析研究,并给出优化措施及建议,以期为JS银行优化“税E融”提供有益参考,同时也为其他商业银行开展纳税信用贷款业务,政府完善纳税信用管理建设提供有益启示。

吴靖华[8](2016)在《基于大数据的中小企业动态竞争力提升研究》文中研究说明在我国,中小企业大部分由创办人经营,由于缺乏资源,需要长期依赖企业家的创新精神来促进业务增长。尽管如此,中小企业在我国经济发展中起着非常重要的作用,不同的资源导致中小企业有着不同的表现,因此,有必要让中小企业通过识别和利用创新的机会,提出计划目标和组织长期的策略。同时,通过与外部环境相配合来实现战略竞争力,从而获得高于平均水平的回报。创新战略精神可以促使中小企业管理和识别可持续的竞争优势,从而推动中小企业发现新商机和加强管理与协调资源。在我国经济发展中,中小企业起主导作用,占99.5%以上,是国民经济和社会发展的重要基础。中小企业的迅速发展已成为我国市场经济的重要成员,带动社会生产力的发展。因此,越来越多的中小企业通过“瓶颈资产”来建立竞争优势,以创造、组合、转移、积累和保护无形资产。从核心竞争力中演化而来的资源基础理论强调企业的竞争优势在于宝贵的有形和无形资源,由于资源具有异质性,因此能够将短期的竞争优势转化为持续的竞争优势。大部分的中小企业家善于辨别机会,信息来源是他们决策的关键,而快速反应和分析能力能够给中小企业带来持续的竞争优势,因此也是值得关注的核心竞争力。这种核心能力被称为动态能力或动态竞争力。动态能力是一个很难确定企业特质的潜在因素,最初被定义为“企业发挥整合能力,创建和重构内部和外部资源,形成竞争力,以应对变化多端的环境。”企业通过改变资源和例程的能力来承认面临着的动态变化的市场环境,并对一些企业之所以能有更好的生存机会做出解释。动态能力强调学习,通过“信息”获取有关资料,并瞄准与之匹配的内部资源配置环境,诱发公司对资源进行调整配置,导致内部优势和短板通过识别来应对外部所带来的机会和挑战。“变化”是下一个合乎逻辑的过程步骤,包括创造潜在反应的刺激,从信息处理步骤产生的“评估”和“选择”替代方案。最后,“保留”已实现的资源配置。通过对动态能力和吸收能力相互作用,导致作战能力提升,从而提高企业的竞争优势,建成”基于知识的动态能力模型”。企业不仅要从市场环境中发现新知识,也要对内部反应做出反馈,利用应用结果和重新配置的重点来组织学习。吸收能力和动态能力之间的链接是相辅相成的,通过动态能力和学习,有助于更好地理解知识。动态能力的作用是把各种概念集合或汇总,而吸收能力则是通过与学习相结合,具体有:“采集”识别和获取外部知识,“同化”整合知识;“变换”外部新知识与已有的知识相结合,和“开发”外部知识来实现组织目标的应变能力。这四个维度是必然的探索、同化的过程,通过转化和利用式学习,有助于提高经营业绩,创建竞争优势,利用其创新性和战略灵活性,以适应变化和提升竞争力。成功的吸收能力是持续竞争优势的动态能力,实时分析则是信息管理中的重要工具,同时可以解决微弱信号理论中的信息不对称问题。实时(或低延时)大数据分析可以改变游戏规则,由于客户和市场是稍纵即逝的,因此在出现或消失之前,中小企业有机会通过微弱信号来识别和采取行动。基于服务位置大数据有着庞大的商业潜力,该数据的优点是可实时访问关键数据源,并找出业务指标。实时数据的匹配决定了创造性的思维和预测分析,使业务流程产生改变,实现对企业利益相关者进行预测和优化。这些新的理念,可以帮助中小企业设想整套方案,并推出具体的措施。因此,在不同的决策情况下,评估潜在于各项业务活动中。另外,企业高管特别重视大数据技术在中小企业制定竞争战略时所起到的重要作用,及其决策特异性的发挥。如今,大数据彻底改变了中小企业的业务模型,提出了新见解和客户互动方式,通过分析竞争对手的信息从而提高盈利能力,实现策略改变和实时交付。不同来源的数据,经过勘探,体现价值。新信息技术能够在几秒钟内访问和分析海量数据,并从中提取高价值的信息来推动业务变革。因此大数据的超高效益,确实会改变中小企业与大型企业之间的游戏规则。大数据的关键功能是数据挖掘,模型发现和评估,描述变量“相关性”,对其定义提出四个重点:第一是大小,和数据集体积有关;第二是复杂性,与结构、行为和排列有关;第三是技术,与工具和科技有关;第四是处理巨大和复杂的数据收集。大数据的特点是规模性、多样性、高速性和价值密度。动态竞争力和大数据系统之间的关系是信号理论中的微弱信号,主要描述市场行为,当双方(个人或组织)有机会获得不同信息时,在一般情况下,发送者一方必须知道如何沟通。对方接收到信息后,必须选择如何解释信号。因此,信号理论不断被向前推进,现在已经被广泛应用到企业组织学当中。学者通过信号传递理论,以新方式来开发、解决复杂的配方,以了解细致入微的变化。动态能力通过整合公司资源,构建和重新配置内部能力与外部竞争以应对迅速变化的环境。经过整合公司流程,将资源重新配置,获取和释放相匹配后,以适应市场变化。动态能力是导向能力,帮助中小企业重新部署和配置资源,以满足不断变化的客户需求和应对竞争对手的策略。动态能力是一个集体经验,通过系统组织生成并修改其操作,以追求高效益,经协调整合,重新配置,改造学习等方式,让公司创造出新的产品和工艺,达到修改或创建核心竞争力的效果。实证研究发现,动态能力对战略变革和企业绩效的影响不同。大数据是中小企业信息管理的关键组成部分,与中小型企业的动态能力具有外在共性。根据大数据维度(容量,品种,速度,真实性和价值),提出了动态能力维度符合竞争力的概念。所以,对大数据技术,中小企业,竞争力和动态能力之间的协同关系进行研究,是本文研究的选题目的。基于文献综述和对我国中小企业使用大数据的调查,提出五个动态能力:微弱信号;商业环境传感;业务调整;资源能力转化和资源编排(营销和技术能力/实时分析,学习能力/可视化,协调和整合能力,对环境竞争战略反应)。本文的研究方法使用混合研究方法。第一部分,对国内外二十家中小企业公司进行访问研究,了解他们在业务上对数据的要求,特别是对大数据的期望。这二十家中小企业分布在五个城市,日本东京、欧洲、巴西、香港和新加坡,采用深化非结构化面试的方式来进行访问。第二部分,通过群集分析进行定性内容分析,并对主题重点伸张。然后,制作调查问卷,通过电子调查方法,对约2000份样本进行抽样调查,最终收回电子调查表有600多份。第三部分,利用调查问卷的实证结果来建立中小企业的大数据动态竞争力模型。通过个案访谈,产生三个创新观点。第一是“通过动态能力促使中小企业快速转型和重新配置资源”;第二是“通过大数据手段来提炼微弱信号以强化动态竞争力”;第三是“通过实时大数据以提升中小企业的动态决策能力”。信息技术(大数据)压倒性地解决了原始数据的管理技术,能够把握关键和改造行业,提高了大数据的效益与企业绩效。通过对相关行业的辅助数据进行分析,定义了大数据的吸收能力,通过学习贯彻落实信息技术的相关能力。中小企业的吸收能力并不是简单地聚合公司和行业资源,而是含有其它附加能力,通过整合后最终才能产生效应。吸收能力把内部和外部的信息汇总后变成知识,从而提高适应能力(含动态能力)。本文通过实证研究,最终产生四个解决方案。第一个对策是“建立以中小企业为主导的大数据共享平台“;第二个对策是“建立以中小企为中心的大数据隐私系统”;第三个对策是“建立基于云技术的中小企业营运大数据系统”;第四个对策是“提升中小企业的大数据实时分析能力”。

赵岭峰[9](2016)在《基于SVM的税务稽查选案自动识别方法研究》文中进行了进一步梳理支持向量机是20世纪90年代中期发展起来的机器学习技术,在众多分类算法中,支持向量机因其出色的学习能力,成为机器学习界的研究热点。着重于介绍支持向量机,先把采集来的企业申报数据随机分为训练样本和测试样本,然后通过台湾大学林智仁(Lin Chih-Jen)副教授开发设计的支持向量机工具LIBSVM,用训练样本获得SVM模型,并用这个SVM模型预测测试样本企业是否有问题,通过已知结果得到模型预测的准确率。实验结果说明该方法是一种有效的方法,完全可以作为税务稽查选案的参考。

赵岭峰[10](2015)在《基于贝叶斯方法的税收风险指标分析》文中研究说明税收风险指标是风险识别的灵魂,如何设置指标的阈值,提高风险指标的指向性,以及如何知道风险指标的识别精准度,以往税务机关一般依据历史经验做出推算,得出来的结果,往往不太靠谱。通过深入研究贝叶斯方法,建立指标分析模型,并结合现实数据作了实证分析。实证结果表明,贝叶斯指标分析模型具有很高的现实应用价值。

二、基于SGNN的报税欺诈检测(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、基于SGNN的报税欺诈检测(论文提纲范文)

(1)基于预训练模型的海关商品异常申报检测研究(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 研究背景和意义
    1.2 国内外研究现状
        1.2.1 海关信息化建设
        1.2.2 异常检测
    1.3 论文主要研究内容
    1.4 论文组织结构
2 相关技术研究
    2.1 单分类器
        2.1.1 支持向量机
        2.1.2 逻辑回归算法
        2.1.3 K近邻算法
    2.2 集成学习
        2.2.1 随机森林
        2.2.2 XGBoost
        2.2.3 LightGBM
3 基于预训练模型的海关同义要素表的构建
    3.1 BERT预训练模型
    3.2 基于SBERT的要素嵌入表示
        3.2.1 SBERT
        3.2.2 基于SBERT的要素嵌入表示
        3.2.3 实验与分析
    3.3 同义要素表的构建过程
        3.3.1 申报商品信息介绍
        3.3.2 通过聚类操作构建同义要素表
    3.4 本章小结
4 基于I-SMOTE算法的海关商品异常申报检测
    4.1 类别不平衡的分类问题
    4.2 I-SMOTE算法
        4.2.1 噪点的处理
        4.2.2 少数类样本的选择
        4.2.3 插值系数的确定
    4.3 I-SMOTE算法仿真实验
        4.3.1 不平衡数据分类评价标准
        4.3.2 I-SMOTE算法实验及分析
    4.4 海关异常申报检测实验及分析
    4.5 本章小结
5 异常商品申报检测系统的设计与实现
    5.1 需求分析
    5.2 功能分析
    5.3 系统设计
        5.3.1 系统总体架构设计
        5.3.2 界面设计
        5.3.3 功能模块总体设计
        5.3.4 功能模块详细设计
    5.4 系统开发与测试
        5.4.1 开发环境与开发工具
        5.4.2 文件上传功能测试
        5.4.3 异常申报检测功能测试
        5.4.4 人工辅助功能测试
    5.5 本章小结
6 总结与展望
    6.1 总结
    6.2 展望
参考文献
攻读硕士学位期间发表学术论文情况
致谢

(2)保险欺诈检测与系统优化设计(二)(论文提纲范文)

人寿保险推荐系统
    1.术语与定义
    2.推荐系统框架
    3.推荐系统

(3)基于兰州银行客户关系管理的大数据分析平台构建研究(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 研究背景及研究意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究综述
        1.2.1 国外研究现状
        1.2.2 国内研究现状
        1.2.3 国内外研究现状评述
    1.3 研究内容与研究方法
        1.3.1 研究内容
        1.3.2 研究方法
第2章 客户关系管理及大数据相关理论
    2.1 客户关系管理相关理论
        2.1.1 客户关系营销理论
        2.1.2 客户关系价值理论
    2.2 大数据相关理论
        2.2.1 数据仓库3NF理论
        2.2.2 神经网络挖掘理论
        2.2.3 数据库营销理论
第3章 兰州银行客户关系管理现状与问题分析
    3.1 兰州银行简介与客户关系管理现状
        3.1.1 兰州银行简介
        3.1.2 兰州银行客户关系管理现状
    3.2 兰州银行客户关系管理存在的问题及问题产生的原因分析
        3.2.1 兰州银行客户关系管理存在的问题
        3.2.2 兰州银行客户关系管理问题原因分析
第4章 基于大数据分析平台的兰州银行客户关系管理系统设计与实施
    4.1 行内外数据融合
        4.1.1 数据采集
        4.1.2 数据存储
        4.1.3 数据计算
    4.2 客户标签体系建设
        4.2.1 基础标签
        4.2.2 模型标签
    4.3 客户关系深度挖掘
        4.3.1 客户关系模型
        4.3.2 客户特征模型
    4.4 客户营销价值评估与风险管控
        4.4.1 基于决策树的客户营销评价模型
        4.4.2 基于SVM的客户风险评估模型
    4.5 客户关系管理系统的具体应用
        4.5.1 产品推荐
        4.5.2 营销渠道选择
        4.5.3 风控信息推送
        4.5.4 关系客户营销
第5章 基于大数据分析平台的兰州银行客户关系管理改善策略
    5.1 统一客户数据平台的构建
        5.1.1 建立统一客户数据平台
        5.1.2 建立统一的数据管理标准
    5.2 客户分类分群及差别化管理
        5.2.1 基于客户标签的客户分群
        5.2.2 群体客户特征分析
    5.3 考核评价机制
        5.3.1 细化客户经理考核评价机制
        5.3.2 完善支撑部门绩效考核
    5.4 专业型人才队伍的培养
        5.4.1 加强信息管理与客户关系管理复合型人才队伍的建设
        5.4.2 强化客户经理职能
结论
参考文献
致谢

(4)H公司跨境支付业务竞争战略研究(论文提纲范文)

致谢
摘要
ABSTRACT
1 绪论
    1.1 研究背景与研究问题
        1.1.1 研究背景
        1.1.2 研究问题
    1.2 研究意义
        1.2.1 理论意义
        1.2.2 实践意义
    1.3 研究内容与研究方法
        1.3.1 研究内容
        1.3.2 研究方法
2 文献综述与理论基础
    2.1 国内外研究文献综述
        2.1.1 关于业务战略研究
        2.1.2 关于跨境支付商业模式创新
        2.1.3 关于跨境支付监管要求和建议
        2.1.4 关于跨境支付技术创新
        2.1.5 研究综述
    2.2 理论基础
        2.2.1 基本竞争战略理论
        2.2.2 蓝海战略理论
        2.2.3 动态竞争战略理论及管理模型
    2.3 本章小结
3 H公司跨境支付业务内外部环境分析
    3.1 宏观环境分析
        3.1.1 政治法律环境
        3.1.2 社会经济环境
        3.1.3 社会文化环境
        3.1.4 科学技术环境
    3.2 行业环境分析
        3.2.1 第三方跨境支付概述
        3.2.2 行业发展现状
        3.2.3 行业生命周期分析
        3.2.4 行业发展趋势
    3.3 内部微观环境分析
        3.3.1 基本情况概述
        3.3.2 业务模式分析
        3.3.3 运营数据分析
        3.3.4 内部资源和能力识别
    3.4 本章小结
4 H公司跨境支付业务竞争战略选择
    4.1 H公司跨境支付业务SWOT分析
        4.1.1 优势分析
        4.1.2 劣势分析
        4.1.3 机会分析
        4.1.4 威胁分析
        4.1.5 SWOT分析
    4.2 竞争战略制定
        4.2.1 现有竞争战略分析
        4.2.2 跨境支付业务竞争战略选择
        4.2.3 内部资源和能力开发
    4.3 本章小结
5 H公司跨境支付业务竞争战略实施
    5.1 竞争战略实施
        5.1.1 拓展业务市场
        5.1.2 创新业务模式
        5.1.3 加强科技创新
        5.1.4 强化运营建设
        5.1.5 优化成本结构
        5.1.6 提升营销传播
    5.2 竞争战略实施将会遇到的挑战分析
        5.2.1 竞争战略实施将会遇到的挑战
        5.2.2 竞争战略动态调整
    5.3 竞争战略实施保障措施
        5.3.1 组织架构保障
        5.3.2 规章制度保障
        5.3.3 信息安全保障
        5.3.4 人力资源保障
    5.4 本章小结
6 结论与展望
    6.1 研究结论
    6.2 研究展望
参考文献
作者简历
学位论文数据集

(5)大数据视角下基于文本挖掘的电商问答系统持续使用意向研究(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 电商平台问答系统的研究现状
        1.2.2 在线评论与文本挖掘研究现状
        1.2.3 信息系统用户持续使用研究现状
    1.3 主要研究内容与创新点
        1.3.1 研究内容
        1.3.2 创新点
    1.4 研究思路与组织架构
第2章 相关理论与技术研究
    2.1 信息系统持续使用模型
    2.2 电商问答数据获取方法
    2.3 文本预处理
    2.4 文本分类相关技术
    2.5 文本聚类技术
    2.6 本章小结
第3章 基于文本挖掘的电商问答系统信息内容特征提取
    3.1 问题描述
    3.2 实验数据集
        3.2.1 爬取对象分析
        3.2.2 数据抓取具体流程
    3.3 数据预处理
    3.4 基于SVM和LSTM的用户提问内容分类
    3.5 基于改进的K-means算法的用户提问内容聚类
    3.6 实验结果与分析
        3.6.1 描述性统计
        3.6.2 实验结果
    3.7 本章小结
第4章 基于信息内容特征对比的问答系统持续使用意向影响因素分析
    4.1 问题描述
    4.2 实验设计
        4.2.1 实验数据集与实验环境
        4.2.2 消费者在线评论聚类
    4.3 实验结果与对比分析
    4.4 本章小结
第5章 基于ECM-IT的电商问答系统持续使用意向研究
    5.1 问题描述
    5.2 理论模型的构建
        5.2.1 电商问答系统持续使用意向模型
        5.2.2 研究变量及定义
    5.3 研究假设
    5.4 问卷设计与数据收集
        5.4.1 问卷设计
        5.4.2 研究变量的测量问项
        5.4.3 问卷的发放与回收
    5.5 实证分析
        5.5.1 描述性统计分析
        5.5.2 探索性因子分析
        5.5.3 信度分析
        5.5.4 效度分析
        5.5.5 问答系统持续使用意向模型验证与假设检验
    5.6 实证结果与讨论
第6章 结论与展望
    6.1 主要结论
    6.2 研究展望
参考文献
附录1 调查问卷
附录2 攻读硕士学位期间参与的项目和发表的论文
致谢

(6)基于数据挖掘的商业医疗保险疑似欺诈识别研究(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 研究背景
    1.2 研究目标
    1.3 研究意义
    1.4 研究思路
    1.5 研究对象
    1.6 研究综述
        1.6.1 国外研究综述
        1.6.2 国内研究综述
        1.6.3 研究述评
    1.7 研究创新
    1.8 技术路线
第2章 核心概念界定与理论基础
    2.1 核心概念界定
        2.1.1 医疗保障体系及社会医疗保险
        2.1.2 商业医疗保险
        2.1.3 商业医疗保险欺诈
        2.1.4 数据挖掘
    2.2 理论基础
        2.2.1 信息不对称理论
        2.2.2 Benford定律
第3章 数据与模型方法
    3.1 数据
        3.1.1 数据来源
        3.1.2 全部样本选择
    3.2 模型方法
        3.2.1 投保人疑似欺诈识别模型:嵌入LOGIT回归分析的B-P反向传播网络模型
        3.2.2 医疗机构疑似欺诈识别模型:K-MEANS聚类模型
第4章 投保人疑似欺诈识别模型—嵌入LOGIT回归分析的BACK-PROPAGATION反向传播网络模型
    4.1 嵌入LOGIT回归分析的BACK-PROPAGATION反向传播网络模型的样本选择
    4.2 投保人疑似欺诈识别模型数据分析
    4.3 投保人疑似欺诈识别因子分析
        4.3.1 LOGIT模型构建
        4.3.2 变量设置
        4.3.3 欺诈识别因子的精炼
        4.3.4 模型显着性水平
    4.4 BACK-PROPAGATION反向传播网络模型
        4.4.1 模型网络结构的参数设定
        4.4.2 投保人疑似欺诈识别模型的建模过程
        4.4.3 模型的实证分析
第5章 医疗机构疑似欺诈识别的K-MEANS聚类模型——基于BENFORD定律分析
    5.1 基于BENFORD定律建立K-MEANS聚类模型的样本选择
    5.2 医疗机构疑似欺诈识别模型的建立
        5.2.1 疑似欺诈识别模型建模思路及数据设值
        5.2.2 医疗机构疑似欺诈识别模型的建模过程
    5.3 疑似欺诈识别模型结果
第6章 结论与讨论
    6.1 研究结果
    6.2 对社会医疗保险的启示及建议
        6.2.1 完善医疗保险的立法体系
        6.2.2 建立和完善医疗保险欺诈识别的关键指标
        6.2.3 医疗数据逐步共享,开发和推广医疗保险欺诈智能识别技术
        6.2.4 加强保险公司与医疗机构的合作机制,强化对医疗行为和医疗费用的监管
    6.3 讨论
        6.3.1 研究中的不足
        6.3.2 对后续研究的展望
参考文献
攻读硕士学位期间取得的研究成果
致谢

(7)JS银行“税E融”产品管理优化研究(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 研究背景
    1.2 研究意义
    1.3 国内外研究现状
        1.3.1 国外研究现状
        1.3.2 国内研究现状
    1.4 研究内容和方法
        1.4.1 研究内容
        1.4.2 研究方法
    1.5 创新之处
第2章 相关概念界定和理论基础
    2.1 相关概念界定
        2.1.1 纳税信用管理
        2.1.2 纳税信用等级评定
        2.1.3 银税互动
        2.1.4 纳税信用贷款
    2.2 理论基础
        2.2.1 交易成本理论
        2.2.2 信息不对称理论
        2.2.3 市场细分理论
        2.2.4 客户生命周期管理理论
第3章 JS银行“税E融”产品介绍和发展现状
    3.1 JS银行发展概况
    3.2 JS银行开发“税E融”的PEST分析
        3.2.1 政治环境因素分析
        3.2.2 经济环境因素分析
        3.2.3 社会环境因素分析
        3.2.4 技术环境因素分析
    3.3 JS银行“税E融”发展现状
        3.3.1 “税E融”产品介绍
        3.3.2 “税E融”发展情况
        3.3.3 “税E融”产品优势
第4章 “税E融”产品管理存在的问题及成因分析
    4.1 “税E融”产品管理存在的问题
        4.1.1 “税E融”产品定价管理不合理
        4.1.2 “税E融”贷款不良率偏高
        4.1.3 “税E融”市场竞争力下降
        4.1.4 数据信息的获取与整合仍然存在壁垒
    4.2 “税E融”产品管理存在问题的成因分析
        4.2.1 产品定价管理能力不足
        4.2.2 产品风险控制管理不完善
        4.2.3 商业银行间的同质化竞争
        4.2.4 信息壁垒的进一步消除存在诸多障碍
第5章 “税E融”产品管理优化措施
    5.1 完善信用数据管理实现“税E融”的差别化定价
        5.1.1 构建数据治行的顶层管理理念
        5.1.2 加强信用数据应用能力提高贷款利率的差别化定价水平
        5.1.3 强化人才管理打造复合型员工队伍
    5.2 加强运营管理提高“税E融”的市场竞争力
        5.2.1 对外实施跨行协作管理扩大市场半径
        5.2.2 对内加强产品整合管理降低运营成本
        5.2.3 充分利用优惠政策控制信贷成本
    5.3 强化政府政策应用完善“税E融”贷后管理
        5.3.1 加快建立风险补偿制度
        5.3.2 健全银税联合惩戒机制做好不良贷款的催收
    5.4 完善客户管理增加客户粘性
        5.4.1 专注小微企业加强客户培育
        5.4.2 实施信贷承诺完善差异化营销管理
第6章 研究结论与展望
    6.1 研究结论
    6.2 展望
附录A
参考文献
致谢
在读期间发表的学术论文及研究成果

(8)基于大数据的中小企业动态竞争力提升研究(论文提纲范文)

摘要
Abstract
缩写
词汇表
1 绪论
    1.1 研究背景与选题原因
        1.1.1 研究背景
        1.1.2 选题原因
    1.2 选题目的和意义
        1.2.1 大数据给中小企业带来新机遇
        1.2.2 大数据的崛起
        1.2.3 中国制造2025中大数据对中小企业的影响
        1.2.4 基于大数据的中小企业动态竞争力
        1.2.5 选题目的
    1.3 研究构想和方法
    1.4 论文的三个创新点
        1.4.1 通过动态能力令中小企业高速转型和资源重新配置
        1.4.2 通过大数据手段来提炼微弱信号去强化动态竞争力
        1.4.3 通过实时大数据提升中小企业动态决策能力
    1.5 理论关系
        1.5.1 大数据、动态竞争力和微弱信号之间的关系
        1.5.2 我国中小企业与动态竞争力的关系
2 相关理论与文献综述
    2.1 竞争力相关理论
    2.2 企业战略精神与竞争力理论
        2.2.1 中小企业战略精神
        2.2.2 竞争值架构
    2.3 动态竞争力理论
        2.3.1 特质
        2.3.2 历史背景
        2.3.3 吸收能力
        2.3.4 动态竞争力框架
    2.4 大数据文献综述
        2.4.1 定义
        2.4.2 技术
        2.4.3 应用汇总
        2.4.4 保安隐私
        2.4.5 共享架构
        2.4.6 创造价值
        2.4.7 决策能力
    2.5 微弱信号理论(中小企业动态竞争力与大数据是主关系)
        2.5.1 微弱信号与动态竞争力的关系
        2.5.2 动态竞争力、大数据和微弱信号的关系
3 大数据对中小企业运营的挑战
    3.1 国内大数据运营调研
    3.2 中小企业大数据运营状态
    3.3 大数据给中小企业带来的挑战和机遇
    3.4 中小企业在使用大数据时面临的问题
        3.4.1 中小企业能够共享大数据
        3.4.2 如何保障在大数据中的隐私
        3.4.3 可以快速建立中小企业大数据系统
        3.4.4 中小企业如何建立使用大数据实时分析
4 要解决的研究问题
    4.1 大数据给中小企业的挑战
    4.2 动态竞争力对于静态竞争力优势和指标框架
    4.3 微弱信号如何通过大数据影响中小企业动态竞争力
    4.4 动态竞争力如何影响中小企业的业务表现
    4.5 如何解决第三章发现的四个问题
5 研究模型建立和假设
    5.1 研究模型的构想思路
    5.2 关键变量依据
    5.3 关键变量的定义
    5.4 研究模型
    5.5 研究假说
6 个案研究
    6.1 研究方法
        6.1.1 本体论和认识论
        6.1.2 混合研究方法
        6.1.3 定性非结构化访问
        6.1.4 定性访问内容分析
        6.1.5 问卷研究
    6.2 选择受访公司的条件
    6.3 受访者介绍
    6.4 个案研究提纲问题(含伦理考虑)
    6.5 从访谈个案建立创新点和对策
        6.5.1 三个创新点的建立
        6.5.2 四个对策的建立
    6.6 访问个案内容分析
        6.6.1 内容分析编码方案
        6.6.2 编码聚类分析
        6.6.3 国家地域区别
        6.6.4 聚类分析汇总
    6.7 个案研究重给修正实证模型
    6.8 个案研究结论意见
    6.9 建立调查问卷初稿
7 定量检测与实证分析
    7.1 测量变量
        7.1.1 独立控制变量
        7.1.2 因变量
        7.1.3 变量分类
    7.2 研究模型
    7.3 小样本预检测
    7.4 定立调查问卷
    7.5 电子问卷
        7.5.1 问卷发放
        7.5.2 回收可信度控制
    7.6 选取分析工具SPSS
    7.7 丢失的数据
    7.8 描述性统计
        7.8.1 独立控制参数
        7.8.2 问卷核心变量
    7.9 相关系数
    7.10 可靠性(一致性)
    7.11 因素分析
    7.12 调节变量假说测试
        7.12.1 “H1:微弱信号和杂音水平决定商业环境传感程度”(是)
        7.12.2 “H2:商业环境传感以单边正面影响业务调整结果,定位大数据作为调节变量”(是)
        7.12.3 “H3:业务调整以单边正面影响资源和能力转化幅度,定位大数据作为调节变量”(是)
        7.12.4 “H4:资源和能力转化以单边正面影响资源编排幅度,定位大数据作为调节变量”(是)
        7.12.5 “H5:资源编排以单边正面影响营销和技术能力,定位大数据作为调节变量”(是)
        7.12.6 “H6:资源编排以单边正面影响学习能力,定位大数据作为调节变量”(是)
        7.12.7 “H7:资源编排以单边正面影响协调和整合能力,定位大数据作为调节变量”(是)
        7.12.8 “H8:资源编排以单边正面影响对环境的竞争战略反应,定位大数据作为调节变量”(是)
    7.13 模型讨论与问题分析
    7.14 问卷结论意见
8 提升中小企业动态竞争力的对策
    8.1 对策框架
    8.2 建立以中小企业为主导的大数据共享平台(第一个对策)
    8.3 建立以中小企为中心的大数据隐私系统(第二个对策)
    8.4 建立基于云技术的中小企业营运大数据系统(第三个对策)
    8.5 提升中小企业大数据实时分析能力(第四个对策)
9 结论及展望
    9.1 研究结论
    9.2 学术价值
    9.3 实践意义
    9.4 局限性
    9.5 展望与后续研究
参考文献
附录一 访问个案内容编码分析(第一部分)
附录二 访问个案内容编码分析(第二部分)
附录三 访问个案内容编码分析(第三部分)
附录四 个案访谈内容
附录五 调查问卷初稿
附录六 描述性统计
附录七 中文问卷(以广州、上海、北京为调查对象)
附录八 英文问卷(以香港,新加坡和欧洲为调查对象)
附录九 葡萄牙文问卷(以巴西为调查对象)
附录十 日文问卷(以东京为调查对象)
致谢

(9)基于SVM的税务稽查选案自动识别方法研究(论文提纲范文)

1 SVM简介
2 实验分析
    2.1 实验目的
    2.2 样本来源
    2.3 实验涉及的工具说明
    2.4 详细实验步骤
        2.4.1 产生符合软件要求的数据文件
        2.4.2 对数据文件进行缩放
        2.4.3 获得SVM模型
        2.4.4 验证模型预测的准确率
    2.5 实验分析
3 结语

(10)基于贝叶斯方法的税收风险指标分析(论文提纲范文)

0 引言
1 贝叶斯方法原理
2 建立基于贝叶斯指标分析模型
3 模型实证分析
    3. 1 样本来源以及分析工具
    3. 2 实证分析涉及的指标说明
        3. 2. 1 税负率
        3. 2. 2 主营业务利润率
        3. 2. 3 费用率
    3. 3 单步计算贝叶斯后验概率
    3. 4 实证分析
    3. 5 风险指标优化
4 结语

四、基于SGNN的报税欺诈检测(论文参考文献)

  • [1]基于预训练模型的海关商品异常申报检测研究[D]. 孙维远. 大连理工大学, 2021(01)
  • [2]保险欺诈检测与系统优化设计(二)[J]. 韩殿威. 金融电子化, 2021(03)
  • [3]基于兰州银行客户关系管理的大数据分析平台构建研究[D]. 张凯. 兰州理工大学, 2020(03)
  • [4]H公司跨境支付业务竞争战略研究[D]. 唐颂. 北京交通大学, 2020(04)
  • [5]大数据视角下基于文本挖掘的电商问答系统持续使用意向研究[D]. 郑一明. 浙江工商大学, 2020(05)
  • [6]基于数据挖掘的商业医疗保险疑似欺诈识别研究[D]. 张月. 首都经济贸易大学, 2019(07)
  • [7]JS银行“税E融”产品管理优化研究[D]. 朱凯敏. 南京师范大学, 2018(04)
  • [8]基于大数据的中小企业动态竞争力提升研究[D]. 吴靖华. 江西财经大学, 2016(02)
  • [9]基于SVM的税务稽查选案自动识别方法研究[J]. 赵岭峰. 江苏理工学院学报, 2016(02)
  • [10]基于贝叶斯方法的税收风险指标分析[J]. 赵岭峰. 江苏理工学院学报, 2015(06)

标签:;  ;  ;  ;  ;  

基于 SGNN 的纳税申报欺诈检测
下载Doc文档

猜你喜欢