一、关联规则挖掘在证券业中的应用(论文文献综述)
韩新新[1](2019)在《基于K-medoids改进的变色龙(Chameleon)聚类算法》文中指出随着现代科技的高速发展,大数据成为了近几年社会发展的焦点。聚类问题是数据挖掘领域的重要研究课题,聚类分析可以发现数据集的特征,也可以帮助数据挖掘算法进行数据预处理,因此,提高聚类算法的聚类性能成为一项研究热点。层次聚类算法是解决大数据集聚类问题的常用方法,Chameleon算法是一种较为常见的多阶段的凝聚层次聚类算法,算法结构简单,能够处理大型数据集,依据簇间的相似性动态地构建模型。论文在传统Chameleon算法的基础上进行改进,并进行实证分析,验证改进算法的实用性。论文首先研究了Chameleon聚类算法的基本原理和算法结构,发现了Chameleon算法中存在的异常数据无法正确处理的问题,给出了Chameleon算法的改进方法,运用K-medoids算法对Chameleon算法中第一阶段的K-最近邻图进行子簇划分,对数据集内的异常点进行正确的子簇归类,在保证子簇高内聚性的同时降低了异常点的影响,给第二阶段的局部动态模型的构建提供更为精确的子簇,进而得到更加精确的聚类分析结果。其次研究了基于K-medoids算法改进的Chameleon算法的实际应用效果,利用从2018年某证券公司649名证券客户的交易信息数据中提取的6个特征值对改进的Chameleon算法进行实证分析,并与多种Chameleon的改进算法进行对比分析,进一步验证了基于K-medoids算法改进的Chameleon算法的实用性和有效性。
曾兴[2](2018)在《基于关联规则挖掘的学生成绩分析研究》文中研究表明人们常常说我们生活中信息时代。但是,实际上我们生活的时代是数据时代。在我们的日常生活中,我们的生活行为使得每天都产生大量的数据。现在,我们生活中的数据呈现出爆炸的增长趋势,海量的数据以及数据的可用性,让我们产生了需求。我们需求种一种手段,来帮助我们从这些数据中发掘有意义的信息。在这种背景下,数据挖掘技术应运而生。20世纪末期,“科教兴国”政策被提出以来,我国的教育行业发展迅速,各类学校数量越来越多,办学的规模越来越大,学生人数逐步增长,教学的质量也跟随时代在进步。但是,传统的教学管理方式,并不能适应现在社会的要求,我们需要应用科学技术来促使教学进步。现在,数据挖掘已经成功获得了各行各业的关注,特别是在金融、销售的等领域其应用尤为普遍。在教育领域,每天也会产生大量的数据,如学生的学习数据、生活数据等。目前,对于这些数据的利用还相对较少,如果我们能通过数据挖掘,从这些数据中中挖掘出对学生有用的信息,来对学生进行指引与预警,这不仅对学生的学习与生活有益,也能促进学校的传统教学方式走向科学化的进程。本论文首先概述数据挖掘的基本知识,接着论述了关联规则的一些重要定义以及它的挖掘的流程,并从算法步骤和算法的优缺点两方面重点分析了几个经典的关联规则算法,然后提出了一种算法的改进方案。最后使用改进算法设计并实现了一个学生成绩分析应用系统。该应用通过使用改进算法对经过的预处理成绩数据进行挖掘,在得出关联规则后利用成绩数据的筛选无效的规则。生成的这些规则能够用来指导学生学习,帮助学生明确自己的学习任务,了解以后学习的方向;他们也能够为学校管理人员了解目前学校的现状,为后阶段制定计划提供参考,帮助学校的管理走向科学化。
刘华[3](2017)在《关联规则技术在智能配电网中的研究与应用》文中研究说明随着网络、信息技术的迅速发展以及数据库管理系统的广泛应用,各行各业积累的数据量越来越庞大,数据结构日益复杂。数据挖掘是信息技术发展进化的结果,它就是数据库的大量数据中提取隐含的、未知的并有潜在价值的信息和知识的过程。而关联规则是数据挖掘里的一个重要分支,并被广泛应用于市场营销、电信、银行等应用领域。本文将关联规则技术引入到配电网中,对配电网数据平台中的电力负荷数据与其影响因素数据之间的关系进行数据挖掘。首先,针对于配电网中负荷数据以及影响负荷特性的经济因素、天气因素的数据进行整合,并构建以电力负荷分析为主题的数据仓库;其次,为了将不同类型的数据转换成适合挖掘的形式,本文运用聚类技术对连续的原始数据进行离散化处理;最后,采用关联规则中的Apriori算法对主题数据进行频繁项集的搜索和强关联规则的生成,通过该方法找出电力负荷与相关影响因素的关系。此外,本文分析关联规则技术中的传统的Apriori算法的不足,并对传统的Apriori算法进行改进,通过java编程实现了算法。对比实验证明了这种改进形式可以缩短运行时间、减少候选二项集,并通过该算法对配网负荷数据与经济数据以及天气数据进行关联规则挖掘,对挖掘结果进行分析结果,验证了该算法高效性和可行性。
郭锋利[4](2014)在《数据挖掘技术在证券投资领域的应用研究》文中进行了进一步梳理数据挖掘(Data mining)是从大量的、模糊的、不完整的、有噪声的、随机数据中提取人们先前不知道的、但又是潜在有用的规则和知识的过程。数据生成和收集技术的进步促使商业和科研领域产生了海量数据集,人们都渴望掌握隐藏在大量的数据背后有价值的信息,通过深入分析数据,使他们能充分发挥作用。数据挖掘技术的不断发展,很好地解决了这一问题,在数据技术的发展中发挥重大的作用。本文利用数据挖掘技术,从证券行业海量的数据中挖掘其背后隐藏的价格变化规律,主要的研究内容如下:首先,采用数据挖掘中的关联规则技术对股票交易数据进行分析,根据交易数据的特点提出相应的数据挖掘模型,进行以Apriori算法为基础的关联规则的挖掘。对数据进行预处理,构造分析指标,利用Apriori算法挖掘各上市公司股票价格间的相互关联,通过对结果的分析表明:在股票的交易数据中使用关联规则算法对股票分析是有效可行的。为投资者的投资组合提供有意义的参考。接着,以时间序列分析原理为基础,针对股票数据的特点,选取ARIMA模型来对股票交易的历史数据进行分析预测,得出股票在历史时间段中的变化规律,并预测未来的价格走势,将时间序列的方法成功的应用到股票的预测中并取得了一定的效果,分析股票价格图表,为投资者提供理论依据,挖掘适当的投资时间。
贺宝成[5](2014)在《中国上市公司大股东利益输送路径与治理研究》文中研究说明2013年11月,党的十八届三中全会明确提出,推进国家治理体系和治理能力现代化,奏响了国家治理体系建设的最强音。相比于国家治理中的众多问题,大股东利益输送似乎是一只微小的蝴蝶,但绝非为一只普通的蝴蝶,而是一只能够产生蝴蝶效应的蝴蝶,治理不善,将引发整个资本市场的动荡与危机。学者们的研究结果证实,控股股东猖撅的隧道挖掘是导致1997年亚洲金融危机爆发的主要原因;微观的公司治理风险累积是2008年全球金融“海啸”的重要诱因;近年来我国股市的持续低迷,进行隧道挖掘和掏空的大股东难辞其咎。尽管大股东利益输送引起了学界的广泛关注,但其泛滥的现实仍可折射出理论研究的缺陷和不足。纵观已有研究,主要集中在利益输送危害效应、形成原因、治理改善等方面,鲜有从利益输送路径视角开展。探明大股东利益输送路径及形成机理,对打开利益输送“黑箱”,解开“利益输送之谜”,改进和提高治理效率和质量无疑具有重要意义。本文以利益输送治理为主题,以利益输送路径为主线,重点研究了利益输送路径形成动因机理、关联规则和基于利益输送路径的治理模式,创新性工作主要有:(1)揭示了利益输送发生和演化机理。引入委托代理链概念,集成股东会、董事会和经理层三个维度创建大股东控制权配置概念模型。通过对16种控制权配置模式下利益输送可能性研究,归纳得出利益输送对控制权配置具有显着的“状态依存”属性结论,实现了对其内在发生机理的深入剖析;构建大股东利益输送演化博弈仿真模型,通过对五种模式下的演化稳定策略(ESS)的演绎和仿真分析,推理得出外部自发演进无法实现利益输送治理“帕累托”最优的结论,拓展了利益输送外部演化过程研究的理论视角和框架体系。(2)证实了利益输送路径关联模式的存在。运用Apriori算法等数据挖掘技术,基于沪深两市20年间上市公司2367次违规事件数据的关联规则挖掘,发现:利益输送路径偏好模式上,“转移损益”为主,其余依次为“占用资产”、“违规担保”和“复合路径”,隐蔽性越强的路径越为大股东所偏好;输送路径发掘上存在“二八定律”:利益输送路径以高于80%的概率伴随着违规披露的发生,但从实际违规披露事件中却只有20%左右的较低概率被发现;输送路径选择时序上存在较强的“惯性”和“路径依赖”特征,治理的关键在于监控时点前移;利益输送路径防范的重点是“违规信息披露”。这些新发现为基于利益输送路径的治理研究提供了重要的实证支撑。(3)验证了股权结构、外部治理环境与利益输送路径的关联关系。基于2005-2010年沪深两市6个会计年度1088组样本数据,采用Logistic模型,从股权集中度、制衡度等七个维度系统检验了其与损益转移、占用资产和违规担保三种路径的统计依赖关系。发现:终极产权性质仅对占用资产有显着影响;股权制衡度对三种路径不具有显着影响;股权集中度与损益转移存在“U型”曲线关系;两权分离度与违规担保存在“倒U型”曲线关系;法制环境对三种路径有显着地负向影响,政府质量、要素市场环境对损益转移无显着影响。这些结论丰富和拓展了利益输送路径的实证研究。(4)提出了基于路径,集理念创新、路径创新和制度创新“三位一体”的利益输送治理新模式。主要为,以理念创新为先导,强化系统治理、数据治理及文化治理,推进科学治理;以路径创新为支撑,健全利益输送路径内部控制体系、完善资本市场体系、充分发挥媒体监督功能,优化内外部治理路径,强化大数据等新技术应用,促进协同治理;以制度创新为保障,完善利益输送治理立法、建立健全治理制度体系和规范体系,实现长效治理。
张见[6](2014)在《组合模式挖掘及其在超市数据分析中的应用研究》文中研究表明关联规则挖掘描述了数据项和数据项之间的有趣联系,挖掘出来的规则可以指导用户进行决策。传统对于关联规则的研究主要集中在频繁项集的挖掘算法和对挖掘出来的规则进行优化剪枝两个方面,但是挖掘出来的关联规则普遍存在的问题是:规则数量庞大、冗余规则多、系统运行速度慢效率低、规则难以被用户理解和实施决策。因此,当面对这些庞大的规则集时,我们通常要做的工作就是分析衡量每一条规则,以确定哪些是对用户有参考价值的,这样的工作无疑是低效和枯燥的。如何高效的挖掘出有用的规则是当前数据挖掘研究的热点。基于这个问题,在本文的研究中,我们介绍了组合模式的概念,通过属性之间、规则之间的相互组合,并对组合后的规则进行评价,最后提取出有用的和可以支持用户决策的知识。本文首先介绍了数据挖掘和关联规则的基本概念,并对关联规则的典型算法进行了相关的描述和分析。在关联规则的度量方面,首先阐述了传统的“支持度-置信度”体系并分析其优劣,然后针对传统算法产生的庞大规则集问题,我们引入兴趣度的概念,通过兴趣度来组合规则,产生规则对和规则簇,并给出了相应的原理和算法步骤。最后,将本文的理论研究成果应用到现实超市数据集中,通过对超市数据的提取、清洗和整理,并运用专业的数据挖掘工具AlphaMiner进行挖掘结果的展示,通过对结果的分析,得出可以用于决策的知识,从而表明该方法的科学性和有效性。
叶翔[7](2012)在《基于时间序列的关联规则数据挖掘在证券中的应用》文中研究指明股票的趋势研究一直是股民关心的问题,研究的方法有很多。本文使用了数据挖掘的一个重要分支,关联规则方法来挖掘股票间的联动关系,统计3只股票带时序上涨的情况在过去的某个时间段中出现的次数。如果出现次数多,也就是支持度和置信度都较大,那么当“股票A第Ta天上涨且股票B第Tb天也上涨”的情况出现时,可以考虑在Tc天买入第三只股票。这里的Ta,Tb和Tc可取任意值。得出的规则可以用来辅助股票投资。本文的主要研究内容包括以下几个方面:(1)对国内关于股票方面的关联规则挖掘的相关文献进行分析和总结,对股票挖掘过程进行了深入探讨,对挖掘过程中的数据预处理、算法、关联规则兴趣度这三个方面已有的一些改进方法进行了概括和评价。(2)针对人们希望看到的“股票A在Ta当天上涨且股票B在Tb当天上涨,则股票C在Tc当天上涨,支持度是X%,置信度是Y%”这样的规则(Ta<Tb<Tc),提出了两种关联规则挖掘算法:算法一是基于时间窗口的关联规则挖掘算法,在股票时间序列上定义一个时间窗口,在时间窗口内循环查找2项集和3项集,通过时间窗口的移动寻找全部的2项集和3项集;算法二是bit-search算法,引入了比特串的概念,用比特串来表示连续的时间序列上股票的上涨信息。而比特串便于移位操作和逻辑运算,可较大的简化股票间的运算;也减少了需要的内存空间。根据结果的串的支持度计数是否满足最小支持度计数阈值,就能得到所需要的频繁2项集和3项集。(3)介绍了股票关联规则挖掘流程的设计以及对股票数据的预处理过程,进而将bit-search算法运用到股票数据挖掘中,并生成股票间联动规则。
吴艳[8](2012)在《基于知识发现的战略性新兴产业识别与布局研究》文中认为金融危机和欧洲债务危机的出现严重影响了我国低端出口制造业,通过发展战略性新兴产业升级我国产业结构、拉动内需的战略需求迫在眉睫。因地制宜的进行产业的识别可以避免各地产业选择的雷同、资源投入的重复;层次分明的产业布局可以通过资金、科技、人才资源要素的整合提高资源利用效率、科技创新力。采用知识发现的数据挖掘能力,可以识别出潜在的、新兴的产业,亦可对战略性新兴产业进行客观的布局指导。因此,采用知识发现进行产业的识别与布局对战略性新兴产业的发展有着重要作用。论文分析了以金融危机、“十二五”规划为主的选题背景,探讨了选题的理论及现实研究意义,针对研究的主要内容给出了论文的技术路线图。论文还对战略性新兴产业基础理论和知识发现相关理论进行了整理、归纳,这对后文的指标选择和模型确定有着一定的指导性。论文以知识发现为视角研究战略性新兴产业的核心内容为:识别与布局。在战略性新兴产业识别方面,设计了基于相关产业差异特征和技术-经济范式背景下的指标体系,采用关联规则技术建立了战略性新兴产业多维数量关联规则模型;产业布局方面,首先根据技术-经济范式背景下的产业集群演变,推导出了战略性新兴产业由产业聚类到产业集群发展的重要性,然后通过对聚类技术方法的辨析,选择系统聚类-Q聚类方法建立了聚类布局模型。知识发现模型建立完毕后,本文以长三角洲地区制造业为例,搜集指标数据,对战略性新兴产业的识别与布局作了实证分析。文末,针对我国战略性新兴产业发展所遇到的问题,提出了微观至宏观层面的政策建议。论文以知识发现为创新视角,为区域的战略性新兴产业选择和布局提供了科学的技术方法,以期达到指导区域科学地、因地制宜地选择和培育新兴产业,避免走入区域产业结构雷同、资源浪费的误区。
许兴军[9](2012)在《数据挖掘技术在证券市场分析中的应用研究》文中研究指明本论文的研究方向为计算机的应用,旨在将自动化技术和系统理论等知识应用到与实际生活相关的各种复杂系统中,如金融系统,从而提高相关工作的效率和质量,并创造价值。证券市场是金融系统的主要领域,行业研究员在证券市场的发展中又起到了关键性的作用,所以行业研究员工作的质量和效率时刻影响着整个金融系统的发展。但目前行业研究员研究工作的开展存在着一些障碍,如基础数据库结构混乱,更新维护困难;数据处理和分析效率低下,变动弹性较小;数据挖掘知识的缺乏,难以深入分析数据等。本文深入的分析和研究了上述问题,并基于VBA语言、网页数据获取技术和数据挖掘技术,提出了解决这些问题的基本思路和实现方法,有效的提高了行业研究员的工作效率和质量,大幅降低了研究成本,有助于提高整个资本市场和金融系统的有效性,具有很高的商用价值。本文首先介绍了文中会涉及到一些主要的技术方法,接着介绍了基础数据库构建和自动更新的方法,并根据数据来源的不同,分别就基于WEB数据获取、基于Wind平台以及基于彭博、TEJ等平台的数据库构建和自动更新的方法做了介绍,其中重点介绍了基于WEB数据获取技术的数据库构建和自动更新的实现方法。然后本文介绍了如何对数据库中的数据进行自动化的分析和处理,如自动化图表法,基本数学方法和财务公式分析法。接着又介绍了如何将处理好的数据自动生成相应的文本报告以提高效率。最后,重点介绍了关联规则挖掘技术在行业研究中的应用,并用实验结果证明了本文实现的关联规则挖掘算法的实用性。
施然[10](2011)在《浅谈数据挖掘在证券分析中的应用》文中进行了进一步梳理本文从数据挖掘的概念与过程出发,阐明证券分析中的挖掘主题和方法,具体阐述了数据挖掘技术在证券分析中的应用领域,并对旅游上市公司证券的聚类分析做了实证研究。
二、关联规则挖掘在证券业中的应用(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、关联规则挖掘在证券业中的应用(论文提纲范文)
(1)基于K-medoids改进的变色龙(Chameleon)聚类算法(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题背景及研究目的和意义 |
1.2 国内外研究现状 |
1.2.1 证券客户管理研究现状 |
1.2.2 聚类算法研究现状 |
1.3 主要研究内容和结构安排 |
第2章 聚类算法概述 |
2.1 聚类算法基本概念 |
2.2 大数据与聚类算法 |
2.3 层次聚类算法 |
2.4 划分聚类算法 |
2.5 基于划分的层次聚类算法 |
2.6 本章小结 |
第3章 基于K-medoids改进的Chameleon算法 |
3.1 基础知识 |
3.2 Chameleon算法的改进 |
3.2.1 新算法的基本思想 |
3.2.2 新算法的基本原理 |
3.2.3 新算法的算法框架 |
3.3 本章小结 |
第4章 基于K-medoids的 Chameleon算法的实证分析 |
4.1 基于证券交易信息的客户特征提取 |
4.2 聚类质量评价指标 |
4.3 基于新算法的证券客户聚类分析 |
4.3.1 客户特征分析 |
4.3.2 基于新算法的实证分析 |
4.3.3 聚类算法的对比分析 |
4.4 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间承担的科研任务与主要成果 |
致谢 |
(2)基于关联规则挖掘的学生成绩分析研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景与意义 |
1.2 研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 论文研究的主要内容 |
1.4 论文组织结构 |
2 数据挖掘 |
2.1 数据挖掘基本理论 |
2.1.1 数据挖掘过程 |
2.1.2 数据预处理 |
2.1.3 数据挖掘方法 |
2.2 关联规则挖掘 |
2.2.1 关联规则介绍 |
2.2.2 关联规则挖掘过程 |
2.2.3 关联规则分类 |
2.3 本章小结 |
3 关联规则算法研究 |
3.1 Apriori算法 |
3.1.1 Apriori算法的挖掘过程 |
3.1.2 Apriori算法的实例 |
3.1.3 算法分析 |
3.2 FP-growth算法 |
3.2.1 FP-growth算法流程 |
3.2.2 FP-growth算法实例 |
3.2.3 算法分析 |
3.3 关联规则算法改进 |
3.3.1 算法流程 |
3.3.2 算法分析 |
3.3.3 改进算法实例 |
3.3.4 实验结果分析 |
3.4 本章小结 |
4 学生成绩分析应用 |
4.1 需求分析 |
4.2 数据的预处理 |
4.3 学生成绩分析应用实现 |
4.4 本章小结 |
5 总结与展望 |
5.1 论文总结 |
5.2 工作展望 |
参考文献 |
致谢 |
攻读学位期间发表论文 |
(3)关联规则技术在智能配电网中的研究与应用(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 数据挖掘产生的背景及意义 |
1.2 数据挖掘的流程以及研究方法 |
1.2.1 数据挖掘的流程 |
1.2.2 数据挖掘的研究方法 |
1.3 数据挖掘的研究现状 |
1.3.1 国外研究现状 |
1.3.2 国内研究现状 |
1.4 关联规则研究的现状 |
1.5 数据挖掘技术在电力系统中的应用 |
1.6 本文的主要工作和内容安排 |
第2章 配电网用电负荷特性及相关影响因素分析 |
2.1 配电网负荷特性指标 |
2.1.1 日负荷特性指标 |
2.1.2 周负荷特性指标 |
2.1.3 月负荷特性指标 |
2.1.4 年(季)负荷特性指标 |
2.2 电力系统负荷特性影响因素分析 |
2.2.1 经济环境对负荷特性的影响 |
2.2.2 天气因素对负荷特性的影响 |
2.2.3 时间因素对负荷特性的影响 |
2.3 本章小结 |
第3章 关联规则在配电网负荷特性中的分析 |
3.1 关联规则算法的基本概念 |
3.1.1 关联规则算法的基础知识 |
3.1.2 关联规则常用算法 |
3.1.3 APRIORI算法主要流程 |
3.2 多层和多维关联规则挖掘 |
3.2.1 多层关联规则 |
3.2.2 多维关联规则 |
3.2.3 关联规则多重价值的衡量 |
3.3 基于关联规则的负荷特性分析 |
3.3.1 挖掘流程分析 |
3.3.2 数据仓库创建 |
3.3.2.1 数据来源 |
3.3.2.2 数据预处理 |
3.3.3 主题数据选择 |
3.3.4 数据的离散化处理 |
3.3.5 关联规则挖掘 |
3.3.6 输出结果 |
3.4 本章小结 |
第4章 基于Apriori算法的负荷特性指标及其相关因素的关联规则挖掘 |
4.1 Apriori算法的不足与改进 |
4.1.1 Apriori算法的不足 |
4.1.2 改进后的Apriori算法 |
4.2 关联规则挖掘及源代码实现 |
4.3 经济因素与用电量增长率之间的关联规则挖掘 |
4.3.1 连续数据离散化结果 |
4.3.2 关联规则挖掘实验结果 |
4.3.3 关联规则挖掘结果分析 |
4.4 天气因素与用电量间的关联规则挖掘 |
4.4.1 连续数据离散化结果 |
4.4.2 关联规则挖掘实验结果 |
4.4.3 关联规则挖掘结果分析 |
4.5 本章小结 |
第5章 总结与展望 |
5.1 本文工作总结 |
5.2 本文工作展望 |
参考文献 |
攻读硕士学位期间发表的论文 |
致谢 |
(4)数据挖掘技术在证券投资领域的应用研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 本文的主要内容 |
1.4 本文的章节安排 |
2 数据挖掘技术与证券市场概述 |
2.1 数据挖掘技术 |
2.1.1 数据挖掘的基本理论 |
2.1.2 数据挖掘的实例 |
2.2 证券市场 |
2.2.1 证券市场在我国发展历史 |
2.2.2 市场结构特点 |
3 关联规则挖掘的研究应用 |
3.1 关联规则挖掘技术 |
3.1.1 关联规则的基本概念 |
3.1.2 关联规则挖掘的Apriori算法 |
3.2 关联规则挖掘在证券投资中的应用 |
3.2.1 数据收集及预处理 |
3.2.2 关联分析挖掘 |
3.3 本章小结 |
4 时间序列挖掘的研究应用 |
4.1 时间序列方法的理论知识 |
4.1.1 时间序列常用方法 |
4.1.2 时间序列ARMA模型介绍 |
4.1.3 时间序列的特性分析 |
4.2 时间序列模型的建立 |
4.2.1 自相关函数与偏自相关函数 |
4.2.2 识别模型 |
4.2.3 参数估计 |
4.2.4 模型检验 |
4.2.5 模型的预测 |
4.3 时间序列挖掘在证券投资中的应用 |
4.3.1 数据预处理 |
4.3.2 时间序列挖掘技术的实现 |
4.4 本章小结 |
5 总结与展望 |
5.1 总结 |
5.2 展望 |
致谢 |
参考文献 |
附录 |
(5)中国上市公司大股东利益输送路径与治理研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 问题提出 |
1.3 研究目的与意义 |
1.3.1 研究的目的 |
1.3.2 研究的意义 |
1.4 基本概念的重新界定 |
1.4.1 大股东 |
1.4.2 利益输送 |
1.5 研究思路与方法 |
1.5.1 研究思路 |
1.5.2 研究方法 |
1.6 研究框架与创新之处 |
1.6.1 框架与内容 |
1.6.2 特色与创新之处 |
第二章 文献综述 |
2.1 利益输送路径研究与评价 |
2.1.1 损益转移 |
2.1.2 占用公司资产 |
2.1.3 违规担保或抵押 |
2.1.4 复合路径 |
2.1.5 研究评价 |
2.2 利益输送度量研究及评价 |
2.2.1 间接验证与度量 |
2.2.2 直接验证与度量 |
2.3 利益输送治理的研究现状及评述 |
2.3.1 内部治理论 |
2.3.2 外部治理论 |
2.3.3 混合治理论 |
2.3.4 研究评价 |
第三章 大股东利益输送内在发生与外部演化的机理研究 |
3.1 缘起:委托人间的利益冲突 |
3.1.1 大股东对控制权私利的攫取 |
3.1.2 小股东“投票权的冷漠”和“搭便车” |
3.2 内在发生机理:委托代理视角剖析 |
3.2.1 错综复杂的代理链 |
3.2.2 多层级的控制权配置 |
3.2.3 不同控制权配置模式下的利益输送 |
3.3 外部演化机理:演化博弈仿真分析 |
3.3.1 演化博弈的引入 |
3.3.2 博弈模型构建 |
3.3.3 模型及仿真分析 |
第四章 大股东利益输送动因与路径的互动机制研究 |
4.1 利益输送行为模式:动因与路径的互动反应 |
4.1.1 个体行为的一般模式 |
4.1.2 “动因—路径”互动模式 |
4.1.3 大股东利益输送行为模式 |
4.2 利益输送的动机:行为理性和资本本质的交聚 |
4.3 利益输送的目标:堑壕效应与支撑效应的交织 |
4.3.1 堑壕效应与目标 |
4.3.2 支撑效应与目标 |
4.3.3 两种效应的交错及实质 |
4.4 利益输送的诱因:内外两种环境的交互 |
4.4.1 内部环境诱因 |
4.4.2 外部环境诱因 |
4.4.3 两类诱因的叠加与放大 |
第五章 利益输送路径关联模式挖掘与提炼 |
5.1 利益输送路径关联模式挖掘的必要性 |
5.1.1 数据属性特征 |
5.1.2 数据挖掘技术优势 |
5.1.3 关联模式挖掘的必要性 |
5.2 关联规则挖掘技术原理 |
5.2.1 定义与定理 |
5.2.2 基本模型 |
5.2.3 Apriori算法 |
5.3 关联模式挖掘研究设计 |
5.3.1 数据及来源 |
5.3.2 挖掘方向与变量选取 |
5.3.3 数据处理 |
5.3.4 步骤安排 |
5.3.5 工具选取 |
5.3.6 参数设置 |
5.4 变量描述性统计分析 |
5.4.1 各类违规类型统计分析 |
5.4.2 利益输送统计分析 |
5.5 关联规则挖掘与结果解析 |
5.5.1 关联规则挖掘网络图析 |
5.5.2 总体关联规则挖掘 |
5.5.3 分路径关联规则挖掘 |
5.5 研究结论及启示 |
第六章 股权结构、治理环境与利益输送路径实证研究 |
6.1 概念模型 |
6.2 理论简析与研究假说 |
6.2.1 股权结构、利益输送及路径选择 |
6.2.2 外部环境、利益输送及路径选择 |
6.3 研究设计 |
6.3.1 样本选择与数据来源 |
6.3.2 变量设计 |
6.3.3 模型设定 |
6.4 实证检验结果及分析 |
6.4.1 描述性统计与分组t检验 |
6.4.2 相关性分析 |
6.4.3 多元回归结果及分析 |
6.5 研究结论及启示 |
第七章 大股东利益输送的治理 |
7.1 以理念创新为先导,推进科学治理 |
7.1.1 增强系统治理 |
7.1.2 突出协同治理 |
7.1.3 强化数据治理 |
7.1.4 注重文化治理 |
7.2 以路径创新为支撑,促进协同治理 |
7.2.1 优化内部治理的路径 |
7.2.2 完善外部治理的路径 |
7.2.3 开创输送治理新路径 |
7.3 以制度创新为保障,实现长效治理 |
7.3.1 完善利益输送治理立法 |
7.3.2 健全治理制度体系 |
7.3.3 建立治理规范体系 |
第八章 研究结论与展望 |
参考文献 |
附录 |
攻读博士学位期间取得的科研成果 |
致谢 |
(6)组合模式挖掘及其在超市数据分析中的应用研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题背景及研究的意义 |
1.2 数据挖掘的典型过程 |
1.3 国内外研究现状 |
1.3.1 国外数据挖掘研究现状 |
1.3.2 国内数据挖掘研究现状 |
1.4 课题的研究内容及论文组织结构 |
1.4.1 课题研究的主要内容 |
1.4.2 论文的组织结构 |
第二章 关联规则挖掘的相关知识 |
2.1 关联规则的相关概念 |
2.2 关联规则挖掘的描述 |
2.3 典型关联规则挖掘算法的分析 |
2.3.1 Apriori算法简介及过程分析 |
2.3.2 FP-Growth算法简介及过程分析 |
2.4 本章小结 |
第三章 可决策组合规则及挖掘 |
3.1 关联规则质量的评价标准 |
3.2 兴趣度的介绍 |
3.3 可决策的组合模式挖掘 |
3.3.1 问题的引入 |
3.3.2 组合模式挖掘的基本概念 |
3.3.3 组合模式挖掘的步骤 |
3.3.4 组合模式挖掘的算法 |
3.4 本章小结 |
第四章 基于组合模式挖掘的超市数据分析 |
4.1 问题的提出 |
4.2 解决的方案 |
4.3 系统功能实现 |
4.3.1 原始数据表 |
4.3.2 数据预处理 |
4.3.3 决策表约简 |
4.3.4 关联规则的挖掘 |
4.3.5 可决策组合模式挖掘 |
4.4 本章小结 |
第五章 结论与展望 |
5.1 结论 |
5.2 未来的研究工作 |
参考文献 |
致谢 |
(7)基于时间序列的关联规则数据挖掘在证券中的应用(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景 |
1.2 应用于中国股市中的关联规则挖掘的研究现状 |
1.2.1 股票数据预处理研究 |
1.2.2 改进关联规则算法再应用到股票预测中 |
1.2.3 对生成的频繁项集进行兴趣度及相关分析研究 |
1.3 本论文的研究内容、创新及章节安排 |
1.3.1 研究内容 |
1.3.2 论文创新 |
1.3.3 章节安排 |
第2章 相关知识体系介绍 |
2.1 数据挖掘技术 |
2.1.1 数据挖掘的概念 |
2.1.2 数据挖掘的步骤 |
2.1.3 数据挖掘的主要分析方法 |
2.2 关联规则的基本概念 |
2.3 关联规则中经典的Apriori算法介绍 |
2.3.1 算法介绍 |
2.3.2 算法的伪码实现 |
2.3.3 算法的实例 |
2.3.4 产生关联规则 |
2.4 常用的Apriori改进算法介绍 |
2.5 关联规则相关分析介绍 |
2.6 股票相关知识介绍 |
2.6.1 股票的基本技术指标 |
2.6.2 股价和成交量之间的联系 |
第3章 带时序的股票数据关联规则挖掘 |
3.1 任务需求与规则模式 |
3.1.1 任务需求 |
3.1.2 规则模式 |
3.2 数据预处理 |
3.2.1 需要挖掘的数据的原始形式 |
3.2.2 将股票-时间表转换成位示图 |
3.3 基于滑动时间窗口的算法(方法一) |
3.3.1 算法的基本思路 |
3.3.2 算法描述 |
3.3.3 算法的举例 |
3.4 bit-search算法(方法二) |
3.4.1 bit-search算法思想 |
3.4.2 bit-search算法步骤 |
3.4.3 bit-search算法描述 |
3.4.4 bit-search算法的一个举例 |
3.4.5 bit-search算法的几点说明 |
3.5 相关分析 |
3.6 bit-search算法与基于时间窗口的算法比较 |
3.6.1 两种算法的时间复杂度比较 |
3.6.2 两种算法的效率比较 |
第4章 bit-search算法在股票市场中的应用 |
4.1 股票关联规则挖掘流程的设计 |
4.1.1 背景介绍 |
4.1.2 设计目标 |
4.1.3 股票关联规则挖掘流程 |
4.1.4 软硬件环境 |
4.2 股票数据的导入和预处理 |
4.2.1 股票数据的导入 |
4.2.2 数据的预处理1 |
4.2.3 数据的预处理2 |
4.2.4 数据的预处理3 |
4.3 使用bit-search算法生成关联规则 |
4.3.1 算法执行过程 |
4.3.2 算法执行结果 |
第5章 总结与展望 |
5.1 本文总结 |
5.2 讨论与展望 |
致谢 |
参考文献 |
(8)基于知识发现的战略性新兴产业识别与布局研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 引言 |
1.1 选题背景 |
1.2 选题意义 |
1.2.1 理论意义 |
1.2.2 现实意义 |
1.3 研究的主要内容 |
1.4 研究方法及技术路线图 |
1.5 创新点与不足 |
本章小结 |
第二章 理论综述 |
2.1 战略性新兴产业相关研究理论 |
2.2 战略性新兴产业的应用研究 |
2.2.1 国外研究现状 |
2.2.2 国内研究现状 |
2.3 知识发现的国内外应用研究 |
本章小结 |
第三章 知识发现的新兴产业应用功能与分析 |
3.1 知识发现与数据挖掘 |
3.2 知识发现的基本功能 |
3.2.1 关联分析 |
3.2.2 分类与预测 |
3.2.3 聚类分析 |
3.2.4 演化分析 |
3.3 新兴产业数据仓库与数据预处理 |
3.3.1 新兴产业数据仓库多维数据模型 |
3.3.2 数据预处理 |
本章小结 |
第四章 基于关联规则的战略性新兴产业识别 |
4.1 战略性新兴产业识别指标体系的设计 |
4.1.1 指标体系设计思路及原则 |
4.1.2 战略性新兴产业识别指标体系的建立 |
4.2 基于关联规则的战略性新兴产业识别模型 |
4.2.1 关联规则的基本概念 |
4.2.2 关联规则中涉及数据项的基本概念 |
4.2.3 关联规则数据离散化 |
4.2.4 多维关联规则挖掘 |
本章小结 |
第五章 基于聚类模式的战略性新兴产业布局 |
5.1. 基于技术-经济范式背景下的产业布局理论 |
5.2 战略性新兴产业的集群布局模式 |
5.2.1 新兴产业集群布局文献回顾 |
5.2.2 战略性新兴产业集群布局的重要性 |
5.2.3 战略性新兴产业聚类联盟到集群布局模式思路 |
5.3 战略性新兴产业布局指标体系的设计 |
5.3.1 指标体系设计思路及原则 |
5.3.2 战略性新兴产业布局指标内涵 |
5.4 基于聚类模式的战略性新兴产业布局模型 |
本章小结 |
第六章 实证分析——以长江三角洲为例 |
6.1 长江三角洲战略性新兴产业发展概述 |
6.1.1 长江三角洲产业结构现状 |
6.1.2 长江三角洲发展战略性新兴产业发展现状 |
6.2 基于关联规则的战略性新兴产业识别实证分析 |
6.3 基于聚类模式的战略性新兴产业布局实证分析 |
6.4 实证结果分析及布局建议 |
本章小结 |
第七章 战略性新兴产业发展建议 |
7.1 发展战略性新兴产业存在的主要问题 |
7.2 战略性新兴产业政策导向 |
7.2.1 国家战略 |
7.2.2 部门政策 |
7.2.3 地方支持 |
本章小结 |
结论及展望 |
研究的结论 |
未来研究的展望 |
参考文献 |
致谢 |
攻读学位期间主要的研究成果 |
中文摘要 |
ABSTRACT |
文献综述报告 |
参考文献 |
(9)数据挖掘技术在证券市场分析中的应用研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
目录 |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状及相关技术简介 |
1.2.1 数据挖掘技术的国内外研究现状 |
1.2.2 WEB信息抽取技术的国内外研究现状 |
1.2.3 相关技术简介 |
1.3 论文的主要内容和章节安排 |
第2章 基础数据库的构建与更新 |
2.1 基于WEB数据获取技术的数据库构建与更新 |
2.1.1 直接获取网页文本数据 |
2.1.2 自动下载文件并获取数据 |
2.2 基于Wind平台的数据库构建 |
2.2.1 Wind平台简介 |
2.2.2 行情数据库的批量构建与更新 |
2.2.3 上市公司财务数据库的构建与更新 |
2.3 基于彭博、TEJ等平台的数据库构建与更新 |
第3章 数据自动处理与分析 |
3.1 自动化图表方法 |
3.1.1 自动化图表处理表格的结构 |
3.1.2 自动化图表的自动更新 |
3.1.3 自动化图表的时间选择 |
3.1.4 自动化图表的内容选择 |
3.2 基本数学方法 |
3.2.1 自动处理的相对指数法 |
3.2.2 自动处理的排序法 |
3.2.3 自动处理的加权平均法 |
3.3 财务公式分析法 |
3.3.1 重要财务指标的自动处理 |
3.3.2 杜邦分析 |
第4章 信息汇聚和文本报告的自动生成 |
4.1 文本报告自动生成的实现方法 |
4.2 文本报告自动生成举例 |
4.2.1 上市公司定期财务公告点评报告 |
4.2.2 市场行情定期回顾报告 |
第5章 关联规则挖掘在行业研究中的应用 |
5.1 关联规则挖掘技术介绍 |
5.1.1 关联规则的基本概念 |
5.1.2 关联规则挖掘的分类 |
5.2 关联规则挖掘的Apriori算法 |
5.2.1 发现频繁项集 |
5.2.2 产生关联规则 |
5.2.3 Apriori算法的缺陷和优化 |
5.3 关联规则挖掘应用举例 |
5.3.1 关联规则数据挖掘算法实现方法 |
5.3.2 算法实现的特点分析 |
5.3.3 实验结果分析 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
作者简历 |
作者在攻读硕士期间发表及录用的论文 |
附录:两维关联规则挖掘的程序代码 |
(10)浅谈数据挖掘在证券分析中的应用(论文提纲范文)
1 数据挖掘概述 |
1.1 概念 |
1.2 数据挖掘过程 |
2 数据挖掘在证券分析中的应用 |
2.1 证券分析中的挖掘主题 |
2.2 证券分析中的数据挖掘方法 |
2.3 数据挖掘技术在证券分析中的应用领域 |
2.3.1 聚类分析 |
2.3.2 时间序列分析 |
2.3.3 关联规则分析 |
2.3.4 其他分析 |
3 实证研究 |
4 结论 |
四、关联规则挖掘在证券业中的应用(论文参考文献)
- [1]基于K-medoids改进的变色龙(Chameleon)聚类算法[D]. 韩新新. 燕山大学, 2019(06)
- [2]基于关联规则挖掘的学生成绩分析研究[D]. 曾兴. 海南大学, 2018(12)
- [3]关联规则技术在智能配电网中的研究与应用[D]. 刘华. 华北电力大学(北京), 2017(03)
- [4]数据挖掘技术在证券投资领域的应用研究[D]. 郭锋利. 西安科技大学, 2014(03)
- [5]中国上市公司大股东利益输送路径与治理研究[D]. 贺宝成. 西北大学, 2014(04)
- [6]组合模式挖掘及其在超市数据分析中的应用研究[D]. 张见. 云南大学, 2014(12)
- [7]基于时间序列的关联规则数据挖掘在证券中的应用[D]. 叶翔. 南昌大学, 2012(12)
- [8]基于知识发现的战略性新兴产业识别与布局研究[D]. 吴艳. 长沙理工大学, 2012(09)
- [9]数据挖掘技术在证券市场分析中的应用研究[D]. 许兴军. 浙江大学, 2012(07)
- [10]浅谈数据挖掘在证券分析中的应用[J]. 施然. 价值工程, 2011(21)