一、一种改进的Fuzzy信息检索方法及其应用(论文文献综述)
张洞[1](2020)在《基于在线评论信息的商品排序模型研究》文中指出21世纪以来,随着信息技术的更新与发展,电子商务平台得以迅速崛起。以天猫、京东、亚马逊为首的大型电子商务平台为其平台上的产品和服务设置了评论模块,这让消费者能够分享他们真实的购买体验或者从在线评论中获取产品或服务相关的内容。但是,在线评论体量巨大,人们很难在短时间内浏览所有评论并提取重要信息来选出心仪的产品。因此,基于在线评论的商品排序的研究已成为管理决策领域的热点。然而,现有的基于在线评论的商品排序研究多集中在运用有向图理论对在线商品进行排序,并没有涉及在线评论信息的情感强度,会导致信息损失。此外,现有研究中对在线评论信息的研究是基于商品整体而言,很少有考虑商品的属性特征信息,不能基于选定的商品属性对其排序。另外,有学者尝试用TOPSIS(Technique for Order Preference by Similarity to an Ideal Solution)等决策模型对商品进行排序,可是这类模型基于决策者是完全理性的假设,并没有考虑决策者在决策过程的心理因素的影响。近年来,越来越多的学者把注意力放在TODIM(an acronym in Portuguese of interactive and multi-criteria decision making)模型上,该模型通过比较两两方案构建优势度函数,并在此过程中考虑决策者的损失厌恶,使得方案的排序结果更符合常理。但是现有的TODIM模型仅能用来处理三种属性关联关系(冗余关联、彼此独立和互补关联)中的其中一种。基于上述研究的不足,本文以TODIM模型为基础展开基于在线评论信息的商品排序研究。本研究一方面从量化商品特征情感的角度出发,分别建立了基于在线评论的直觉模糊情感量化模型和犹豫模糊情感量化模型;另一方面,基于经典的TODIM多属性决策方法,本研究提出了基于2可加Choquet模糊积分的直觉模糊TODIM模型和犹豫模糊TODIM模型,利用属性间交互系数不同取值范围表示两两属性间不同的属性关联情况,从而使其能够同时处理属性间的多种交互关系,应用于更复杂的商品排序问题。本文的研究内容和创新成果如下:(1)建立了模糊环境下的商品特征情感量化模型。考虑到消费者对商品特征的情感是有不同强度的,精确数难以刻画决策者的主观判断信息,本论文提出了模糊环境下的商品特征情感量化模型,用以量化评论语句中消费者对产品特征的情感强度。基于从在线评论句中提取的<特征词,情感词,情感修饰词>集合,该模型可以计算特征词的情感强度。实例分析结果表明,本文构建的模糊环境下的商品特征情感量化模型可以有效地刻画消费者的特征情感强度信息,能为商品排序模型提供有效的数据支持。(2)分别提出了改进的直觉模糊得分函数和犹豫模糊得分函数。首先,本文研究现有文献中关于直觉模糊得分函数的不足之处,在此基础上,结合犹豫度的分配和投票模型的思想,本文提出了改进的直觉模糊得分函数,另外为了更好对直觉模糊数进行排序,本文进一步提出了直觉模糊精确函数,在此基础上确定了直觉模糊数的排序规则,并用算例的数值实验证明所提出的直觉模糊得分函数的有效性。其次,本文针对现有犹豫模糊得分函数的不合理之处,考虑犹豫模糊数中元素的补集以及犹豫模糊数计算步骤的简便性,本文提出了改进的犹豫模糊得分函数,在此基础上定义了犹豫模糊数的排序规则。该犹豫模糊得分函数在简化了计算步骤的同时提升犹豫模糊数的排序准确性,本研究通过算例证明其有效性。(3)分别构建了基于2可加Choquet模糊积分的直觉模糊TODIM模型和犹豫模糊TODIM模型。考虑到现有TODIM决策模型的研究并不能很好的处理属性中冗余关联、彼此独立和互补关联的关系,本研究结合2可加模糊测度、Choquet积分,分别提出了基于2可加Choquet模糊积分的直觉模糊TODIM模型和犹豫模糊TODIM模型,该模型通过属性交互系数表示属性间不同的交互关系,可以有效的处理不确定环境下的属性关联决策问题。本研究通过参数的敏感性分析表明决策者的风险承受能力是对排序结果有影响的,有一定的现实意义。最后,通过对天猫平台手机产品进行排序,研究结果表明,本文提出的基于2可加Choquet模糊积分的直觉模糊TODIM模型和犹豫模糊TODIM模型可以有效的对在线商品进行排序,具有较强的可适用性。
刘建平[2](2020)在《科学数据用户相关性判断模型研究》文中提出在开放科学环境和“数据密集型”科学研究范式的驱动下,科学数据的重要性持续提升。在FAIR原则和关联数据技术的影响下,更多的科学数据以富含语义的形式进入网络传播。然而,我们对科学数据用户如何做出某条科学数据相关与否的判断过程知之甚少。因此,本研究以科学数据用户相关性判断行为及其认知机理为研究切入点,理解和建模科学数据用户相关性判断过程,以期丰富和拓展信息科学领域相关性研究,同时为科学数据专属的搜索技术研发提供理论基础。相关性是信息科学的基础概念之一,理解用户对特定类型信息对象做出相关性判断的过程、原理、影响因素以及作用效果,始终是信息科学特别是信息检索学者们的关注点。学者们先后研究了科技论文、文本文档、网页、多媒体、社交媒体等多种类型的相关性,大数据以及科学数据的相关性是最近的关注,并且因其区别于其他信息类型的认知和技术特点而吸引了越来越多的研究兴趣。本论文尝试以实证的方式构建科学数据用户相关性判断模型。通过对用户相关性判断过程的描述、核心认知过程量化验证和模型的算法化设计,进而为科学数据搜索与推荐提供理论基础。为此,本研究在综述已有研究的基础上提出了认知导向的相关性判断假设性概念模型和相应的研究目标。并基于此,顺次开展了三个层次的实证研究:1)科学数据用户相关性判断描述性概念模型研究;2)科学数据用户相关性判断实证性量化模型研究;3)多标准相关性排序(Multi-Criteria Relevance Ranking,MCRR)算法及其应用框架设计。本研究共得出以下研究结论:首先,论文通过静态要素识别验证了科学数据用户相关性判断描述性概念模型。模型中识别了24个科学数据信息元(Scientific Data Information Elements,SDIEs)、3类决策规则、12个一级相关性标准、4类相关性标准维度。基于此,论文提出了TAQA-U(Topicality,Availibility,Quality,Authority and Usefulness)科学数据用户相关性标准结构,为用户导向的科学数据查询与检索实践提供了“静态”指导原则。其次,基于偏最小二乘结构方程模型(Partial Least Squares Structural Equation Modeling,PLS-SEM)量化方法,实证验证了科学数据查询与检索交互过程中科学数据相关性标准使用结构模型,即科学数据用户相关性判断实证性量化模型。论文验证了主题相关性标准在用户相关性判断中的先决条件作用,验证了可用性、质量和权威性的中介作用,验证了有用性作为科学数据用户判断数据对象的结果变量。同时,研究实证验证了科学数据用户相关性判断的个性化认知模式主要体现在相关性标准动态组合使用的差异上。最后,基于描述性概念模型和实证性量化模型研究发现与结果,研究设计了多标准相关性排序(MCRR)算法及其应用框架。该算法综合考虑了用户多标准相关性判断的认知本质:1)综合计算多标准得分,而非主题词匹配模式下的单一维度相关性;2)引入优先级算子计算不同标准(集)之间的等级关系。同时,研究提出了认知导向的科学数据检索与推荐框架以支撑个性化科学数据检索与推荐实践。综合以上研究结果与发现,论文的主要学术贡献与创新体现在:1)论文从三个水平(描述性概念模型/实证性量化模型/算法化表达)创新地提出并验证了科学数据用户相关性判断模型。同时,将用户相关性判断研究对象拓展到科学数据及其用户,在理论上丰富和发展了用户相关性研究进程。2)探索了从描述性概念模型到量化模型到算法表达的连续性用户相关性判断研究路径;3)提出了认知导向的科学数据检索与推荐框架,为智能、个性化科学数据检索与推荐提供了理论基础。未来研究将在理论和实践上进一步丰富和发展认知导向的科学数据查询与检索研究。在理论上,扩大研究情境(如科学数据与科技文献的关联搜索)和用户类型(如专门针对科学数据领域专家),完善和发展已有理论模型;在实践上,以个性化科学数据检索与推荐为切入点,开发认知导向的科学数据查询与推荐系统,提升科学数据的复用率和价值,支撑开放科学背景下的科研创新。
张雨农[3](2020)在《密度峰值聚类的优化及其应用研究》文中指出近年来,随着大数据人工智能技术的高速发展,人们的生产生活方式发生了翻天覆地的变化。手机支付、网络直播、视频传播、共享单车、网络购物以及人工智能等已渗入到人们生活的方方面面,成为人们关注的热点问题,而由此产生的数据量也发生了爆炸式地增长。聚类分析,作为数据挖掘技术的重要分支,是统计分析学科中的一项重要技术,也是一种无监督的机器学习方法。其在无任何先验信息的条件下,可以自主探究数据内在的结构信息和相似关系,使得同一类簇内的数据相似性较大,不同类簇的数据差异较大。因此,可以借助聚类分析挖掘出这些海量数据中包含的无组织但有价值的信息,进行相关实验研究,促进社会发展。Alex Rodriguez等人于2014年在Science上提出了一种基于快速搜索和发现密度峰值的聚类算法(Clustering by fast search and find of density peaks,简称DPC)。该算法重新定义了类中心的概念,将数据映射到一个二维空间上(局部密度和最近距离),并在新的空间上进行类中心的识别和类的分组。DPC算法能够快速地发现任意形状数据集的密度峰值点,并能高效地进行样本点的分配和离群点的剔除。该算法自提出以来就在社区发现、图像处理、计算机视觉以及文本处理等领域得到应用,受到了各行各业的广泛认可。然而,随着对DPC算法的深入研究,其也暴露了一些应用上的不足。该算法没有统一的密度度量准则、参数dc较难直接确定、聚类中心需人工选择、样本分配易导致错分结果连续传递、无法有效处理复杂流形以及密度差异化数据集等等。为获得更好的应用效果,本文提出了两种聚类优化算法,并将新算法运用到电子病历的文本挖掘研究中。首先,针对密度峰值聚类算法在处理密度差异的数据时,无法有效度量位于低密度区域内数据点的密度峰值,错误地将稀疏低密度类簇归类于密集高密度的类簇中。提出了一种基于相对密度优化的密度峰值聚类算法,重新定义了样本点的局部密度和剩余点的分配方式,较好地解决了低密度区域样本的识别问题,扩展了密度峰值聚类的研究方法。其次,针对密度峰值聚类算法在处理多密度型和复杂流形的数据时,无法有效识别类簇中心,错误地将一个类簇分割或是将两个类簇合并。基于密度峰值聚类算法和DBSCAN算法的启发,利用共享近邻重新定义了样本点的局部密度,并借助DBSACN算法核心点和近邻连接的思想进行聚类分析。此外,尝试性地将非参数统计检验用到子类的合并中,提出了一种基于共享近邻和统计检验的聚类算法,有效地弥补了密度峰值聚类无法有效处理复杂流形数据的缺陷。最后,在互联网医疗迅速兴起,医院数字信息化,纸质病历逐渐被丢弃导致积累了海量电子病历的背景下,将经典DPC算法和本文改进算法用到电子病历的文本挖掘中,验证优化算法在文本挖掘聚类分析中的有效性,以期实现对医院积累的电子病历文本数据的分析,发现其中蕴藏的疾病特征以及对应的诊疗模式。实验结果表明,本文在保留DPC算法优点的同时,通过汲取其他算法的优势和统计检验的思想,针对密度可变的数据、结构不规则的数据以及复杂流形的数据,提出的两种密度峰值优化算法很大程度上提高了聚类精度,增强了参数鲁棒性。在电子病历的文本挖掘中,本文优化算法较好地完成了聚类工作,对于提高临床诊疗效率和水平具有重要意义。本文创新之处主要表现在三个方面,第一,针对密度峰值聚类算法在处理密度可变、多密度型和复杂流形的数据时效果不佳,提出了两种密度峰值优化算法,较好地解决了低密度区域和复杂流形数据的问题,扩展了密度峰值聚类的研究方法。第二,由于聚类分析的特殊性与复杂性,缺乏显着性检验,分析过程不够完整。通过汲取其他算法的优势和统计检验的思想,本文尝试性地将非参数检验用于类簇的合并当中,取得了较好的效果,为聚类分析提供了一种新的视角和方法。第三,将改进的算法用到电子病历的文本挖掘中,以期实现对医院积累的电子病历文本数据的分析,发现其中蕴藏的疾病特征以及对应的诊疗模式,对于提高临床诊疗效率和水平具有重要意义。
徐以聪[4](2020)在《基于犹豫模糊权重的数学表达式检索模型研究》文中研究指明数学表达式特有的多种数学符号排列组合而成的空间层次结构,成为其区别于普通文本的重要标志,使数学表达式检索成为信息检索领域的难点,亟待研发能够良好适应数学表达式特征的检索理论与方法。通过对数学表达式特征的分析与归纳,对数学表达式检索模型的特征提取、索引构建以及匹配和排序等关键问题展开研究,设计了一种基于运算符特征的数学表达式检索方法,并对其加以扩展,利用犹豫模糊集在解决多属性、多隶属度分类问题上的优势,提出一种基于犹豫模糊权重的数学表达式检索模型。首先,提取数学表达式的子式结构,构建子式特征码;然后,对数学表达式子式的长度、运算符数目、子式所在层次进行综合犹豫模糊隶属度评估,为各子式分配犹豫模糊权重值并将其加入倒排索引,在检索时对目标表达式做相同解析处理;最后,通过权重值累加的方式计算犹豫模糊相似度得分,并将检索结果有序输出,实现数学表达式检索。在从数学信息检索领域公共数据集中得到的31742篇科技文档与519588个LaTeX数学表达式上进行了实验,结果显示所提出方法的检索时间在可接受范围之内,排序合理性指标最大值为0.811,表明本文基于犹豫模糊权重的数学表达式检索模型能够较合理地检索数学表达式。
江海欢[5](2020)在《容错粗糙集在自然语言处理中的应用研究》文中提出随着信息技术的飞速发展,海量的文本数据不断增长。与数值数据不同,文本数据的处理更为复杂和困难。容错粗糙集模型是对经典的粗糙集的扩展,把论域基于等价关系形成的划分扩展为容错关系,这种容错关系能够很好地应用于自然语言处理领域。本文从文本数据不确定性和不精确性的角度,对自然语言处理的文本处理问题,利用容错粗糙集进行了研究。首先,文档表示是自然语言处理的基础之一,根据不同的权重计算方法,本文提出了两种基于容错粗糙集的词袋模型文本表示算法。该算法解决了传统词袋模型具有的稀疏性和缺乏语义关联的缺点。同时也不需要任何训练或者先验知识。通过对不同数据集和不同文档表示方法在文本分类任务的对比实验,验证了本文所提出方法的性能。其次,本文对传统的容错粗糙集模型进行了改进,解决了其时间复杂度较高和不具有增量性的缺点。并引入概率容错粗糙集,对所提出文本表示算法进行改进,将其应用于语句相似度计算中,提出了一种非监督的基于概率容错粗糙集的语句相似度计算算法。每个语句都由一对上近似和下近似表示,分别计算每对语句间的上近似相似度和下近似相似度。最终的语句相似度表示为其上近似相似度和下近似相似度的线性组合。在SICK2014任务中句子相似度计算的实验证明了本文所提出模型的显着性和有效性。最后,本文利用Z数对不确定性事件的可靠性进行衡量,结合容错粗糙集,提出了基于容错粗糙集和Z数的机器翻译评价算法。将Z数转换为常规模糊数,再利用模糊综合评价算法,结合容错粗糙集,计算人工评价的分数。最后通过实例进行了分析。
邱晨[6](2020)在《贝叶斯学习算法及其应用研究》文中认为在实际应用领域,如:自动问答、岩爆预测、油气勘探等,许多任务都能够转化成这样一个问题:给定观测数据,假设空间中最有可能的假设是什么。作为一种基于概率推理的方法,贝叶斯学习主要研究根据某种先验分布与观测数据进行推理,为许多实际应用问题提供最优的决策。由于实际生产中存在诸多复杂的问题,如基于代价敏感的不平衡分类问题、多噪声标记数据等。目前,贝叶斯算法的实践应用仍是一项困难的工作。朴素贝叶斯是基于贝叶斯学习与属性条件独立假设的分类算法。然而,该假设在实际应用中难以满足。为此,许多学者研究释放朴素贝叶斯分类算法的属性条件独立假设以提高分类性能,并提出了许多改进方法,概括起来主要有三类:结构扩展、实例加权、局部学习;而变分贝叶斯是贝叶斯框架下求解后验概率的近似推断算法。相比于简单的朴素贝叶斯,变分贝叶斯具有更为精准的近似估计结果。变分自编码器是基于变分贝叶斯推断的网络结构,目前被广泛应用于自动问答、知识图谱等领域。由于实际应用中问题的复杂多样性,基于贝叶斯算法的推断决策,仍然面临着许多的挑战。主要包括:1)不同的评估指标。现有的朴素贝叶斯改进算法主要提升算法的分类精度,然而,更多的评估指标,特别是准确的类概率估测,对实际生产更具有指导意义;2)基于代价敏感的不平衡分类问题。传统的朴素贝叶斯分类算法假定数据的类分布平衡或者假定不同类的误分类代价相同。而这一假设在大多数实际应用中是不现实的。这就导致现有算法求解基于代价敏感的不平衡分类问题时,达不到理想的效果;3)多噪声标记数据。由于从专家获取观测数据的类标记昂贵且费时,众包技术从大众收集了大量的多噪声标记数据。然而,多噪声标记数据难以直接用于朴素贝叶斯分类算法;4)更多复杂应用场景的变分贝叶斯应用,如知识库问答。针对以上四个问题,本文从朴素贝叶斯求解标准分类问题开始研究,逐步释放朴素贝叶斯分类算法的假设条件,探究朴素贝叶斯分类算法在实际应用问题中的性能。提出了基于条件似然对数的朴素贝叶斯分类算法、差分进化的朴素贝叶斯实例加权算法、和差分进化的朴素贝叶斯多噪声标记质量估测算法。进一步分析变分贝叶斯在估计精准后验分布,处理复杂应用场景的优势。最后,将变分自编码器应用于知识库问答的关系抽取任务,提出了基于变分自编码器的关系抽取算法。本文的主要贡献包括:(1)给出了在朴素贝叶斯分类算法中类概率估测的评价方法,简述超父亲树扩展的朴素贝叶斯分类算法及其在类概率估测的性能,提出了基于条件似然对数的朴素贝叶斯分类算法(Conditional Log Likelihood-based Super Parent,CLL-SP)。CLL-SP将基于条件似然对数的评估方式用来替换原有的分类精度的评估方式,选择具有最大化条件似然对数的超父亲结点和最佳子结点扩展朴素贝叶斯分类器的结构。(2)给出了代价敏感学习的相关概述,简述了差分进化算法框架,提出了差分进化的朴素贝叶斯实例加权算法(Differential Evolution-based Instance Weighted Naive Bayes,DEIWNB)。DEIWNB将差分进化算法和朴素贝叶斯分类算法相结合,调整多数类实例的权重,学习一个最优的多数类实例子集,能有效降低误分类总代价。(3)给出了多噪声标记集成方法的相关概述,提出了差分进化的朴素贝叶斯多噪声标记质量估测算法(Differential Evolution-based Naive Bayes for Estimating Labeler Quality,DEELQ)。DEELQ对多噪声标记数据进行推断,构建差分进化的朴素贝叶斯分类器,以推断不同标注者的标记质量和实例的集成标记。(4)综述了知识库问答的研究方法,给出了知识库问答中关系抽取任务的问题描述,提出了基于变分自编码器的关系抽取算法(Variational Autoencoder-based Relation Detection,VRD)。VRD将关系抽取任务转为这样一个问题:学习一个给定问句时,对应知识库中谓语关系的条件分布。将深度学习中的表示学习与变分自编码器结合,引入变分自编码器中的隐变量构建问句与谓语共同性的条件分布。实验结果表明,VRD算法能有效抽取谓语关系,并具有较高的关系抽取准确率。
王纪凯[7](2020)在《基于多源不确定性建模的移动机器人室内全局定位方法研究》文中研究指明移动机器人全局定位是导航系统中基础而重要的模块之一。移动机器人执行任务必须以对自身的位姿进行精确而稳定地估计为前提。移动机器人通过将当前观测与已有的环境地图进行匹配以对自身的位姿进行估计。在这一过程中,移动机器人自主定位受到多源不确定性的影响。这些不确定性包括观测不确定性和特征位置关联不确定性。其中,环境条件、传感器噪声以及信息传递噪声导致观测信息与真实的物理信息存在偏差。同时,机器人对环境认知能力不足,导致机器人对当前观测到的特征的全局位置的估计存在不确定性。这两种不确定性都影响机器人对自身所在位置的估计。后者的影响导致机器人不确定自己位于环境中哪个区域,前者主要导致机器人不确定自身的具体位姿。因此,研究面向定位任务的不确定性信息建模方法,在此基础上构建环境信息存储、检索以及信息关联与推理方法,对提升移动机器人全局定位系统的性能至关重要。本文借鉴定性推理方法、概率理论、机器学习方法等不确定性信息表达与处理方法的优点,针对观测不确定性和特征位置关联不确定性进行建模,提出了一些新的全局定位方法,以提高移动机器人自主导航过程的稳定性、高效性和智能性。为了提高对观测不确定性信息的处理能力,必须建立与信息特性相适应的信息表达与处理模型。本文结合定性推理方法和概率理论,提出了定性粒子滤波器以提升基于激光的全局定位性能。为了提高对特征关联不确定性的处理能力,必须提升特征表达与关联模型的性能和特征关联推理方法的性能。本文基于回归森林模型,建立了几何地图、点特征地图、线段特征地图和拓扑地图的自主表达模型,实现对特征关联不确定性的有效建模,并提出了基于改进随机一致性采样方法的特征关联概率推理机制。本文的主要工作和创新点如下:1)针对基于激光的全局定位过程中移动机器人状态概率分布内涵不明确的问题,结合定性推理方法与贝叶斯方法,建立了定性粒子滤波器,并在此基础上提出了全局定位方法。该方法将环境地图表示为定性粒子及其预期观测的集合。在线状态迭代估计过程中,针对状态转移模型和观测模型参数不确定的问题,提出了状态定性转移模型与定性观测模型。基于定性模型实现对机器人位姿可能分布区域的完备估计与覆盖,利用可能性区域内包含的粒子对机器人的真实状态分布进行内涵估计。最后,建立了上下文的概率传递模型,实现上下文观测信息融合,以降低位姿假设不确定性。实验结果表明,所提出方法对于状态转移模型的建模误差具有较高的鲁棒性。同时,由于能够自适应调整粒子规模,所提出方法具有较高的计算效率。2)在视觉全局定位过程中,针对由环境中存在的重复纹理和结构导致的相机位姿估计存在不确定性的问题,本文提出了一种基于回归森林的特征位置关联不确定性建模以及相应的视觉全局定位方法。该方法包括离线的环境模型自主学习和在线的相机位姿推理过程。首先,利用回归树构建环境拓扑结构的自主学习模型,形成拓扑回归树,实现了拓扑地图的自主生成。进一步,利用回归森林对视觉点特征与几何空间位置的关联不确定性进行自主建模与管理,形成了特征点回归树。在线定位过程中,利用拓扑回归树对机器人进行拓扑定位,然后在拓扑节点内利用特征点回归树进行精细的几何定位。这种层次化的全局定位策略极大提升了定位过程中几何推理的效率。在此基础上,提出了一种基于图模型的特征关联推理方法,实现对特征空间位置预测的优化和相机的精确全局定位。在公开数据集的实验结果表明,本文方法能够在室内场景下取得较高的全局定位精度。3)为进一步提升视觉全局定位方法在不同类型场景下的适应能力,本文提出了一种基于多元几何信息的视觉全局定位方法。首先,建立了基于回归森林的环境点特征地图、线段特征地图以及稠密点云地图的特征-空间位置映射的自主学习方法。形成的点特征回归树和线段特征回归树,能够对观测到的点特征和线段特征进行全局空间位置预测。同时,在定位过程中,为了对环境表面的几何细节进行快速检索,利用回归树对环境稠密地图进行压缩表示。在线定位过程中,利用学习到的模型预测当前观测到的点和线段特征的三维空间位置,然后根据预测位置进行相机位姿估计。在位姿假设产生的过程中,构造了堆栈RANSAC框架,并利用环境稠密地图的压缩表示对位姿假设进行筛选。实验结果表明,本文方法在多种类型场景下都具有较高的全局定位性能。
陈淑巧[8](2019)在《词表示理论及其在自然语言处理中的应用研究》文中提出词表示理论是研究自然语言处理的基础,其将自然语言中的词从形式和意义上映射成为计算机能理解的语言,使人与计算机能进行更好的交流。词表示模型的优劣将对自然语言处理的结果产生极大的影响。本文将词表示理论与模糊集理论结合进行了研究,并讨论了其在自然语言处理中的应用。首先,本文介绍了目前已有的词表示理论模型,并利用余弦相似度平均值、Mikolov类比法、同义词检测三种评估方法讨论了上下文窗口大小、词向量维度和最小词频训练阈值对连续词袋模型训练词向量效果的影响。其次,考虑到词表示理论能有效解决数据稀疏问题,本文将其应用到模糊信息检索中,提出了一种基于词向量的模糊查询扩展方法和基于词向量的模糊信息检索模型。结合模糊数学对不确定信息的处理能力,利用词向量对查询输入信息进行扩展,计算查询输入信息与被检索数据库中的文本之间的隶属度,提高模糊信息检索模型的查准率和查全率。最后,因为专家评价的可靠性对于决策也是一个重要的考量,而Z数能很好地对模糊事件的可靠性进行度量,我们提出了基于Z数的机器翻译评价模型。通过该模型对采用不同词表示理论的机器翻译模型进行评价。
王楚[9](2018)在《基于模糊-粗糙集理论的社会媒体文本处理技术研究》文中提出近年来,随着众多社会媒体平台的诞生和发展,其作为一种在线用户交互的工具,正在越来越深刻地改变着人们的工作、生活和交流方式,同时也生成了海量的用户信息。广大用户在社会媒体中所生成的大量文本文件,已经成为大数据研究领域最具代表性的数据资源之一,对这些用户生成的文本数据进行研究有着广泛的学术和商业价值。社会媒体文本研究作为一种对社会媒体中大规模数据在不同应用上进行分析、处理、归纳和推理的信息处理技术,近些年来越来越吸引学术界和商业界的广泛关注,并已成功地应用在互联网的诸多领域。传统的社会媒体文本分析研究工作主要专注于从数据本身入手进行建模,往往忽视人类的语言逻辑,从而影响了文本分析的质量。本文针对目前社会媒体文本分析存在的问题,利用模糊理论和粗糙集理论在不确定性分析领域所具有的优势,在多标签情感强度分析、多标签细粒度的情感检索、知识图谱的构建以及基于题目和摘要的学术论文资源推荐这四个方面进行研究,提出了新的算法,并构建了相应的模型。具体来说,本文的主要研究工作和创新点如下:(1)目前社会媒体文本情感分析中主要针对情感倾向分析或者情感单标签预测,而较少考虑多标签细粒度的情感、特别是未考虑情感强度。针对此研究现状,本文提出一种基于模糊-粗糙集理论的多标签情感强度分析方法。首先应用模糊关系方程来对训练集文本中出现的情感词进行建模,继而得到的情感词强度范围,然后将其代入到测试集文本中,利用改进的模糊粗糙集理论对这些文本进行建模,最终得到测试集文本的情感标签和情感强度。在中文博客数据集上的实验结果表明,本文所阐述的多标签情感强度分析模型在句子、段落和篇章这三个文本层级均具有优势和实用性,该模型可以更好地对多标签情感属性和强度作出预测。(2)目前流行的情感检索模型绝大部分基于关键词或者情感标签匹配,没有考虑到文本中所含有的多标签细粒度情感。针对此研究现状,提出了一种基于模糊关系度量的多标签细粒度情感检索方法。首先应用模糊关系方程来对情感词的情感标签及值域范围进行运算,然后基于模糊格贴近度将所得到的情感标签和强度进行建模,在此基础上计算文本之间情感标签及强度相似性距离,得到检索结果。在中文博客数据集上的实验结果表明,本文提出的方法在准确度和实用性的综合考量下具有明显的优势。(3)目前基于TransE改进的众多翻译模型为了达到更好的分类结果,频繁地引入其他复杂数学模型,从而导致其算法复杂度越来越高,所需要的训练集越来越大,训练时间越来越长。针对此研究现状,提出了一种基于模糊集理论的社会媒体知识图谱构建方法。应用模糊关系矩阵运算的方法对现有的基于翻译的知识图谱模型进行改进,将模糊矩阵方程运算与深度学习的模型互相融合,构建了基于模糊理论的TransF模型。在WordNet和FreeBase中选取的数据集上的实验结果表明,本文所构建的基于模糊理论的知识图谱模型不但减少了所需参数并简化了训练过程,缩短了训练时间,而且在数据集规模不大的情况下表现出更大的优势。(4)现有的学术论文资源推荐的系统应用中大多仅仅根据关键词匹配,在同一概念对应不同关键词的情况下,很难推荐出相关论文。针对此现状,提出了一种基于粗糙-模糊集理论的学术论文资源推荐方法。首先利用TF-IDF算法提取学术文献中的关键词,再使用WordNet计算待推荐论文库中存在的关键词与输入查询论文关键词之间的相似性,最后利用粗糙模糊集模型针对这些关键词相似性建模,从而计算出两篇文档的相似性,最终依据相似性的排序向用户推荐感兴趣的论文。在UCI数据集上的实验结果表明,构建的推荐模型在准确性、时间性能以及综合实用性方面都有着更佳的表现。综上所述,本文基于模糊理论和粗糙集理论在处理不确定性问题和人类语言逻辑方面所具有的优势,研究社会媒体文本分析和处理的方法和技术。在多标签情感强度分析、基于多标签细粒度的情感检索、知识图谱的构建以及基于题目和摘要的学术论文资源推荐四个方面取得了研究成果。实验结果表明模糊集理论和粗糙集理论在社会媒体分析的研究中可以发挥很大的作用。本文的研究成果将为更好地建立和实现社会媒体文本处理的相关工作提供理论基础和技术支持。
杨海锋[10](2017)在《融合结构功能和引文功能的学术文献引文推荐研究》文中研究指明随着物联网、云计算以及“互联网+”等相关应用的不断深入,用户在享受互联网技术带来便捷的同时,也陷入了“信息过载”的困境中。用户在满足信息需求的过程中,发现自己已经迷失在信息的海洋中。推荐系统作为一种个性化的信息服务形式,能基于用户兴趣偏好来进行主动的实时推荐,并且已经被广泛的使用在了各大购物网站中。同时,随着不同组织对数字文献资源建设力度的加大,用户在享受数字文献资源便利性的同时也遇到了一些困难,比如相关文献的查找费时费力而且查询结果不能令人满意。为此,学术文献的引文推荐研究逐渐受到了学者们的关注,该研究能在一定程度上提高用户撰写论文的效率和质量,目的是能自动的发现用户手稿中需要引文的位置,并提供相关的文献。和一般推荐系统不同,引文推荐服务的对象一般是科研工作者,而且推荐的内容是学术文献,推荐过程中涉及到了引文分析、引用动机、作者自身特点等多种因素的影响。因此,引文推荐系统不仅仅是推荐系统的具体应用,而且更应该看成是推荐系统的延伸和拓展。对于引文推荐研究,国外研究较早,国内研究刚刚起步,且研究主要是从推荐算法的改进来着手,而深入文献内部,从学术文献结构功能和引文功能的角度来对其探讨基本空白。基于此,本文以结构功能和引文功能作为研究切入点,融合传统推荐方法来提高引文推荐的效果。本文共分7章,主要内容如下:第一章,引言。首先说明了本文研究的背景和意义。然后在大量文献调研的基础上,从局部引文推荐和全局引文推荐两个方面进行文献综述,对引文推荐的方法进行了总结,并对引文推荐目前的研究现状进行了评述,交代了本文研究的可行性。然后,在上述工作的基础上,提出了本文研究思路和方法以及研究内容和创新点。第二章,学术文献引文推荐相关理论研究。从一般推荐系统的介绍入手,对引文推荐系统进行了界定,其中包括引文推荐的定义、引文推荐的特点、引文推荐的分类。接下来通过四个模块对引文推荐的流程进行了介绍,以便和一般推荐系统工作过程进行区别。同时发现,对于引文推荐结果的评价,主要是以信息检索评价方法为基础,同时结合引文推荐特点而被提出。由于引文推荐的特殊性,这里还分析了引文推荐实验中使用的数据集,以及引文推荐过程中区别于一般推荐系统的用户行为。最后,基于引文上下文和引文推荐之间的紧密型,对引文上下文的研究进行了小结。第三章,学术文献引文推荐理论框架。本文首先提出了引文推荐总的理论框架,然后着重介绍了本文实现引文推荐的动机和总体框架。主要包括基于结构功能的引文推荐和基于引文功能的引文推荐,以及基于信息融合方法将两种推荐方法融合进行推荐。第四章,基于结构功能的学术文献引文推荐。首先是对文献进行结构功能划分,然后将引文上下文作为查询和不同结构功能组成的文献进行加权匹配。具体包括局部加权匹配和全局加权匹配。局部加权匹配是查询和全文及某结构功能部分(事先通过相似性确定)的加权匹配,而全局加权匹配是查询在文献中不同结构功能之间的总体匹配。同时,实验中还对不同结构功能对查询的贡献度进行了分析。第五章,基于引文功能的学术文献引文推荐。主要思想是想明确用引文上下文来表示文档(相当于摘要表示文档)以此生成对应查询的概率是否更高。研究涉及两种方法,一种是在初步引文推荐的基础上,使用引文上下文来表示文档,然后进行二次推荐,另一种是直接通过引文上下文来表示文档,然后通过传统的方法进行推荐。结果表明,文档集的再组织能比较好的提高引文推荐的效果。第六章,基于结构功能和引文功能融合的引文推荐。以基于得分和排序的信息融合方法对结构功能和引文功能推荐进行融合推荐,主要从三个方面进行了研究:一是将查询定位到不同的结构功能域中,然后对各个推荐结果进行不同维度的融合;二是对第五章和第六章研究中的推荐结果的融合;三是采用了伪相关反馈技术以便能更加充分的对推荐模型进行训练,从而提高融合推荐的效果。第七章,研究总结与展望。在对本文研究全面总结的基础上,提出了本文研究的不足以及相关的后续研究。
二、一种改进的Fuzzy信息检索方法及其应用(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一种改进的Fuzzy信息检索方法及其应用(论文提纲范文)
(1)基于在线评论信息的商品排序模型研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与问题提出 |
1.1.1 研究背景 |
1.1.2 研究问题的提出 |
1.2 研究目的及意义 |
1.2.1 研究目的 |
1.2.2 研究意义 |
1.3 国内外研究现状及评述 |
1.3.1 在线商品排序的研究现状 |
1.3.2 直觉模糊集和直觉模糊得分函数的研究现状 |
1.3.3 犹豫模糊集和犹豫模糊得分函数的研究现状 |
1.3.4 属性关联和TODIM模型的研究现状 |
1.3.5 国内外文献综述的评述 |
1.4 本研究的内容、方法和技术路线 |
1.4.1 研究内容 |
1.4.2 主要研究方法 |
1.4.3 技术路线 |
第2章 基于在线评论的商品排序基础理论 |
2.1 在线评论及相关理论 |
2.1.1 在线评论的概念 |
2.1.2 在线评论的内涵 |
2.1.3 在线评论的特征 |
2.1.4 常用的情感词典和情感语料 |
2.2 直觉模糊集及相关理论 |
2.2.1 直觉模糊集 |
2.2.2 直觉模糊集运算法则 |
2.2.3 直觉模糊距离测度公式 |
2.2.4 直觉模糊集结算子 |
2.3 犹豫模糊集及相关理论 |
2.3.1 犹豫模糊集 |
2.3.2 犹豫模糊数运算法则 |
2.3.3 犹豫模糊距离测度公式 |
2.4 模糊测度和模糊积分理论 |
2.4.1 模糊测度 |
2.4.2 模糊积分 |
2.5 TODIM决策模型的基本原理 |
2.6 在线商品排序的内涵 |
2.7 本章小结 |
第3章 模糊环境下的商品特征情感量化模型 |
3.1 研究框架和设计思路 |
3.2 在线商品评论中属性特征的抽取 |
3.2.1 文本特征 |
3.2.2 特征词、情感词和情感修饰词的范围界定 |
3.2.3 在线评论文本集的预处理 |
3.2.4 在线评论中特征词,情感词,情感修饰词的提取 |
3.3 情感词典的构建 |
3.3.1 基础情感词典 |
3.3.2 网络用语情感词典 |
3.4 情感极性模糊性的问题分析 |
3.4.1 情感词的情感极性强度模糊性分析 |
3.4.2 情感修饰词的情感极性强度模糊性 |
3.5 直觉模糊环境下商品特征情感量化模型的构建 |
3.5.1 直觉模糊环境下情感词和情感修饰词的情感极性强度量化 |
3.5.2 直觉模糊环境下特征词的情感量化模型 |
3.5.3 决策步骤 |
3.6 犹豫模糊环境商品特征情感量化模型的构建 |
3.6.1 犹豫模糊环境下情感词和情感修饰词的情感极性强度量化 |
3.6.2 犹豫模糊环境下特征词的情感量化模型 |
3.6.3 决策步骤 |
3.7 本章小结 |
第4章 基于改进直觉模糊TODIM模型的在线商品排序研究 |
4.1 直觉模糊得分函数 |
4.1.1 现有的直觉模糊得分函数 |
4.1.2 改进的直觉模糊得分函数 |
4.1.3 比较分析 |
4.2 基于2 可加Choquet模糊积分的直觉模糊TODIM模型 |
4.2.1 2 可加模糊测度和2可加Choquet模糊积分 |
4.2.2 现有的属性关联TODIM决策方法 |
4.2.3 交互作用系数的计算 |
4.2.4 基于2可加Choquet模糊积分的方案相对优势度的计算 |
4.2.5 决策步骤 |
4.2.6 算例分析 |
4.2.7 参数的敏感性分析 |
4.3 实证分析 |
4.3.1 实验数据 |
4.3.2 数据获取 |
4.3.3 数据预处理 |
4.3.4 直觉模糊环境下在线手机评论的情感分析 |
4.3.5 决策步骤 |
4.3.6 参数的敏感性分析 |
4.3.7 比较分析 |
4.4 本章小结 |
第5章 基于改进犹豫模糊TODIM模型的在线商品排序研究 |
5.1 犹豫模糊得分函数 |
5.1.1 现有的犹豫模糊得分函数 |
5.1.2 改进的犹豫模糊得分函数 |
5.1.3 比较分析 |
5.2 基于2可加Choquet模糊积分的犹豫模糊TODIM模型 |
5.2.1 基于2可加Choquet模糊积分的方案相对优势度的计算 |
5.2.2 决策步骤 |
5.2.3 算例分析 |
5.2.4 参数的敏感性分析 |
5.3 实证分析 |
5.3.1 犹豫模糊环境下在线手机评论的情感分析 |
5.3.2 决策步骤 |
5.3.3 参数的敏感性分析 |
5.3.4 比较分析 |
5.4 本章小结 |
结论 |
参考文献 |
附录1 程度副词和否定词 |
附录2 基于Python的天猫平台手机产品评论爬虫程序 |
攻读学位期间发表论文与研究成果 |
攻读博士学位期间参与的科研项目 |
致谢 |
个人简历 |
(2)科学数据用户相关性判断模型研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 研究目标与内容 |
1.3 研究设计 |
第二章 用户相关性研究综述 |
2.1 信息科学中的相关性 |
2.1.1 相关性理论 |
2.1.2 相关性研究视角 |
2.1.3 相关性概念 |
2.2 用户相关性判断 |
2.2.1 相关性判断的驱动力——信息需求 |
2.2.2 相关性判断发生的情境——信息交互过程 |
2.2.3 用户相关性判断模型 |
2.3 用户相关性标准 |
2.3.1 相关性标准的定义与功能 |
2.3.2 用户相关性标准识别研究 |
2.3.3 相关性标准使用研究 |
2.4 本章小结 |
第三章 科学数据及其查询与检索研究 |
3.1 科学数据的重要性分析 |
3.1.1 社会信息中的科学数据 |
3.1.2 科学研究中的科学数据 |
3.2 数据以及科学数据概念与特征 |
3.2.1 数据的基本概念与特征 |
3.2.2 科学数据的概念与特征 |
3.3 科学数据认知与期望 |
3.4 科学数据发现与检索 |
3.4.1 系统导向的科学数据检索实践 |
3.4.2 用户导向科学数据查询与检索探索 |
3.4.3 科学数据查询与检索面临的问题 |
3.5 科学数据相关性判断模型研究必要性与意义 |
3.5.1 科学数据相关性判断研究的必要性 |
3.5.2 科学数据相关性判断研究的意义 |
3.6 本章小结 |
第四章 科学数据用户相关性判断模型研究设计 |
4.1 概念假设模型 |
4.1.1 概述 |
4.1.2 理论依据 |
4.1.3 认识导向的相关性判断假设性概念模型 |
4.2 研究目的、目标与科学问题 |
4.3 研究设计 |
4.3.1 研究方法论 |
4.3.2 技术路线 |
4.3.3 研究策略 |
4.4 本章小结 |
第五章 科学数据用户相关性判断描述性概念模型研究 |
5.1 概述 |
5.2 研究设计 |
5.2.1 概念模型与科学问题 |
5.2.2 研究过程 |
5.3 被试遴选 |
5.4 数据收集 |
5.4.1 检索前访谈 |
5.4.2 相关性判断行为测量与数据采集 |
5.4.3 检索后访谈—情境再入式半结构化访谈 |
5.5 数据处理与分析 |
5.5.1 编码与内容分析 |
5.5.2 眼动数据处理 |
5.6 研究结果与分析 |
5.6.1 科学数据相关性标准识别 |
5.6.2 科学数据信息元(SDIEs)及其与标准之间的关系 |
5.6.3 科学数据用户相关性/有用性 |
5.6.4 相关性判断的认知加工特征分析 |
5.6.5 决策规则识别 |
5.6.6 科学数据用户相关性判断描述性概念模型总结 |
5.7 研究发现与结论 |
5.7.1 科学数据相关性判断的认知整合/透镜过程 |
5.7.2 科学数据相关性标准结构TAQA-U及其价值 |
5.7.3 科学数据相关性标准特征分析 |
5.7.4 科学数据相关性判断的多标准决策认知本质 |
5.8 本章小结 |
第六章 科学数据用户相关性判断实证性量化模型研究 |
6.1 概述 |
6.2 研究设计 |
6.2.1 研究问题 |
6.2.2 研究过程 |
6.3 第一阶段:描述性验证 |
6.3.1 被试遴选 |
6.3.2 数据收集 |
6.3.3 数据分析 |
6.3.4 研究结果 |
6.4 第二阶段:实证性量化研究 |
6.4.1 概念模型与研究假设 |
6.4.2 数据收集与处理 |
6.4.3 研究结果与分析 |
6.5 研究发现与结论 |
6.5.1 科学数据用户相关性标准使用特征分析 |
6.5.2 基于相关性标准结构的科学数据用户相关性判断模式分析 |
6.6 本章小结 |
第七章 多标准相关性排序(MCRR)算法及其应用框架设计 |
7.1 概述 |
7.2 MCRR多标准相关性排序算法 |
7.2.1 算法需求 |
7.2.2 算法设计 |
7.2.3 MCRR算法流程 |
7.2.4 算法功能与价值 |
7.3 应用框架设计 |
7.3.1 用户导向的科学数据查询与检索模型 |
7.3.2 基于MCRR算法的科学数据查询与推荐系统框架 |
7.3.3 框架特色介绍 |
7.4 本章小结 |
第八章 结论与展望 |
8.1 研究结论 |
8.1.1 提出并验证了科学数据用户相关性判断模型 |
8.1.2 探索了多标准相关性性排序算法及其应用框架 |
8.2 创新性分析 |
8.2.1 理论创新 |
8.2.2 研究方法创新 |
8.3 研究不足与未来研究 |
8.3.1 研究不足 |
8.3.2 未来研究与展望 |
参考文献 |
附录 A |
附录 B |
附录 C |
附录 D |
致谢 |
作者简历 |
(3)密度峰值聚类的优化及其应用研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
第一节 研究背景和研究意义 |
一、研究背景 |
二、研究意义 |
第二节 密度峰值聚类研究综述 |
第三节 研究内容与研究框架 |
一、研究思路 |
二、研究方法 |
三、研究框架 |
第四节 研究的创新与不足 |
一、研究的创新之处 |
二、研究的不足之处 |
第二章 聚类分析的相关理论基础 |
第一节 数据属性的类型 |
一、常见数据类型概述 |
二、常见数据二维展示 |
第二节 聚类分析的方法 |
一、常见聚类算法概述 |
二、常见数据聚类思路 |
第三节 聚类分析的质量评价 |
一、内部有效性指标 |
二、外部有效性指标 |
三、相对有效性指标 |
第四节 密度峰值聚类算法 |
一、相关定义 |
二、决策图 |
三、样本分配机制 |
四、算法步骤描述 |
五、算法复杂度分析 |
第五节 本章小结 |
第三章 基于相对密度优化的密度峰值聚类 |
第一节 算法思想 |
第二节 相关定义 |
第三节 算法步骤 |
第四节 时间复杂度分析 |
第五节 实验结果与分析 |
一、人工数据集 |
二、真实数据集 |
三、参数敏感性分析 |
四、算法运行效率分析 |
第六节 本章小结 |
第四章 基于共享近邻和统计检验的流形聚类 |
第一节 算法思想 |
第二节 相关定义 |
一、相似性度量 |
二、压缩稀疏图 |
三、轮廓系数 |
四、非参数检验 |
第三节 算法步骤 |
第四节 时间复杂度分析 |
第五节 实验结果与分析 |
一、人工数据集 |
二、真实数据集 |
三、参数敏感性分析 |
四、算法运行效率分析 |
第六节 本章小结 |
第五章 优化算法在电子病历文本挖掘中的应用 |
第一节 文本预处理 |
一、样本筛选 |
二、中文分词去停用词 |
三、文本向量化 |
四、特征降维 |
五、相似性度量 |
第二节 电子病历文本挖掘 |
一、主题数目选择 |
二、电子病历文本挖掘步骤 |
第三节 实验结果与分析 |
一、数据来源 |
二、实验环境 |
三、实验结果及分析 |
第四节 本章小结 |
第六章 主要结论与展望 |
第一节 主要结论 |
第二节 展望 |
参考文献 |
附录 |
致谢 |
在读期间科研成果 |
(4)基于犹豫模糊权重的数学表达式检索模型研究(论文提纲范文)
摘要 |
abstract |
第一章 引言 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 数学表达式检索的研究现状 |
1.2.2 犹豫模糊集研究现状 |
1.3 研究内容及主要工作 |
1.4 本文组织结构 |
第二章 相关理论技术 |
2.1 FDS结构 |
2.2 犹豫模糊集理论 |
2.3 本章小结 |
第三章 基于运算符特征的数学表达式检索方法 |
3.1 数学表达式骨架提取 |
3.1.1 运算符骨架特征 |
3.1.2 运算符骨架存储结构 |
3.1.3 运算符骨架结构提取算法 |
3.2 基于运算符特征的相似数学表达式定义 |
3.3 基于运算符特征的数学表达式索引结构 |
3.4 基于运算符特征的数学表达式匹配算法 |
3.5 实验结果与分析 |
3.5.1 实验环境与实验数据 |
3.5.2 基于运算符特征的数学表达式检索性能分析 |
3.6 本章小结 |
第四章 犹豫模糊权重子式检索模型 |
4.1 基于犹豫模糊权重子式的检索方法总体流程 |
4.2 基于FDS的数学表达式子式提取算法 |
4.3 数学表达式的犹豫模糊测度 |
4.4 基于犹豫模糊权重的倒排索引构建 |
4.5 犹豫模糊权重子式匹配算法 |
4.5.1 数学表达式检索 |
4.5.2 数学表达式相似度得分归一化 |
4.6 实验结果与分析 |
4.6.1 实验环境与实验数据 |
4.6.2 实验参数α与 λ值的确定 |
4.6.3 基于犹豫模糊权重子式的数学表达式检索性能分析 |
4.7 本章小结 |
第五章 总结与展望 |
5.1 工作总结 |
5.2 后续工作展望 |
参考文献 |
致谢 |
攻读硕士学位期间取得的科研成果 |
(5)容错粗糙集在自然语言处理中的应用研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 研究现状 |
1.3 论文主要工作和章节安排 |
第2章 预备知识 |
2.1 粗糙集理论及其相关定义 |
2.2 容错粗糙集理论 |
2.3 Z数及其相关定义 |
第3章 容错粗糙集在文本表示中的应用 |
3.1 文本表示 |
3.2 词袋模型 |
3.3 基于容错粗糙集的词袋模型文本表示 |
3.4 实验与分析 |
3.4.1 数据集和预处理 |
3.4.2 实验设置 |
3.4.3 评价指标 |
3.4.4 实验结果和分析 |
3.4.5 共现度阈值 |
3.5 本章小结 |
第4章 容错粗糙集在语句相似度中的应用 |
4.1 语句相似度计算 |
4.2 改进的容错粗糙集模型 |
4.3 基于概率容错粗糙集的语句相似度计算 |
4.4 实验与分析 |
4.4.1 数据集和预处理 |
4.4.2 评估指标 |
4.4.3 实验结果和分析 |
4.4.4 余弦相似度阈值 |
4.4.5 概率值α和β |
4.5 本章小结 |
第5章 容错粗糙集在机器翻译评价中的应用 |
5.1 Z数的转换 |
5.2 基于容错粗糙集和Z数的机器翻译评价模型 |
5.3 案例分析 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 全文总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读硕士学位期间从事的科研工作及取得的成果 |
(6)贝叶斯学习算法及其应用研究(论文提纲范文)
作者简历 |
摘要 |
abstract |
第一章 绪论 |
1.1 论文的研究背景和意义 |
1.2 论文的研究内容 |
1.3 论文的组织结构 |
第二章 贝叶斯算法相关研究概述 |
2.1 贝叶斯算法基本概念 |
2.1.1 贝叶斯学习简介 |
2.1.2 朴素贝叶斯算法简介 |
2.1.3 变分贝叶斯算法简介 |
2.2 朴素贝叶斯算法研究概述 |
2.2.1 结构扩展的方法 |
2.2.2 实例加权的方法 |
2.2.3 局部学习的方法 |
2.3 变分贝叶斯算法研究概述 |
2.3.1 变分自编码器的变体形式 |
2.3.2 变分自编码器在自然语言处理的应用 |
2.4 贝叶斯算法实践应用的四项挑战 |
2.5 本章小结 |
第三章 基于条件似然对数的朴素贝叶斯分类算法 |
3.1 引言 |
3.2 SP-TAN算法概述 |
3.3 提出的方法 |
3.3.1 类概率估测质量评价方法 |
3.3.2 算法框架 |
3.3.3 算法复杂度分析 |
3.4 实验结果与分析 |
3.4.1 实验数据 |
3.4.2 标准数据集结果分析 |
3.4.3 实际应用数据集结果分析 |
3.4.4 其他评价指标 |
3.5 本章小结 |
第四章 差分进化的朴素贝叶斯实例加权算法 |
4.1 引言 |
4.2 代价敏感学习方法概述 |
4.3 差分进化算法概述 |
4.4 提出的方法 |
4.4.1 问题描述 |
4.4.2 方法概述 |
4.4.3 算法框架 |
4.5 实验结果与分析 |
4.5.1 实验数据 |
4.5.2 对比算法 |
4.5.3 结果分析 |
4.6 本章小结 |
第五章 差分进化的朴素贝叶斯多噪声标记质量估测算法 |
5.1 引言 |
5.2 多噪声标记集成方法概述 |
5.3 提出的方法 |
5.3.1 问题描述 |
5.3.2 提出的标记集成策略 |
5.3.3 算法框架 |
5.4 实验结果与分析 |
5.4.1 实验数据 |
5.4.2 对比算法 |
5.4.3 结果分析 |
5.5 本章小结 |
第六章 基于变分自编码器的关系抽取算法 |
6.1 引言 |
6.2 文本表示模型简介 |
6.3 知识库问答研究概述 |
6.4 提出的方法 |
6.4.1 问题描述 |
6.4.2 问句和谓语的表示 |
6.4.3 变分后验估计 |
6.4.4 优化策略 |
6.5 实验结果与分析 |
6.5.1 实验数据 |
6.5.2 参数选取 |
6.5.3 对比算法 |
6.5.4 结果分析 |
6.6 本章小结 |
第七章 总结与展望 |
7.1 本文工作总结 |
7.2 未来工作展望 |
致谢 |
参考文献 |
附录 英文缩写清单 |
(7)基于多源不确定性建模的移动机器人室内全局定位方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状与分析 |
1.2.1 环境的表达方法 |
1.2.2 移动机器人全局定位 |
1.2.3 全局路径规划方法 |
1.2.4 不确定性信息处理方法 |
1.3 本文主要研究内容 |
1.4 主要工作与章节安排 |
1.4.1 主要工作 |
1.4.2 章节安排 |
第2章 移动机器人环境观测与状态估计模型 |
2.1 引言 |
2.2 环境观测模型 |
2.2.1 激光观测模型 |
2.2.2 视觉观测模型 |
2.3 移动机器人状态估计模型 |
2.3.1 基于激光的移动机器人状态估计 |
2.3.2 基于视觉的移动机器人状态估计 |
2.4 移动机器人路径规划 |
2.4.1 路径规划问题描述 |
2.4.2 环境表达模型 |
2.4.3 路径规划算法 |
2.4.4 路径规划结果 |
2.5 本章小结 |
第3章 基于定性粒子滤波器的激光全局定位方法 |
3.1 引言 |
3.2 定性粒子及环境表达模型 |
3.3 定性运动模型 |
3.4 定性观测模型 |
3.5 全局定位方法 |
3.5.1 粒子集初始化 |
3.5.2 粒子集迭代更新 |
3.5.3 粒子关联 |
3.6 基于定性粒子滤波器的全局定位算法框架 |
3.7 实验验证与分析 |
3.7.1 仿真实验及其分析 |
3.7.2 在线实验 |
3.8 本章小结 |
第4章 基于回归森林的视觉全局定位方法 |
4.1 引言 |
4.2 基于回归森林的环境特征学习 |
4.2.1 特征点回归模型 |
4.2.2 环境拓扑结构学习 |
4.3 在线全局定位 |
4.3.1 点集匹配的图模型构建 |
4.3.2 基于图割的内点集合估计 |
4.3.3 基于回溯策略的预测校正 |
4.3.4 机器人位姿估计优化 |
4.4 算法总体框架 |
4.5 实验验证与分析 |
4.5.1 算法有效性验证与分析 |
4.5.2 公共数据集实验结果 |
4.5.3 在线运行时间分析 |
4.6 本章小结 |
第5章 基于多元几何特征的视觉全局定位方法 |
5.1 引言 |
5.2 基于回归森林的多元几何特征学习 |
5.2.1 线段特征及其参数化表示方法 |
5.2.2 基于回归树的线段特征学习 |
5.2.3 基于回归树的面元特征学习 |
5.3 相机全局位姿估计 |
5.3.1 基于线段特征的位姿假设估计 |
5.3.2 基于堆栈RANSAC的相机位姿估计 |
5.3.3 位姿假设选择 |
5.3.4 位姿优化 |
5.4 算法总体框架 |
5.5 实验验证与分析 |
5.5.1 方法验证 |
5.5.2 数据集实验结果 |
5.5.3 在线实验结果 |
5.5.4 在线性能分析 |
5.6 本章小结 |
第6章 总结与展望 |
6.1 论文总结 |
6.2 工作展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
(8)词表示理论及其在自然语言处理中的应用研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状及存在问题 |
1.3 论文主要工作 |
1.4 本文章节安排 |
第2章 预备知识 |
2.1 词表示方法及其相关理论 |
2.1.1 基于矩阵的词表示 |
2.1.2 基于聚类的词表示 |
2.1.3 基于神经网络的分布表示 |
2.2 模糊数及其相关定义 |
第3章 连续词袋模型与词向量表示研究 |
3.1 词向量表示方法 |
3.2 连续词袋模型 |
3.3 实验分析 |
3.3.1 评价方法 |
3.3.2 实验结果与分析 |
3.4 本章小结 |
第4章 词表示理论在信息检索中的应用 |
4.1 模糊检索 |
4.2 信息检索质量评价标准 |
4.3 基于词向量的模糊查询扩展方法 |
4.3.1 查询扩展 |
4.3.2 基于词向量的模糊查询扩展方法 |
4.3.3 实验与结果分析 |
4.4 基于词向量的模糊信息检索模型 |
4.5 本章小结 |
第5章 基于Z数的机器翻译评价模型 |
5.1 词表示理论在机器翻译中的应用 |
5.2 Z数及其的转换方法 |
5.2.1 Z数的基本理论 |
5.2.2 Z数的转换 |
5.3 基于Z数的机器翻译评价模型 |
5.4 案例分析 |
5.5 本章小结 |
第6章 总结及展望 |
6.1 全文总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读硕士学位期间从事的科研工作及取得的成果 |
(9)基于模糊-粗糙集理论的社会媒体文本处理技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 引言 |
1.1 研究背景 |
1.1.1 社会媒体 |
1.1.2 社会媒体文本分析 |
1.2 社会媒体的文本处理技术的研究现状 |
1.2.1 情感分析简介 |
1.2.2 情感检索简介 |
1.2.3 知识图谱简介 |
1.2.4 资源推荐简介 |
1.2.5 问题与挑战 |
1.3 本文主要研究内容及贡献 |
1.4 本文组织结构 |
第2章 相关理论及技术 |
2.1 社会媒体的文本情感分析 |
2.1.1 词语级情感分析 |
2.1.2 语句级情感分析 |
2.1.3 篇章级情感分析 |
2.2 情感检索 |
2.3 知识图谱模型 |
2.4 资源推荐 |
2.4.1 基于内容的推荐模型 |
2.4.2 基于协同过滤的推荐模型 |
2.4.3 混合推荐模型 |
2.5 模糊集和粗糙集理论 |
2.5.1 模糊集理论 |
2.5.2 模糊集理论在分类领域的研究概述 |
2.5.3 粗糙集理论 |
2.5.4 粗糙集理论在分类领域的研究概述 |
2.5.5 模糊集和粗糙集的结合 |
2.6 本章小结 |
第3章 基于模糊-粗糙集理论的多标签情感强度分析 |
3.1 问题提出 |
3.2 相关工作 |
3.3 相关理论及问题定义 |
3.3.1 模糊关系方程 |
3.3.2 多标签情感强度分析的问题描述 |
3.3.3 模型框架 |
3.4 基于模糊粗糙理论的多标签情感强度分析模型 |
3.4.1 基于模糊关系方程的词语情感标签和强度计算 |
3.4.2 基于改进模糊粗糙集的情感分析模型 |
3.4.3 基于改进模糊粗糙集的情感分析算法描述 |
3.5 实验与分析 |
3.5.1 数据集和评价指标 |
3.5.2 实验对比方法 |
3.5.3 实验结果 |
3.5.4 讨论与分析 |
3.6 本章小结 |
第4章 基于模糊关系度量的多标签细粒度情感检索 |
4.1 问题提出 |
4.2 相关工作 |
4.2.1 情感分类 |
4.2.2 情感检索 |
4.2.3 模糊检索 |
4.3 相关理论及问题定义 |
4.3.1 模糊格贴近度 |
4.3.2 多标签细粒度情感检索定义与描述 |
4.3.3 模型框架 |
4.4 基于模糊关系度量的多标签细粒度情感检索方法 |
4.4.1 基于格贴近度的多标签细粒度情感检索模型 |
4.4.2 多标签细粒度情感检索算法描述 |
4.5 实验与分析 |
4.5.1 数据集和评估方法介绍 |
4.5.2 实验步骤 |
4.5.3 实验结果 |
4.5.4 讨论与分析 |
4.6 本章小结 |
第5章 基于模糊集理论的社会媒体知识图谱构建 |
5.1 问题提出 |
5.2 相关工作 |
5.2.1 其他知识图谱模型 |
5.2.2 翻译模型的相关技术背景 |
5.3 相关理论及问题定义 |
5.3.1 模糊关系的合成 |
5.3.2 问题描述 |
5.3.3 模型的基本框架 |
5.4 基于模糊集理论的知识图谱构建 |
5.4.1 基于模糊关系合成的知识图谱翻译模型 |
5.4.2 目标优化 |
5.4.3 算法描述 |
5.5 实验与分析 |
5.5.1 数据集 |
5.5.2 衡量指标 |
5.5.3 三元组分类 |
5.5.4 链路预测 |
5.5.5 结果讨论 |
5.6 本章小结 |
第6章 基于粗糙-模糊集理论的学术论文资源推荐 |
6.1 问题提出 |
6.2 相关工作 |
6.2.1 基于内容的论文推荐 |
6.2.2 基于协同过滤的论文推荐 |
6.2.3 基于混合算法的论文推荐 |
6.3 相关理论及问题定义 |
6.3.1 TF-IDF词权重计算 |
6.3.2 基于WordNet的词语距离方法 |
6.3.3 基于粗糙模糊集理论的相似性计算 |
6.4 基于粗糙-模糊集理论的论文资源推荐模型 |
6.4.1 数据集分析及处理 |
6.4.2 基于欧几里得粗糙模糊集的相似性度量模型 |
6.4.3 论文推荐算法描述 |
6.5 实验与分析 |
6.5.1 正确的结果的判定方法 |
6.5.2 实验步骤与对比方法 |
6.5.3 实验结果 |
6.5.4 讨论与分析 |
6.6 本章小结 |
第7章 结论 |
7.1 论文工作总结 |
7.2 未来的工作及展望 |
参考文献 |
致谢 |
攻博期间发表的论文 |
攻博期间参与的科研项目 |
作者简介 |
(10)融合结构功能和引文功能的学术文献引文推荐研究(论文提纲范文)
论文创新点 |
摘要 |
Abstract |
1 引言 |
1.1 选题背景与研究意义 |
1.1.1 选题背景 |
1.1.2 研究意义 |
1.2 国内外研究现状分析 |
1.2.1 局部引文推荐研究现状 |
1.2.2 全局引文推荐研究现状 |
1.2.3 其他相关研究 |
1.2.4 引文推荐方法 |
1.2.5 研究评述 |
1.3 研究思路与方法 |
1.3.1 研究思路 |
1.3.2 研究方法 |
1.4 研究内容与创新点 |
1.4.1 研究内容 |
1.4.2 研究创新点 |
2 学术文献引文推荐相关理论研究 |
2.1 推荐系统简介 |
2.2 引文推荐的界定 |
2.2.1 引文推荐的定义 |
2.2.2 引文推荐的特点 |
2.2.3 引文推荐分类 |
2.3 引文推荐流程 |
2.4 引文推荐的评价 |
2.5 引文推荐中常用数据集 |
2.6 引文推荐中用户行为分析 |
2.7 引文推荐中的引文上下文 |
2.8 本章小结 |
3 学术文献引文推荐理论框架 |
3.1 学术文献结构和结构功能 |
3.2 引文功能 |
3.3 基于结构功能和引文功能进行引文推荐的动机 |
3.4 学术文献引文推荐框架 |
3.5 向量空间模型和语言模型 |
3.5.1 向量空间模型 |
3.5.2 语言模型 |
3.6 本章小结 |
4 基于结构功能的学术文献引文推荐 |
4.1 基于结构功能的引文推荐描述 |
4.2 结构功能识别方法 |
4.3 相似性度量 |
4.4 实验及其结果分析 |
4.4.1 数据集构建 |
4.4.2 结构功能识别 |
4.4.3 预处理 |
4.4.4 实验结果分析 |
4.5 本章小结 |
5 基于引文功能的学术文献引文推荐 |
5.1 引文功能类型选择 |
5.2 基于引文功能进行推荐的难点 |
5.3 引文功能分类方法 |
5.4 融入引文功能特征的推荐过程 |
5.4.1 融入引文功能推荐的思路和方法 |
5.4.2 引文上下文对文献的表示 |
5.4.3 文本语义相似度计算 |
5.5 实验过程 |
5.5.1 实验数据获取 |
5.5.2 引文功能识别与预处理 |
5.5.3 实验设计 |
5.6 结果分析 |
5.7 本章小结 |
6 基于结构功能和引文功能融合的引文推荐 |
6.1 信息融合相关研究 |
6.1.1 信息融合的定义及相关算法 |
6.1.2 信息融合在信息检索中的应用 |
6.2 CombSum算法 |
6.3 Borda算法 |
6.4 融合推荐方法的思路 |
6.5 实验及结果分析 |
6.5.1 实验数据与预处理 |
6.5.2 实验过程 |
6.5.3 结果分析 |
6.6 本章小结 |
7 研究总结与展望 |
7.1 研究总结 |
7.2 研究展望 |
参考文献 |
攻博期间的科研成果及奖励 |
致谢 |
四、一种改进的Fuzzy信息检索方法及其应用(论文参考文献)
- [1]基于在线评论信息的商品排序模型研究[D]. 张洞. 哈尔滨工业大学, 2020(02)
- [2]科学数据用户相关性判断模型研究[D]. 刘建平. 中国农业科学院, 2020(01)
- [3]密度峰值聚类的优化及其应用研究[D]. 张雨农. 安徽财经大学, 2020(08)
- [4]基于犹豫模糊权重的数学表达式检索模型研究[D]. 徐以聪. 河北大学, 2020(08)
- [5]容错粗糙集在自然语言处理中的应用研究[D]. 江海欢. 重庆邮电大学, 2020(02)
- [6]贝叶斯学习算法及其应用研究[D]. 邱晨. 中国地质大学, 2020(03)
- [7]基于多源不确定性建模的移动机器人室内全局定位方法研究[D]. 王纪凯. 中国科学技术大学, 2020(01)
- [8]词表示理论及其在自然语言处理中的应用研究[D]. 陈淑巧. 重庆邮电大学, 2019(02)
- [9]基于模糊-粗糙集理论的社会媒体文本处理技术研究[D]. 王楚. 东北大学, 2018(01)
- [10]融合结构功能和引文功能的学术文献引文推荐研究[D]. 杨海锋. 武汉大学, 2017(06)