一、All Admissible Linear Estimators under Quadratic Loss in Multivariate Model(论文文献综述)
韩贺东[1](2020)在《基于稳定权重目标最大似然估计模型的研究及其在真实世界研究中的应用》文中研究表明研究背景:随机对照试验是估计因果效应(处理效应)的金标准,它通过随机化保证了试验组间的均衡可比。近年来,真实世界研究受到研究者的广泛关注,它与随机对照试验一起为临床实践提供证据参考。在真实世界研究中,组间协变量的分布通常是不均衡的,从而导致处理的分配具有某种倾向性,使得处理因素与结局的因果路径上存在混杂因素。2020年1月,国家药监局起草发布的《真实世界证据支持药物研发与审评的指导原则(试行)》中指出:因果推断方法是真实世界数据的主要分析方法。基于倾向性评分逆概率权重(inverse probability treatment weight,IPTW)的一类方法是处理效应估计的重要方法,包括逆概率加权法,加权最小二乘法(weighted least square,WLS),增广的逆概率加权法(augmented IPTW,AIPTW)和目标最大似然估计法(targeted maximum likelihood estimation,TMLE),后三者具有双稳健的性质。上述方法估计处理效应时均基于Neyman-Rubin反事实模型,需要满足若干基本假定:无未观测混杂因素、正性假定(positivity)、个体处理稳定性假设和正确设定参数模型。然而,当倾向性评分值过大或过小时,将导致极端IPTW,从而违反或接近违反正性假定(near violation of positivity)。极端IPTW的出现将直接影响估计的偏倚和方差。因此,IPTW本身是一种不稳定权重。近年来,许多研究者提出更加稳定的倾向性评分权重方式如IPTW截断权重,并将它们与IPTW一起纳入均衡权重的体系。真实世界研究中,变量间的关系错综复杂,倾向性评分(处理模型)的设定可能出现错误。一旦模型错误设定,将导致效应估计产生偏倚。同样,基于结局模型的方法如G-计算也面临着错误设定的风险。双稳健估计提供了一种补救措施。只要处理模型和结局模型其中之一设定正确,估计结果就是一致的。TMLE是一种半参数、基于最大似然思想的双稳健估计方法。通过对初始结局的“迭代更新”过程,TMLE牺牲了无关参数的偏倚和方差,使得感兴趣参数的偏倚-方差平衡达到最优。TMLE具有许多优异的性能,如替代估计量的性质使得它在数据存在离群值和稀疏值时,比其他双稳健估计更加稳健。然而,有研究者提出极端IPTW仍可能对TMLE造成较大影响,并提出通过对倾向性评分或IPTW截断来解决。但这种处理方式改变了原来的数据结构,它的有效性也值得探索。鉴于此,构造权重更加稳定的TMLE是解决极端倾向性评分的一种研究思路。进一步,评估基于稳定权重TMLE的双稳健性质具有一定的研究意义。研究目的:(1)通过模拟及实例研究构建基于重叠权重等九种不同权重形式的倾向性评分加权法(propensity score weighting,PSW)、WLS、增广的倾向性评分加权法(augmented propensity score weighting,APSW)及TMLE,并与未校正和G-计算的结果比较,在不同的接受处理的对象比例和样本量下,评估组间不同倾向性评分重叠度下各方法的估计结果,探索稳定权重TMLE法的估计性能。同时,探讨IPTW不同程度的截断水平对标准TMLE估计的影响。(2)通过模拟及实例研究构建基于九种权重的估计方法,在不同接受处理的对象比例、样本量及倾向性评分重叠度下,评估各估计方法在四种不同的模型设定情景(处理模型正确结局模型正确、处理模型错误结局模型正确、处理模型正确结局模型错误、处理模型错误结局模型错误)下的效应估计结果,探索稳定权重TMLE法的双稳健性能。研究方法:基于以上两个研究目的,采取数据模拟、模型构建、模型评价及实例应用的流程开展本课题研究。分述如下:1、稳定权重目标最大似然估计在不同倾向性评分重叠度下的表现本研究采用蒙特卡洛方法模拟观察性真实世界数据。其中,处理因素为二分类变量,结局为连续性变量。模拟实验设置两种不同接受处理的对象比例(0.4和0.1)、三组样本量(250,1000和2500)、六种组间不同倾向性评分重叠度(γ=0.3,0.5,0.8,1.0,1.5和2.0),构建基于IPTW、IPTW(1-99%)截断、IPTW(5-95%)截断、IPTW(10-90%)截断、边际概率调整的IPTW(marginal probability adjusted IPTW,MPIPTW)、标准化的IPTW(normalized IPTW,NIPTW)、压缩估计的IPTW(shrunken IPTW,SHIPTW)、重叠权重(overlap weight,OW)和匹配权重(matching weight,MW)等九种不同形式倾向性评分权重的PSW、WLS、APSW及TMLE,并与未校正和G-计算的结果比较,查看各情景下九种权重的分布情况,探索IPTW不同水平的截断对标准TMLE估计结果的影响,评估稳定权重TMLE在组间不同倾向性评分重叠度下的估计效果。APSW及TMLE的标准误(standard error,SE)由bootstrap重采样法获得。采用权重、重叠系数(overlapping coefficient,OVL)、加权平均绝对标准化均值差异(weighted average absolute standardized mean difference,WAASMD)、绝对偏倚(absolute bias)、相对偏倚(relative bias)、均方根误差(root mean squared error,RMSE)、模型输出的SE、经验标准差(standard deviation,SD)和95%置信区间(confidence interval,CI)覆盖率等指标对估计结果进行评价。最后基于住院的真实世界数据,比较机器人辅助的前列腺癌根治术(RALRP)和开放的前列腺癌根治术(ORP)之间住院时长的差异,探究稳定权重TMLE在实例数据中的适用情况。2、稳定权重目标最大似然估计双稳健性能的探索采用蒙特卡洛方法进行处理因素为二分类变量,结局为连续性变量的数据模拟。实验设置两种不同接受处理的对象比例(0.4和0.1)、三组样本量(250,1000和2500)、两种组间不同倾向性评分重叠度(γ=0.3和2.0),构建基于IPTW、IPTW(1-99%)截断、IPTW(5-95%)截断、(10-90%)截断、MPIPTW、NIPTW、SHIPTW、OW和MW等九种不同形式倾向性评分权重的PSW、WLS、APSW及TMLE,并与未校正和G-计算的结果比较,查看处理模型正确和错误设定下权重的分布情况,在处理模型正确结局模型正确(Qcgc)、处理模型错误结局模型正确(Qcgw)、处理模型正确结局模型错误(Qwgc)及处理模型错误结局模型错误(Qwgw)四种不同的模型设定情景下评估各方法的效应估计结果,探索稳定权重TMLE的双稳健性能。其中错误模型是在正确模型的基础上遗漏交互项和高次项来实现。APSW和TMLE的标准误由bootstrap重采样法获得。采用权重、OVL、WAASMD、bias、RMSE、SE、SD和95%CI覆盖率等指标对估计结果进行评价。最后基于中国老年健康影响因素跟踪调查的纵向随访数据,探索老年人(65岁及以上)日常生活活动能力受损(activities of daily living disability,ADL受损)与认知功能减退之间的关系,探究稳定权重TMLE的双稳健性能在实例数据中的体现。本研究中模拟与实例均采用数据分析软件R 3.5.2实现。研究结果:1、稳定权重目标最大似然估计在不同倾向性评分重叠度下的表现(1)模拟研究结果:1随着组间倾向性评分重叠度的减弱,OVL逐渐减小,WAASMD逐渐增大,IPTW相关权重的极值与变异度越来越大,包括TMLE在内的各估计方法在所有情景下的性能指标均逐渐变差。2与接受处理的对象比例为0.4相比,为0.1的OVL更小,WAASMD更大,更容易出现极端IPTW,所有权重的TMLE的各指标表现均更差。3当对标准TMLE的IPTW进行截断时,随着截断水平的提高,偏倚有逐渐增加的趋势,而估计的总体效果越来越好,表现为SD,SE及RMSE逐渐变小。4重叠度好时,标准TMLE具有良好的估计效果;重叠度差时,标准TMLE在所有指标上的表现均最差。所有与IPTW相关稳定权重包括IPTW(1,99),IPTW(5,95),IPTW(10,90),MPIPTW,NIPTW和SHIPTW的TMLE均表现较差。5就偏倚而言,当重叠度好时,稳定权重TMLE与标准TMLE类似,其他指标(SD,SE,RMSE及95%CI覆盖率)有较小差异;当重叠度差时(γ=1.5或2),OW和MW为基础的稳定权重TMLE拥有更小的偏倚。6 MPIPTW和NIPTW的TMLE与标准TMLE的偏倚、SD及RMSE相等,但SE和95%CI覆盖率不同。7所有重叠度下,与标准TMLE相比,稳定权重TMLE均具有更小的SD,SE,RMSE及更好的95%CI覆盖率。其中,SHIPTW,OW及MW三种稳定权重为基础TMLE的各种指标性能最好,尤其是OW和MW的TMLE。8由于结局模型的设定是正确的,G-计算在所有情景下的各评价指标均有着不错的表现。IPTW相关的PSW在重叠度差时表现很差。各种情景下,与crude、G-计算、PSW及WLS相比,各种权重的TMLE与APSW在偏倚、SD、SE、RMSE及95%CI覆盖率方面均较优。(2)实例研究结果:实例分析共纳入3,916名患者,其中接受RALRP的比例为81.13%(n=3,177),接受ORP的比例为18.87%(n=739)。组间倾向性评分重叠度较好(OVL=0.8120),倾向性评分范围为0.3928-0.9002,不存在极端倾向性评分值,各种权重值均小于10。九种权重对应的WAASMD分别为0.0041,0.0390,0.0032,0.0025,0.0041,0.0041,0.0037,0和0.0002。各方法的结果基本一致且均具有统计学显着性:RALRP组患者的住院时长比ORP组更短。与Crude相比,校正潜在混杂因素后点估计变小,SE变大。与标准TMLE相比,稳定权重TMLE的点估计及SE均较大。考虑稳定权重TMLE,基于OW和MW的TMLE的SE较小、置信区间较窄。2、稳定权重目标最大似然估计双稳健性能的探索(1)模拟研究结果:1当接受处理的对象比例为0.4时,无论重叠度好坏,处理模型错误设定都导致权重平均值变大、变异度变小、极值变小和IPTW相关权重的WAASMD变小;当接受处理的对象比例为0.1且重叠度好时,错误设定导致权重变大、极值变小、变异度变小和WAASMD变小。而重叠度差时,错误设定导致权重、极值、变异度和WAASMD均变大。2各种情景下,以处理模型为核心的方法(如PSW)在处理模型错误设定时表现较差,而以结局模型为核心的方法(如G-计算)在结局模型错误设定时表现较差。3总体而言,四种模型设定下,与标准TMLE比,八种稳定权重TMLE表现出更小的RMSE,且以OW和MW为基础的TMLE最好。4本研究发现IPTW相关权重(包括IPTW、IPTW(1,99)、IPTW(5,95)、IPTW(10,90)、MPIPTW、NIPTW和SHIPTW)的APSW和TMLE受极端权重的影响大于受模型误设的影响。5在Qwgc和Qwgw两种设定下,与标准TMLE相比,八种稳定权重TMLE的所有指标(偏倚,SE,SD,RMSE及95%CI覆盖率)均是更优的。6同一情景下,遗漏交互项和高次项的错误设定处理模型减少了极端倾向性评分。此时,稳定权重TMLE在Qcgc时的估计效果略差于在Qcgw时的估计效果。7对于APSW和TMLE而言,结局模型的正确设定比处理模型的正确设定更加重要。以OW及MW为基础的APSW在结局模型错误设定时表现很差。8当重叠度很差,尤其接受处理的对象比例为0.1时,除OW和MW为基础的方法外,其余的估计效果均不理想。特别是Qwgw时,各种权重的TMLE和APSW的结果比crude的还要差。9四种模型设定情景下,与crude、G-计算、PSW及WLS相比,各种权重的TMLE与APSW在偏倚、SD、SE、RMSE及95%CI覆盖率方面均较优。10在Qwgw设定下,无论何种情景,各种权重的TMLE在偏倚、SD、SE、RMSE及95%CI覆盖率上均比相应权重的APSW表现更好。在Qwgc设定下,当重叠度好时,各种权重的TMLE在各指标上均比相应权重的APSW表现更好;而当重叠度差时,各种权重的TMLE在各指标上均比相应权重的APSW表现更差(OW和MW除外)。(2)实例研究结果:4,956名老年人中,ADL受损的比例为12.83%(n=636)。重叠度一般(OVL=0.5955),倾向性评分值的范围为0.00473-0.80024,存在极端倾向性评分值,IPTW存在较大的权重值,最大达到了71.52。九种权重对应的WAASMD为0.0105,0.0034,0.0217,0.0606,0.0105,0.0105,0.0045,0和0.0022。与Crude相比,校正潜在混杂因素后点估计变小,SE变大。除以NIPTW为基础的TMLE外,各方法的结论基本一致且均具有统计学意义,即ADL受损老年人的认知功能下降的程度更大。IPTW相关权重TMLE的点估计相近。在稳定权重TMLE中,OW与MW为基础的TMLE的点估计和SE较小。两种结局模型设定下,G-计算的结果基本一致,说明交互项的存在对处理效应的影响较小。整体来看,TMLE的结局模型中不包含交互项的点估计和SE比包含交互项的更大。研究结论:在真实世界研究中,极端权重和模型错误设定均可能影响估计的准确性。各种权重的TMLE受极端权重的影响大于受模型错误设定的影响,且结局模型的正确设定比处理模型的正确设定更加重要。处理模型的错误设定可影响极端权重的存在,进而影响效应的估计结果。采用倾向性评分权重相关方法如TMLE估计处理效应时,应首先查看组间倾向性评分的重叠度和权重的分布情况。模拟结果显示当重叠度较好或不存在极端权重时,各种权重的TMLE均表现良好;当重叠度较差或存在较多极端权重时,对标准TMLE的IPTW进行截断可改善估计效果,以IPTW(1,99)、IPTW(5,95)、IPTW(10,90)、MPIPTW、NIPTW、SHIPTW、OW和MW为基础的稳定权重TMLE比标准TMLE拥有更小的SD,SE,RMSE及更好的95%CI覆盖率,尤其OW和MW为基础的TMLE在重叠度很差时依然有良好表现。稳定权重TMLE具有较好的双稳健性能,尤其当两个模型均设定错误时。无论模型设定是否正确,以OW和MW为基础的TMLE均表现最好。综上所述,当重叠度较差、存在较多极端权重、接受处理的对象比例较低或对模型正确设定把握不足时,为获得更准确的估计效果,推荐以OW和MW为基础的稳定权重TMLE。
张会敏[2](2015)在《基于小域估计的贫困指标测度方法与模型研究》文中研究表明贫困、人口和污染是二十一世纪人类面临的三大问题,而贫困问题是其中最尖锐的问题,仍然困扰着大多数发展中国家甚至一些发达国家。改革开放三十多年,中国取得举世瞩目的经济成就,但贫困问题依然很严峻。对贫困问题的研究有助于让人们了解贫困产生原因、机制和动态,而研究贫困的首要工作是进行贫困指标测度,但是目前大多数国家和地区缺乏反映贫困的普查数据,而通过抽样调查等其它手段获取相关数据难度极大,因此数据缺失成为贫困指标测度的瓶颈。本文采用小域估计方法能够解决数据不足时的贫困指标测度问题。本文跟踪小域估计理论的最新研究成果,并将其用于数据不足、缺失甚至没有数据条件下的贫困指标测度。具体实证研究中,以中国贫困问题为研究对象,以阿马蒂亚·森的经典贫困理论为基础,结合FGT模型,运用小域估计方法估计非线性小域总体的贫困指标。为进一步对小域估计的估计结果进行评价,本文利用蒙特卡罗模拟和自举法计算了估计值的均方误差,并将其应用于中国贫困指标的随机模拟分析。借助模拟分析方法,贫困指标经验最优预测值在有偏性和均方误差方面表现良好。通过实证分析与模拟实验相结合的方法,本文得出如下的结论:(1)利用小域估计量和由“模拟”人口普查得到的辅助估计量可以减小贫困缺口的均方误差;(2)采用经验贝叶斯方法来估计小域里的贫困指标,采用自举的方法来获取均方误差的信值,结论显示经验贝叶斯方法要优于直接估计和ELL方法;(3)经验贝叶斯方法是一种基于设计和模型的方法,可被用于估计各种小域的数值(如贫困缺口).但经验贝叶斯很大程度上依赖干模型有效性,所以模型检验和选择尤为重要。本文的创新性工作主要体现在以下三个方面:1.研究了在数据很少、数据不全甚至没有数据情况下的贫困测度问题,运用小域估计对贫困指标进行测度。2.在没有普查数据的情况下,运用小域估计的方法,结合蒙特卡洛模拟实验和参数自举模拟作为辅助方法能够得到更加稳健的估计量。对贫困指标测度进行了改进,使得贫困指标测度更加准确,测量的误差范围更小3.运用小域估计方法对贫困指标进行测度,可以节省大量的人力物力,所以使得动态监测贫困问题成为可能。
黄莺[3](2014)在《小域估计抽样理论问题研究》文中提出小域估计一直是国际抽样调查理论研究的难点问题之一。尽管大数据时代已经来临,但传统的抽样调查不会消失,并且越来越多的抽样调查需要在对总体的目标变量进行有效估计的同时,也希望得到总体中各个小域的有效估计量,以满足多层次推断的需求。从理论上讲,这可以通过将需要推断的域进行划分使其作为层的子总体,从而应用分层抽样来解决。但在实际操作上成本必定高昂因而难以实现,而当对成本进行控制时,又因落入各个域的样本量过小导致常规的估计方法不能得到小域目标变量的有效估计量。为此,本文就基于设计和基于模型的小域估计理论进行了深入研究,并在小域估计方法上有所突破和拓展。主要从以下几个方面进行研究:首先,本文系统地梳理了国内外已有的几种提高小域估计效率的抽样设计,并按照对样本量影响机制的不同,将各种抽样设计分为匀化样本分布和域内增量两类,并通过比较各种抽样设计方法的设计思路和原理,提出了各种方法适用的场合。在系统研究国内外已有的基于设计的小域估计法的基础上,从理论上比较各估计量,指出各自的特点和彼此之间的联系和进一步的拓展。在此基础上,给出了部分估计量渐近方差表达式,并通过数值分析对各种估计方法的功效进行比较和总结。其次,本文针对存在双水平辅助信息的小域估计法进行研究。在传统的双水平小域估计模型基础上引入基于设计的校准估计法,提出了一种新的模型辅助的双水平校准估计量,并推导出该估计量的均方误差,从而将校准估计量在基于设计领域和基于模型领域进行了统一。该估计量不仅能够同时充分利用小域层次和单元层次的辅助信息,并且估计精度在某些情况下较BLUP估计量的表现更为优越,在实践领域也更具有实用性。最后,本文对蜂房结构总体下基于模型的小域加权估计法进行研究。考虑到我国的特殊国情,对我国政府抽样调查中最常见的蜂房结构总体进行了分析并建立蜂房模型。打破了现有的基于模型估计理论的局限,从加权的角度切入,’研究了另外一套估计法,即在基于模型的体系下引入基于设计框架下的校准约束,从而给出了基于蜂房模型的域加权估计量,其特别适用于我国的多层次推断需求的抽样调查下的域估计问题。
刘国科[4](2010)在《几种约束下生长曲线模型的容许性与泛容许性》文中研究说明本文研究了多元生长曲线模型的参数受到不同的不等式约束下回归系数在齐次线性估计类与非齐次线性估计类的容许性与泛容许性问题,得到了不少理论结果.本文总共分为五个部分,在综述部分,简单给出了线性模型容许性估计发展的历史以及国内外发展研究的现状,并在综述部分给出了本文所要作的主要研究工作。在第一章节中,首先给出了与线性模型容许性或泛容许性估计相关的矩阵基本知识,并给了线性函数模型(Yi,A0,A1X,σi2Σ(?)V)在不完全椭球X’A’1’NA1X≤σi2Σ(?)约束下的容许性估计,得到了引理1.3.1以及定理1.3.1-定理1.3.2.在第二章节中,我们研究了多元生长曲线模型(X’A’1’NA1X≤σi2Σ(?))在不完全椭球X’A’1’NA1X≤σi2Σ(?)约束下回归系数X分别在矩阵损失与二次损失下得到可估函数SXT在齐次线性估计类与非齐次线性估计类的几个泛容许性定理,即定理2.2.1-定理2.2.2.第三章节则在二次损失函数下给出了不完全椭球约束X’A’1’NA1X≤σi2Σ(?)与BX = C双重约束下可估函数SXT在齐次线性估计类与非齐次线性估计类的两个容许性充分必要条件及一个充分条件,即定理3.1.1-定理3.1.3;最后在第四章节中,给出了多元线性模型在不等式trRi′A2Θ≥0约束下回归系数与参数同时估计的容许性充要条件,即定理4.1.1-定理4.1.3,在等式NA2Θ= 0约束下回归系数与参数同时估计的容许性充要条件,即定理4.2.1-定理4.2.2.
贺建风[5](2010)在《多重抽样框方法及其应用研究》文中认为随着经济社会的快速发展,抽样调查中调查对象的流动日益频繁,传统的单一抽样框很难完整覆盖流动性的目标总体,如果一定要使单一抽样框实现完整覆盖,成本必定是高昂的,甚至由于编制过程漫长使抽样调查失去其时效性。本文突破传统抽样调查理论研究范畴,将传统基于单一抽样框的抽样调查扩展到基于多重抽样框的抽样调查情况,使多重抽样框可以实现对目标总体完整覆盖的基础上,还可以节省调查总成本。本文就多重抽样框的三方面问题进行了深入研究:其一:本文系统的梳理了国外已有的几种双重抽样框的估计方法,利用一个简单的估计模式将这些估计方法进行统一。在此基础上,给出了统一的估计量渐近方差表达式,并对各种估计方法的功效进行比较,此外,根据估计过程是否对抽样总体实行了关于子域的虚拟分解将已有的各种估计量分为分离抽样框估计量和组合抽样框估计量两类。在系统研究国外已有的双重抽样框估计方法的基础上,将已有估计量扩展到重数更多(大于2)的情形,并将扩展后的各估计量用一个的类似于HT估计量的简单形式进行统一,并给出相应的渐近方差计算公式。最后,针对各种估计方法的不足,提出估计量改进的具体思路,给出了基于抽样框重数的多重抽样框估计方法,模拟研究结果表明基于抽样框重数估计量相比较其他估计量具有更高的功效,且基本不受样本单元被错误归类影响。其二,本文针对多指标分层抽样、二阶段抽样及连续性抽样等抽样实践中常用的特定抽样调查的多重抽样框估计方法进行研究,以求为特定抽样形式下基于多重抽样框的抽样调查实践工作提供有关理论基础。对多指标分层抽样的情形下利用多重抽样框估计方法进行抽样设计,给出相应的简单估计量,并讨论了样本量的确定及层间的最优分配问题;在讨论多重抽样框情形下的二阶段抽样的估计方法时,利用最优化分析方法得出最优抽样权重系数及最佳样本量;在分析多重抽样框下的连续性抽样估计问题时,引入总体变动估计量,给出了简单随机抽样情形下的极大似然估计及复杂抽样设计下的伪极大似然估计。其三,本文通过全面分析我国统计调查体系中影响抽样框的现存问题,提出我国应用多重抽样框方法的必要性与可行性,以“三农”抽样调查为例,建立了基于多重抽样框的抽样调查体系,为涉及“三农”问题的实际调查工作者提供抽样方法上的指导。
雷刚[6](2009)在《电磁逆问题的统计分析方法》文中指出电磁场逆问题一直以来都是计算电磁学领域的研究热点。从应用的角度它可以分为两大类:参数辨识问题和优化设计问题。其中前者的本质是在给定的试验结果和试验参数的前提下,反演或重建出现这一结果的源参数及其电磁和物理特性;而后者的本质是给定某电磁系统期望的性能指标,然后通过参数的寻优来实现这一目标。本文的主要研究目的是为电磁场逆问题提供一套比较系统的统计推断方法和试验设计技术,包括经典的统计分析方法和现代的贝叶斯(Bayes)统计推断方法;从而为快速有效的分析电磁逆优化工程问题打下坚实的基础。首先,针对参数辨识问题,我们将常见的电磁逆问题纳入到多元线性逆问题的模型框架中来。核心研究内容有两个:其一是模型参数的经典统计学估计方法,主要包括极大似然估计量、最小二乘估计量及其加权形式的估计量、线性无偏估计量和最小范数估计量。其二是模型参数的Bayes估计方法,主要包括一般Bayes估计量、极大后验估计量和最小线性均方误差估计量。所有的这些估计量都是从不同的出发点,针对不同的模型假设下得到的。在Bayes反演方法中,我们还将详细的说明参数的先验信息和噪声信息的估计方法。随后还将结合蒙特卡洛(Monte Carlo)方法对铁磁流体微粒尺寸分布的估计问题进行实例分析,分析结果显示上述的统计估计方法都是非常有效的。同时我们也发现Bayes方法对噪声项的敏感性显着的低于经典统计学方法,而且结果的精度也优于前者,是一种值得推广的解决参数辨识问题的统计方法。其次,针对优化设计问题我们首先讨论了统计近似模型的拟合方法和试验技术的设计。其中近似模型部分主要从理论上研究了模型的重构理论与方法以及各个模型之间的关系:包括确定性参数的响应面模型、径向基函数模型和半参数的克热金(Kriging)模型。同时还将研究近似模型在我们提出的各种优化方法下的的最优选择策略问题。所有模型部分的理论基础均为经典统计学理论和试验设计与分析技术。随后,针对传统的独立研究优化算法和模型的缺点,我们提出了一种新的优化方法:序贯优化方法。它本质上是一个序贯采样的优化过程,能同时执行模型的拟合优化与算法的参数优化过程。通过对两个IEEE标准工程测试问题(TEAMWorkshop Problems 22 and 25)和两个数学验证函数的考察及分析,我们发现序贯优化方法对这类问题非常有效,对模型的选取没有依赖性,能在同样满足求解精度的要求下,将有限元的计算量降到不足直接优化方法的1/10。最后,针对高维电磁装置的优化设计问题,我们在序贯优化方法的基础上提出了降维优化方法。它通过两种降维技术(专家先验和试验设计技术)将一个高维的优化问题转化为一个只关于显着性参数的低维优化问题。从三个高维电磁装置的实际设计分析来看,这种新的方法同样非常有效,求解的精度也能达到设计的要求,同时能将有限元的计算量减少到约为直接优化方法的1/3左右。总之,序贯优化方法和降维优化方法对离散域、连续域,单目标、多目标,低维和高维的电磁装置优化设计问题都非常有效,可广泛的应用于工程电磁装置的优化设计问题之中。
二、All Admissible Linear Estimators under Quadratic Loss in Multivariate Model(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、All Admissible Linear Estimators under Quadratic Loss in Multivariate Model(论文提纲范文)
(1)基于稳定权重目标最大似然估计模型的研究及其在真实世界研究中的应用(论文提纲范文)
摘要 |
abstract |
缩略词表 |
第一部分 概述 |
一、研究背景 |
(一)真实世界研究中因果效应的估计 |
(二)倾向性评分与因果推断 |
(三)逆概率权重与极端权重 |
(四)模型错误设定与双稳健估计 |
(五)目标最大似然估计 |
二、研究目的与意义 |
(一)研究目的 |
(二)研究意义 |
第二部分 研究内容与步骤、技术路线 |
一、研究内容与步骤 |
(一)稳定权重目标最大似然估计在不同倾向性评分重叠度下的表现 |
(二)稳定权重目标最大似然估计双稳健性能的探索 |
二、研究技术路线 |
三、资料来源与研究平台 |
第三部分 稳定权重目标最大似然估计在不同倾向性评分重叠度下的表现 |
一、引言 |
二、研究方法 |
(一)常见处理效应估计方法 |
(二)倾向性评分权重的估计 |
(三)稳定权重目标最大似然估计的构建 |
(四)处理效应及标准误的估计 |
三、模拟研究 |
(一)模拟实验设计 |
(二)模拟实验结果 |
四、实例分析 |
(一)研究背景 |
(二)研究方法 |
(三)研究结果 |
五、讨论与小结 |
第四部分 稳定权重目标最大似然估计双稳健性能的探索 |
一、引言 |
二、研究方法 |
(一)基于逆概率权重的双稳健估计 |
(二)基于稳定权重的双稳健估计 |
三、模拟研究 |
(一)模拟实验设计 |
(二)模拟实验结果 |
四、实例分析 |
(一)研究背景 |
(二)研究方法 |
(三)研究结果 |
五、讨论与小结 |
第五部分 研究总结与展望 |
一、研究总结 |
二、研究特色和创新点 |
(一)稳定权重目标最大似然估计在不同倾向性评分重叠度下的表现 |
(二)稳定权重目标最大似然估计双稳健性能的探索 |
三、研究展望 |
(一)与机器学习算法的结合 |
(二)纵向随访数据中的方法实现 |
(三)多分类及连续性处理因素的扩展 |
(四)两分类结局模拟条件下的比较 |
(五)TMLE中多个结局时的变量选择问题 |
(六)基于TMLE的敏感性分析 |
参考文献 |
附录一 :数据模拟程序 |
附录二 :附图表 |
文献综述 真实世界研究中双稳健估计方法及其研究进展 |
参考文献 |
在读期间发表论文和参加科研工作情况 |
致谢 |
(2)基于小域估计的贫困指标测度方法与模型研究(论文提纲范文)
摘要 |
Abstract |
第1章 导论 |
1.1 本文选题背景、研究意义与目的 |
1.1.1 本文的选题背景 |
1.1.2 本文研究的目的和意义 |
1.2 国内外文献综述与研究现状 |
1.2.1 国外文献综述与研究现状 |
1.2.2 国内文献综述与研究现状 |
1.3 论文的基本思路、结构和研究内容 |
1.3.1 研究的基本思路 |
1.3.2 本文研究的结构 |
1.3.3 本文研究内容 |
1.4 论文研究的主要创新 |
第2章 贫困指标测度经典理论与方法 |
2.1 阿马蒂亚·森之前的贫困指标测度 |
2.2 阿马蒂亚·森贫困指标体系及贫困理论 |
2.2.1 阿马蒂亚·森贫困指标及其贫困理论概述 |
2.2.2 对阿马蒂亚·森贫困理论的评述 |
2.3 FGT模型及其贫困分解指数的优点 |
2.3.1 FGT模型介绍 |
2.3.2 FGT贫困分解指数的优点 |
2.4 ELL贫困指标测度方法介绍 |
2.4.1 Ell的基本思想 |
2.4.2 ELL模型的基本形式 |
2.4.3 对ELL模型的评述 |
第3章 基于设计的贫困指标测度的小域估计 |
3.1 小域估计的理论背景及说明 |
3.1.1 小域估计的理论背景 |
3.1.2 对小域估计相关符号的说明和注释 |
3.2 基于设计的小域估计 |
3.2.1 常用的基于设计的方法 |
3.2.2 基于设计的小域估计的一些新发展 |
3.2.3 基于设计的小域估计的优点和缺点 |
3.3 基于设计的贫困指标的直接估计 |
3.3.1 小域条件下FGT模型 |
3.3.2 贫困测度的直接估计量 |
第4章 基于模型的贫困指标测度的小域估计 |
4.1 基于模型的小域估计方法 |
4.1.1 一般公式与常用模型 |
4.1.2 基于模型的小域估计的新发展 |
4.2 信息抽样和非响应下的小域估计 |
4.3 模型的选择和检验 |
4.4 基于模型的贫困指标测度的小域估计 |
4.4.1 域条件下FGT贫困测度的经验贝叶斯方法 |
4.4.2 小域条件下FGT贫困测度的经验贝叶斯模拟预测 |
第5章 中国贫困指标测度的随机模拟分析 |
5.1 数据的来源与相关指标说明 |
5.1.1 数据的来源与研究范畴 |
5.1.2 指标说明 |
5.2 小域条件下贫困指标测度的模型与方法 |
5.2.1 嵌套误差线性回归模型 |
5.2.2 参数自举(bootatrap)的MSE估计 |
5.2.3 小域条件下Ell方法 |
5.3 模拟实验 |
5.3.1 基于模型的模拟实验 |
5.3.2 基于设计的模拟实验 |
5.4 中国贫困测度的随机模拟分析 |
5.4.1 中国贫困问题的主要特征 |
5.4.2 中国分省贫困指标测度的随机模拟分析 |
第6章 结论与展望 |
6.1 结论与不足 |
6.1.1 结论 |
6.1.2 本文的不足 |
6.2 对未来的展望 |
参考文献 |
附录 |
附录1:R语言程序 |
附录2:2001年至2013年中国分省区人均可支配收入变化地图 |
附录3:本文专有名词缩写(按字母顺序排序) |
附录4:数据 |
附表1 2001年-2013年全国各省城镇居民可支配收入 |
附表2 贫困线和贫困指标估计结果 |
附表3 贫困数据表 |
附表4 城镇居民可支配收入及调整人均可支配收入 |
附表5 2013年各省农村贫困人口数量及贫困发生率 |
附表6 经验贝叶斯估计、直接估计、ELL估计的贫困缺口1000倍均方误差 |
附表7 真实预测均方误差与Bootstrap预测均方误差比较 |
致谢 |
(3)小域估计抽样理论问题研究(论文提纲范文)
摘要 |
ABSTRACT |
目录 |
表索引 |
图索引 |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 研究方法 |
1.3 研究内容与结构安排 |
1.3.1 主要内容 |
1.3.2 技术路径 |
1.4 创新特色 |
1.4.1 本文的主要创新 |
1.4.2 本文存在的不足 |
第2章 小域估计抽样理论综述 |
2.1 抽样调查的理论综述 |
2.2 小域估计抽样理论综述 |
第3章 小域估计抽样设计方法 |
3.1 引言 |
3.2 多层级推断需求与域估计 |
3.3 域的定义和小域估计方法 |
3.4 小域估计抽样设计 |
3.4.1 抽样设计的基本改进方式 |
3.4.1.1 整群抽样问题 |
3.4.1.2 层的细分 |
3.4.1.3 调查数据的整合 |
3.4.2 事后分层技术 |
3.4.3 层层抽样技术 |
3.4.4 ABC三级一套样本法 |
3.4.5 样本追加策略 |
3.4.6 折衷分配样本 |
3.4.7 复合抽样框技术 |
3.4.8 重复抽样技术 |
3.5 小域估计抽样设计的比较 |
3.5.1 小域估计抽样设计的分类 |
3.5.2 小域估计抽样设计的比较 |
3.6 小域估计抽样设计存在的主要问题 |
3.7 本章小结 |
第4章 基于设计的小域估计方法 |
4.1 引言 |
4.2 基于设计的估计方法与辅助信息 |
4.2.1 基于设计的估计方法概况 |
4.2.2 辅助信息 |
4.3 相关知识准备及记号 |
4.4 现行的各种基于设计的估计方法 |
4.4.1 HORVITZ-THOPMPSON估计量 |
4.4.2 LIN-GREG估计量 |
4.4.3 LOG-GREG估计量 |
4.4.4 CAL估计量 |
4.4.5 G-CAL估计量 |
4.4.6 现行各种估计量的比较 |
4.5 基于设计的各类估计量的模拟分析 |
4.5.1 方差的线性化变换 |
4.5.2 估计方法的模拟分析 |
4.5.3 各类估计量的模拟结果 |
4.6 本章小结 |
第5章 基于模型的小域估计法 |
5.1 引言 |
5.2 基于模型的估计方法 |
5.2.1 基于模型的估计方法概述 |
5.2.2 与基于设计的估计方法的区别 |
5.3 隐式模型 |
5.3.1 合成估计量 |
5.3.2 组合估计量 |
5.4 显式模型 |
5.4.1 小域层次模型 |
5.4.2 单元层次模型 |
5.5 混合模型 |
5.5.1 混合模型的基本形式 |
5.5.2 混合模型的参数估计方法 |
5.5.2.1 经验最优线性无偏估计法 |
5.5.2.2 经验贝叶斯法 |
5.5.2.3 等级贝叶斯法 |
5.6 基于双水平模型的CAL估计量 |
5.6.1 双水平小域估计模型 |
5.6.2 双水平模型的CAL估计量公式的构建 |
5.6.3 2L-CAL估计量的均方误差 |
5.6.4 2L-CAL估计方法的模拟分析 |
5.6.4.1 模拟总体的生成 |
5.6.4.2 精度的衡量 |
5.6.4.3 各类估计量的模拟结果 |
5.7 本章小结 |
第6章 基于模型的小域加权估计方法 |
6.1 引言 |
6.2 基于模型的加权估计方法的一般理论 |
6.2.1 基于间接模型的加权 |
6.2.1.1 比率模型 |
6.2.1.2 平均比率模型 |
6.2.2 基于直接模型的加权 |
6.3 基于模型的加权估计方法 |
6.4 基于蜂房模型的加权估计方法 |
6.4.1 蜂房总体抽样调查介绍 |
6.4.2 蜂房模型的构建 |
6.4.3 基于蜂房模型的加权估计量 |
6.4.4 MSE的近似 |
6.4.4.1 MSE(μ_(d_l,hive-wgt))的近似 |
6.4.4.2 MSE(μ_(d,hive-wgt))的近似 |
6.4.5 HIVE-WGT估计方法的模拟分析 |
6.4.5.1 模拟总体的生成 |
6.4.5.2 精度的衡量 |
6.4.6 各类估计量的模拟结果 |
6.5 本章小结 |
第7章 总结与展望 |
7.1 本文所做的主要工作 |
7.2 有待于进一步研究的问题 |
7.3 研究展望 |
参考文献 |
攻读博士期间的主要研究成果 |
后记 |
(4)几种约束下生长曲线模型的容许性与泛容许性(论文提纲范文)
摘要 |
Abstract |
综述 |
1 预备知识 |
1.1 线性型独立性结果 |
1.2 一元线性模型中容许性与泛容许性的一些结果 |
1.3 多元线性模型中容许性与泛容许性的一些结果 |
2 矩阵损失下带约束的生长曲线模型的泛容许性 |
2.1 引言及定义 |
2.2 主要结果 |
2.3 小结 |
3 带双重约束生长曲线模型的容许性与泛容许性 |
3.1 齐次线性估计类下的主要结论 |
3.2 非齐次线性估计类下的主要结论 |
3.3 小结 |
4 多元线性模型中回归系数与参数同时估计的容许性 |
4.1 不等式约束下主要结论 |
4.2 等式约束下主要结论 |
4.3 待解决问题 |
4.4 小结 |
致谢 |
参考文献 |
(5)多重抽样框方法及其应用研究(论文提纲范文)
摘要 |
Abstract |
目录 |
第1章 绪论 |
1.1 选题的依据及意义 |
1.1.1 问题的提出 |
1.1.2 选题的意义 |
1.2 国内外研究现状及述评 |
1.2.1 理论研究述评 |
1.2.2 应用研究现状 |
1.3 研究的整体框架及主要创新 |
1.3.1 研究的整体框架 |
1.3.2 本文的主要创新 |
第一部分 多重抽样框设计及其估计方法研究 |
第2章 抽样框缺陷及多重抽样框设计分析 |
2.1 引言 |
2.2 抽样框定义与类别 |
2.3 抽样框的几种常见缺陷 |
2.4 丢失总体单元对抽样效果的影响 |
2.4.1 丢失单元部分与目标总体分布特征一致 |
2.4.2 丢失单元部分与目标总体分布特征不一致 |
2.5 多重抽样框设计概述 |
2.5.1 多重抽样框的概念 |
2.5.2 多重抽样框的结构 |
2.6 本章小结 |
第3章 双重抽样框下的抽样估计方法研究 |
3.1 引言 |
3.2 双重抽样框估计方法研究概况 |
3.3 总体总值的各种估计方法 |
3.3.1 记号 |
3.3.2 Hartley估计量 |
3.3.3 Fuller-Burmeister估计量 |
3.3.4 伪极大似然(Pseudo-maximum likelihood)估计量 |
3.3.5 单重框(Single Frame)估计量 |
3.4 估计方法的分类与比较 |
3.4.1 估计方法的分类 |
3.4.2 估计方法的比较 |
3.5 本章小结 |
第4章 多重抽样框下的抽样估计方法研究 |
4.1 引言 |
4.2 记号 |
4.3 总体总值估计量的一般化 |
4.3.1 H估计量的一般化 |
4.3.2 F-B估计量的一般化 |
4.3.3 PML估计量的一般化 |
4.3.4 SF估计量的一般化 |
4.3.5 估计量的统一形式及其方差估计 |
4.4 基于抽样框重数的多重抽样框估计方法 |
4.4.1 现有估计量的不足及改进思路 |
4.4.2 基于抽样框重数的估计量设计 |
4.4.3 模拟研究 |
4.5 本章小结 |
第二部分 特定抽样类型下的多重抽样框方法研究 |
第5章 多重抽样框下的多指标分层抽样研究 |
5.1 引言 |
5.1.1 多指标分层抽样概述 |
5.1.2 多指标分层抽样研究的概况与不足 |
5.2 抽样设计 |
5.3 总体总值估计量 |
5.4 样本容量的确定及分配 |
5.4.1 样本量的确定 |
5.4.2 分层样本的最优设计 |
5.5 本章小结 |
第6章 多重抽样框下的二阶段抽样估计方法研究 |
6.1 引言 |
6.2 总体总值估计量及其方差 |
6.3 最优抽样权重系数及样本量设计 |
6.4 本章小结 |
第7章 多重抽样框下的连续性抽样估计方法研究 |
7.1 引言 |
7.2 简单随机抽样情形下的估计 |
7.2.1 固定样本调查的估计方法 |
7.2.2 轮换样本调查的估计方法 |
7.2.3 极大似然估计量 |
7.3 复杂抽样设计情形下的估计 |
7.3.1 固定样本调查的估计方法 |
7.3.2 轮换样本调查的估计方法 |
7.4 本章小结 |
第三部分 多重抽样框方法的应用研究 |
第8章 多重抽样框调查方法在我国的应用研究 |
8.1 引言 |
8.2 我国统计调查体系发展历程及影响抽样框质量的现存问题 |
8.2.1 我国统计调查体系发展历程的回顾 |
8.2.2 我国统计调查体系中影响抽样框质量的现存问题 |
8.3 我国建立多重抽样框体系的必要性与可行性 |
8.3.1 我国建立多重抽样框体系的必要性 |
8.3.2 我国建立多重抽样框体系的可行性 |
8.4 建立基于多重抽样框的我国"三农"抽样调查体系 |
8.4.1 我国"三农"抽样框编制方法演进与现存问题 |
8.4.2 我国"三农"抽样调查中的多重抽样框编制 |
8.4.3 我国"三农"抽样框更新与维护策略 |
8.4.4 基于多重抽样框的"三农"抽样设计方法 |
8.4.5 基于多重抽样框的"三农"抽样估计方法 |
8.5 本章小结 |
第9章 总结与展望 |
9.1 本文所做的主要工作 |
9.2 有待于进一步研究的问题 |
参考文献 |
攻读博士学位期间发表论文清单 |
攻读博士学位期间参与课题研究及获奖情况 |
致谢 |
(6)电磁逆问题的统计分析方法(论文提纲范文)
摘要 |
Abstract |
1 绪言 |
1.1 逆问题概述 |
1.2 电磁学逆问题 |
1.3 国内外研究现状及发展趋势 |
1.4 本文的主要工作 |
2 参数辨识问题的经典统计分析方法 |
2.1 参数辨识问题概述 |
2.2 参数辨识模型的经典统计学分析方法 |
2.3 实例分析—铁磁流体微粒尺寸分布的估计问题 |
2.4 本章小结 |
3 参数辨识问题的贝叶斯统计分析方法 |
3.1 贝叶斯统计学分析方法概述 |
3.2 参数辨识模型的贝叶斯统计学分析方法 |
3.3 实例分析—铁磁流体微粒尺寸分布的估计问题 |
3.4 本章小结 |
4 优化算法和工程实例 |
4.1 微分进化算法 |
4.2 数学验证函数 |
4.3 工程实例 |
4.4 本章小结 |
5 统计近似模型及试验设计技术 |
5.1 近似模型的引入 |
5.2 响应面模型及其改进形式 |
5.3 径向基函数模型及其改进形式 |
5.4 KRIGING近似模型 |
5.5 建模与分析 |
5.6 本章小节 |
6 序贯优化方法 |
6.1 序贯优化方法概述 |
6.2 低维优化问题的实例分析 |
6.3 高维电磁设计问题的优化方法 |
6.4 本章小结 |
7 总结与展望 |
致谢 |
参考文献 |
附录 攻读学位期间发表论文目录 |
四、All Admissible Linear Estimators under Quadratic Loss in Multivariate Model(论文参考文献)
- [1]基于稳定权重目标最大似然估计模型的研究及其在真实世界研究中的应用[D]. 韩贺东. 中国人民解放军海军军医大学, 2020(02)
- [2]基于小域估计的贫困指标测度方法与模型研究[D]. 张会敏. 天津财经大学, 2015(10)
- [3]小域估计抽样理论问题研究[D]. 黄莺. 浙江工商大学, 2014(05)
- [4]几种约束下生长曲线模型的容许性与泛容许性[D]. 刘国科. 华中科技大学, 2010(03)
- [5]多重抽样框方法及其应用研究[D]. 贺建风. 暨南大学, 2010(09)
- [6]电磁逆问题的统计分析方法[D]. 雷刚. 华中科技大学, 2009(11)