1. 常用的抽样调查方法有哪些各有何优缺点
1、简单随机抽样 优点:当总体内观察单位数与样本例数都不大时拥有实施,均数及其标 准误的计算也比较简单。
2、分层抽样 优点:易于理解、简单易行。容易得到一个按比例分配的本。
3、系统抽样 优点:由于分层后各层内的个体同质性质增强,使得抽样误差比较小。
4、整群抽样 优点:便于组织,节省人力、物力、时间,容易控制调查质量。
我们生活在比较之中,有黑暗才有光明,有恨才有爱,有坏才有好,有他人和他人所做的事我们才知道自己是谁,自己在做什么。一切都在比较中才能存在,没有丑便没有美,没有失去便没有得到。
我们只需要一个我真爱的人和真爱我的人,在一起,我们的人生便圆满了。人的一生中最重要的不是名利,不是富足的生活,而是得到真爱。有一个人爱上你的所有,你的苦难与欢愉,眼泪和微笑,每一寸肌肤,身上每一处洁净或肮脏的部分。
真爱是最伟大的财富,也是唯一货真价实的财富。如果在你活了一回,未曾拥有过一个人对你的真爱,这是多么遗憾的人生啊!
生活中的定律是为实践和事实所证明,反映事物在一定条件下发展变化的客观规律的论断。定律是一种理论模型,它用以描述特定情况、特定尺度下的现实世界,在其它尺度下可能会失效或者不准确。
没有任何一种理论可以描述宇宙当中的所有情况,也没有任何一种理论可能完全正确。人生同样有其客观规律可循。
一、生活定律 痛苦定律:死无疑是痛苦的,然而还有比死更痛苦的东西,那就是等死。
幸福定律:如果你不再总是想着自己是否幸福时,你就获得幸福了。
错误定律:人人都会有过失,但是,只有重复这些过失时,你才犯了错误。
沉默定律:在辩论时,沉默是一种最难驳倒的观点。
动力定律:动力往往只是起源于两种原因:希望,或者绝望。
受辱定律:受辱时的唯一办法是忽视它,不能忽视它时就藐视它;如果连藐视它也不能,那么你就只能受辱了。
愚蠢定律:愚蠢大多是在手脚或舌头运转得比大脑还快的时候产生的。
化妆定律:在修饰打扮上花费的时间有多少,你就需要掩饰的缺点也就有多少。
省时定律:要想学会最节省时间的办法,首先就需要学会说"不"。
地位定律:有人站在山顶上,有人站在山脚下,虽然所处的地位不同,但在两者的眼中所看到的对方,却是同样大小的。
失败定律:失败并不以为着浪费时间与生命,却往往意味着你又有理由去拥有新的时间与生命了。
谈话定律:最使人厌烦的谈话有两种:从来不停下来想想;或者,从来也不想停下来。
误解定律:被某个人误解,麻烦并不大;被许多人误解,那麻烦就大了。
结局定律:有一个可怕的结局,也比不上没有任何结局可怕。
二、工作定律
安全定律:最安全的单位几十年没有得过安全奖(最安全证明你们安全没有做工作)
需要定律:同样两个相同的单位,同样的办公费。多少年以后,发生了变化(证明你们单位办公不需要那么多的钱)出来反对,这种成功的概论会归结为零。
评比定律:领导认为谁好,谁就好。(只要领导看你不顺眼,再辛辛苦苦地工作也是白费力气。)
一票否决定律:在一个单位,比如升工资,比如提拔任用,一个人提出来,往往成功的概率最大,而另一个人站
接受教育定律:每个单位都有吊儿郎当不好好干工作的人。但领导往往在批评这些人的时候,这些人恰恰不在场,于是,便出现了遵纪守法的人,经常接受教育的尴尬局面。
哭闹定律;那个部门没有几个因为经常的哭闹而得到了实惠,他有什么理由不经常哭闹下去。(此定理也适用那些经常在领导面前叫苦叫累的部门)
能者多劳定律:在同一科室里,有的人虽然在其岗,但却不能胜任本职工作,那他的工作只能由能胜任该项工作的人去代劳。
不平衡定律:年年当先进的部门或个人,一年没有当先进便想不通;从未当先进的部门或个人,当上先进后便想不到。
少劳多得定律:一般的单位,都分为合同工、(过去称为正式工)协议工、临时工等等。拿钱越少的工作量越大,而且越容易被解雇;拿钱越多的越没有多少事情可干,而且最不容易被解雇。
2. 概率,初学,为什么抽样模型不要考虑n次里面选m次是不合格品,而放回抽样要考虑啊
因为第一个这个抽样模型是一次性抽样,抽出来的产品混在一起,只记合格总数和不合格总数,所以用组合公式,属于无序问题。而第二个放回式抽样问题,是一个一个抽出来的,每一次都是从N个样品中拿,需要知道是n次抽样中的哪m次为次品,而这m次又都是从M个里面抽出来的,所以用指数公式,乘以Cnm相当于化有序为无序的一步。能理解吗?
3. 古典概型中抽样模型的随机变量服从什么分布
服从均匀分布,如果细分,则又分为一维均匀分布,二维均匀分布和三维均匀分布。
4. 实际模型研究
前面的概念模型仅基于非条件模拟,其网格节点具有相同的环境特征。而在实际应用时,有很多信息(如井信息、地震信息)等影响周围待估点。也就是说,不同网格节点其环境特征不一样,导致可信度存在差异。这样基于信息度的方法将显现出优势。利用三口井建立的砂泥岩分布(图9-3),进行实际应用对比研究。
图9-4是利用序贯指示建模(SIS)获得的模拟结果,模拟参数见表2。将块金设置为0的目的是为了使模拟的砂泥岩分布更连续。事实上,在计算变差函数时,由于井网密度的关系(抽样距离大),导致小距离范围内的变差函数值难以获得,在进行拟合时,往往会有一个块金效应,导致出现更多的“噪音”。从块金值为0的SIS模拟结果看,仍然存在一些“噪音”,表明SIS模拟结果需要进行后处理。分别应用基于信息度的方法和MAPS方法对此模拟结果进行了处理(图9-5a、图9-5b)。从处理效果看,基于信息度的方法获得的图像更符合地质人员的认识,图像边界更光滑,模拟结果与实际解释储层分布更相似;而MAPS方法则仍然存在一些局部“噪音”,边界平滑度差。
图9-3 三口井建立的砂泥岩剖面
图9-4 SIS的一个条件模拟
此外,比较图9-5a和图9-5b的圆圈部位可以发现,基于信息度的方法考虑到井点条件数据对周围节点提供的信息,根据信息度首先处理最不合理的模拟结果,将砂泥岩分布更好展现出来;而MAPS方法由于对每一个网格节点都采取一样的权重,没有考虑井点条件数据对周围节点提供的信息,导致砂泥岩分布不合理。
图9-5 两种后处理方法实际应用比较图
作为更深入的研究,对图9-5中圆圈部位的SIS模拟结果(模拟值及其信息度)进行了提取,分析两种方法的处理过程及其导致的差异(图9-6)。
图9-6 局部后处理结果分析
图9-6中a图为SIS模拟结果图,b图则为对应网格节点的信息度图。如果按照MAPS的加权处理方法,根据公式(9-2),可以得出后处理后出现砂岩和泥岩概率分别为
多点地质统计学原理、方法及应用
由于后处理原则是保留最大概率的点,这样中心点为砂岩的实现必然得到保存。
然而,从提供的信息度来看,在中心点出现砂岩的信息度为负值,表明砂岩可能性小,而泥岩可能性大。同样的,通过公式(9-2)以信息度为加权值计算出砂岩和泥岩的后处理结果。
多点地质统计学原理、方法及应用
表9-2 条件模拟参数及处理结果表
显然,中心点为砂岩的SIS模拟实现就将为泥岩替代。
那么两者处理是否合理?对SIS条件模拟进行了分析,在此网格节点(73,86)处,通过提取模拟时条件概率发现,出现砂岩的概率仅为0.073。这样的小概率事件为随机抽样所实现,反映了在此网格节点模拟的不真实。利用基于信息度的方法则很好揭示了这种不合理的抽样,并最终在后处理中过滤掉这些点,反映了基于信息度的方法的合理性。
最后,从最终模拟实现获得的概率来看(表9-2),基于信息度的方法更真实再现了砂泥岩的统计特征,也证明了基于信息度的方法要优于MAPS方法。
5. 什么是帽子矩阵(hat matrix)
对于线性模型Y=Xβ+e,E(e)=0,cov(e)=σ2I,矩阵H≙...X(XTX)-1XT是将观测向量Y正交投影到由X的列向量所生成的子空间上的投影矩阵。Y^=HY,习惯上称H为帽子矩阵。
6. 求一套3DMAX的帽子模型
http://www.3dfrom.com/models//16113-0.htm 有个牛仔帽模型
7. 如果选择一个更多的样本,对抽样分布模型有什么影响
抽样分布、样本分布和总体分布
统计中用随机变量X的取值范围及其取值概率的序列来描述这个随机变量,称之为随机变量X的概率分布。如果我们知道随机变量X的取值范围及其取值概率的序列,就可以用某种函数来表述X取值小于某个值的概率,即为分布函数:F(X)=P(X≤z)。
例如,一个由N家工业企业组成的总体,X为销售收入。将总体所有企业的销售收入按大小顺序排队,累计出总体中销售收入小于某值x的企业数量并除以总体企业总数N,就可得到总体中销售收入小于x的企业的频率,也即抽取一个销售收入小于x的企业的概率。此频率或概率随着x值不同而变化形成一个序列,形成了销售收入X的概率分布。
总体分布是在总体中X的取值范围及其概率。
样本分布是在样本中X的取值范围及其概率。上例中,如果抽取n个企业作为样本,我们同样可以用这n个销售收入的取值范围及其概率描述其分布,也即样本分布。样本分布也称为经验分布,随着样本容量n的逐渐增大,样本分布逐渐接近总体分布。
抽样分布是指样本统计量的概率分布。采用同样的抽样方法和同等的样本量,从同一个总体中可以抽取出许许多多不同的样本,每个样本计算出的样本统计量的值也是不同的。样本统计量也是随机变量,抽样分布则是样本统计量的取值范围及其概率。仍以工业企业为例,我们设计了一个抽样方案并确定了样本量,这时可能抽取的样本是众多的,每抽取一个样本就可以计算出一个企业平均销售收入,所有可能形成的分布就是抽样分布。例中,样本统计量为随机变量,抽样分布是的概率分布。
研究概率分布对于抽样调查是十分重要的,因为只有知道概率分布,才能够利用抽样技术推断抽样误差。现实中,总体的分布状况通常是未知的,但我们也无需知道总体分布,而只需知道抽样分布。
当样本容量足够大的时候——通常是大于100,就可以把样本分布近似的服从正态分布。
8. 什么是拉丁超立方抽样法它和蒙特卡罗模拟有什么关系
简单来说,拉丁超方采样是从space-filling的观点出发~保障其在空间中的投影均匀性。一般来说,采样的质量关乎到代理模型的精度,于是一般情况下拉丁超方会优于随机采样,但是在极端情况下,例如二维条件下,拉丁超方的结果可能为一条沿着角平分线的斜线,这样的话,采样点不能很好的覆盖整个区域,并且无法区分变量的影响~于是更近一步的发展出了最优拉丁超方,正交拉丁超方,最大最小准则拉丁超方~~
9. 模型方法
模型方法包括基于矿物和岩石的散射和吸收光谱性质模拟反射光谱的各种模型方法。因为成像光谱测量数据可以提供连续的光谱抽样信息以产生细微的光谱特征(Goetz,1989),故这种模型方法可以是确定性的而不是统计性的方法。高斯改进型模型(MGM)是最近几年为分析反射光谱而发展起来的一种分析技术(Cloutis,1996)。这种分析技术与其他曲线拟合模型相比,算法上有扎实的理论基础,因而能提供更有效更可靠的分析结果(Sunshine等,1990)。
Sunshine等(1990)在他们的报道中首先评价传统的吸收波段高斯模型(GM),指出用高斯模型描述因Fe2+等电子跃迁吸收的辉石矿物光谱并不适合;然后他们用幂定律描述能量和平均键长(average bond length)的关系来改进高斯模型(MGM),发现MGM能成功地描述由单个分布说明的几种辉石混合物吸收特征并能正确地将其分解成一系列MGM曲线。下面简述GM和MGM模型及其性质,并用Sunshine等(1990)的实验结果进一步说明MGM的特点。
一个随机变量的高斯分布可以用它的中心(均值,μ)、宽度(标准差,σ)和强度(幅度,s)表示:
中亚地区高光谱遥感地物蚀变信息识别与提取
改变(xn-μn)指数相当于改变分布的对称性,即曲线左、右翼相对斜率的改变。方程(4-14)中指数n的理想值能靠经验指定。根据拟合效果和残差值,Sunshine等(1990,1993)发现对于各种辉石的混合光谱,模拟各种成分的吸收波段取n=-1较理想。利用MGM模型,对具体一条离散的光谱曲线采用非线性的最小二乘法迭代拟合。最初由研究者提供估计参数值,然后按照一定的标准迭代调整模型参数(中心位置、标准差、幅度以及连续统的斜率和截距),直至前后两次迭代所得的误差改变量达到可以忽略的量级(或预先给定最小允许误差)。一个良好的模型拟合取决于残差之大小,残差定义为模型值和实际值之差的均方根(RMS)。通常一种矿物的光谱曲线有多个吸收波段,尤其是复合矿物成分的光谱更是如此。因此需要对每个吸收特征拟合分解各自的高斯曲线,直至所有高斯模拟曲线叠加之和与实际值相比产生的误差达到允许接受的程度。所以利用MGM对实际测试矿物的光谱曲线可分解出许多相应各个吸收波段的高斯分布曲线。分析单个高斯分布曲线并对照已知矿物成分光谱(从光谱数据库)就可知道测试光谱的种类及在混合光谱中所占的光谱成分的比例。读者如需要进一步了解MGM对实际光谱的拟合和分解成高斯分布曲线的过程,可参阅Sunshine等(1990)一文的附录。Sunshine等(1990)利用MGM拟合分解两种辉石:一种来自美国夏威夷火山弹(用Cpx表示);另一种来自美国北卡罗来纳州Webster地区(用Opx表示)。Opx和Cpx两种辉石矿物成分含量不同,因此它们的吸收波段特征也很不相同。Sunshine等(1990)用Opx和Cpx不同的比例混合,测其混合物的光谱,再用MGM模型模拟和分解该混合光谱吸收波段高斯分布曲线,并与用GM拟合和分解相同混合光谱的结果相比说明MGM能取得较好的效果。