2021/6/71第06周Origin一、线性拟合二、非线性拟合本ppt内的所有练习做为本学期第二次作业,请于2009/11/1前发送至:2021/6/72因变量因变量(Y)(Y)与自变量与自变量(X)(X)之间的关系之间的关系 函数关系函数关系 统计关系统计关系 即对两个变量即对两个变量X X,Y Y来说,当来说,当X X值值确定后,确定后,Y Y值按照一定的规律唯一确定,值按照一定的规律唯一确定,即形成一种精确的关系即形成一种精确的关系即当即当X X值确定后,值确定后,Y Y值不是唯一确定的,值不是唯一确定的,但大量统计资料表明,这些变量之间还但大量统计资料表明,这些变量之间还是存在着某种客观的联系是存在着某种客观的联系2021/6/73回归分析(Regression Analysis)应用统计方法,对大量的观测数据进行整理、分析和研究,从而得出反映事物内部规律性的一些结论描述不同变量之间的关系,找出相应函数的系数,建立经验公式或数学模型只有一个或二个自变量时,回归分析的目的就是找到符合数据的曲线或曲面,所以回归分析也经常被称为“curve fitting”或“surface fitting2021/6/74一、线性模型221 122sinyabxyabxcxyabxcxyab xb x线性模型,例如:2021/6/75Origin 中的 Linear Modelbasic linear regression model(线性回归)where 0,1 are coefficients and is the random error multiple linear regression model(多重线性回归)where i(i=0,1,2,m)are the coefficients polynomial regression model(多项式回归)kkxx2021/6/76Origin中的线性拟合功能2021/6/77例:测得铜导线在温度Ti下的电阻为Ri,求电阻R与温度 T的近似函数关系nT()R()119.176.30225.077.80330.179.25436.080.80540.082.35645.183.90750.085.102021/6/781、Linear Fit 模型Y Y与与X X具有统计具有统计关系而且是线性关系而且是线性 建立建立回归模型回归模型Y Yi i=0 0+1 1X Xi i+i i (i=1,2,n)(i=1,2,n)其中其中,(X(X i,i,Y Yj j)表示表示(X,Y)(X,Y)的第的第i i个观测值,个观测值,0 0,1 1为参数,为参数,0 0+1 1X Xi i为反映统计关系直线的分量,为反映统计关系直线的分量,i i为反映在统计关系直线周围散布的随机分量,为反映在统计关系直线周围散布的随机分量,i iN(0,N(0,2 2),i i 服从正态分布服从正态分布2021/6/79Y Yi i=0 0+1 1X Xi i+i i 0 0和和1 1均未知均未知 根据样本数据根据样本数据对对0 0和和1 1进行估计进行估计 0 0和和1 1的估计的估计值为值为b b0 0和和b b1 1 建立一元线性回归方程建立一元线性回归方程 XbbY102021/6/710一般而言,所求的一般而言,所求的b b0 0和和b b1 1应能使每个应能使每个样本观测点样本观测点(X(Xi i,Y,Yi i)与回归直线之间的偏与回归直线之间的偏差尽可能小。
差尽可能小2021/6/711一元线性回归方程最小最小二乘法二乘法 Y Y与与X X之间之间为线性关系为线性关系 选出一条最能反选出一条最能反映映Y Y与与X X之间关系之间关系规律的直线规律的直线 2021/6/7122011niiiQYbb XQ Q达到最小值达到最小值b b0 0和和b b1 1称为最小二乘估计量称为最小二乘估计量 令令微积分中极值微积分中极值的必要条件的必要条件 011001112020niiiniiiiQYbbXbQYbbXXb2021/6/713111221101nniiiiiinniiiiXXYYXX YbXXXXbYb X01iiiiiYbeYYbX代表观测点对于回归线的误差残差residualsresiduals2021/6/714222111nnniiiiiiiYYYYYY可以证明:可以证明:越小越好越小越好2021/6/715确定系数coefficient of determination 222211122211111nnniiiiiiinnniiiiiiYYYYeRYYYYYY 残差越小,各观测值聚集在回归直线周围的紧密程度就越大,说明直线与观测值的拟合越好,定义确确定系数定系数(COD)为:102 R一般情况下,R2的值越大,拟合得越好。
2021/6/716直线拟合的相关系数21rRrr r 与斜率 b1 取相同的符号r=1:完全正相关r=-1:完全负相关 r=0:无线性关系2021/6/717Fit Linear(线性拟合)步骤:步骤:1、将x,y数据输入worksheet2、绘制x,y的散点图3、执行Fit Linear4、结果在Results Log窗口中A:截距及其标准误差B:斜率及其标准误差R:相关系数N:参与拟合的数据点的数目P:Probability(that R is zero)R为0的概率SD:拟合的标准差2021/6/718可化为一元线性回归的模型112345log16bbxbxxbayxyaxyaeyaeyabxyabe、双曲函数、幂函数、指数函数、指数函数、对数函数、逻辑函数2021/6/719Linear Fit(线性拟合工具)使用菜单命令进行线性拟合,很多参数都是选用缺省值,用户无法对整个过程进行干预选用【tool】菜单中的【Linear Fit】可以对线性拟合过程中的相关参数进行选择,使拟合过程按要求进行,适合高级用户使用2021/6/720最后得到的拟合直线上的点的个数从x轴的from刻度到 to刻度范围内绘制拟合直线,这时上面设置的Range值无效根据现有的坐标刻度进行直线拟合可信度,为可信范围、预期范围表示Graph窗口中拟合直线在两端多于曲线X值范围的百分比在相应的Worksheet窗口中生成两列:Fit(Y)列(拟合值)Residual(Y)列(剩余误差)拟合本层中的所有曲线在Result Log中只显示简单的拟合结果,包括截距、斜率、标准误差、相关系数、编制偏差、拟合图形的点数和P值在Results Log中显示所有的拟合结果,除了上面介绍的以外,还显示t-检验值和ANOVA(方差分析)列表2021/6/721选中,则进行y=Bx回归分析,不选,则执行标准线性回归分析绘制数据上、下可信范围只对拟合过程中的误差参数有影响选中,使用误差值作为权重(如果激活的是Worksheet,必须选中一列Y误差列,如果激活的是Graph,图中必须有误差线)选中,则按指定的斜率值进行拟合,不选,则执行标准线性回归分析绘制数据上、下预期范围根据拟合公式计算的X值(已知Y值)根据拟合公式计算的Y值(已知X值)执行拟合2021/6/722直线拟合 上机练习1C:Program FilesOriginLabOriginPro75SamplesAnalysisCurve FittingLinear Fit.OPJ完成Origin软件自带的直线拟合例题文件:C:Program FilesOriginLabOriginPro75SamplesAnalysisCurve FittingApparent Fit.OPJ2021/6/723直线拟合上机练习22021/6/72420129kiiikiiyxxxk2、Polynomial Fit 模型212kkYAB XB XB X2021/6/725Fit Polynomial(多项式拟合)步骤:1、将x,y数据输入worksheet2、绘制x,y的散点图3、执行Polynomial Fit4、结果在Results Log窗口中A,B1,B2,参数值及其标准误差R-Square:R2N:数据点数目P:概率值SD:拟合的标准偏差2021/6/7262021/6/727Polynomial Fit(多项式拟合工具)使用【tools】菜单【Ploynomial Fit】命令用户可以对多项式拟合过程中的参数进行选择,使拟合过程按要求进行,适合有具体要求的用户使用。
2021/6/728最后得到的拟合曲线上点的个数在整个X轴坐标范围绘制拟合曲线,此时上面设置的Range值无效根据现有的坐标刻度进行拟合可信度,设置可信范围、预期范围表示Graph窗口中拟合直线在两端多于曲线X值范围的百分比在相应的Worksheet窗口中生成两列:Fit(Y)列(拟合数据)Residual(Y)列(剩余误差)拟合图层中的所有曲线在Result Log中只显示简单的拟合结果在Results Log中显示所有的拟合结果2021/6/729绘制数据上、下可信范围只对拟合过程中的误差参数有影响选中,使用误差值作为权重(如果激活的是Worksheet,必须选中一列Y误差列,如果激活的是Graph,图中必须有误差线)绘制数据上、下预期范围根据拟合公式计算的X值(已知Y值)根据拟合公式计算的Y值(已知X值)执行拟合指定多项式的阶数2021/6/730已知实验数据如右表,求它的二次拟合多项式xy11035445261718293104多项式拟合上机练习2021/6/731201201234Origin,kkkyxybb xb xb xkkb b bb某同学实验测得数据如左表所示,设 和 之间满足:。
分别就和两种情况,在中对表中的数据进行拟合,求出xy000.2-2.50.6-41-5.71.3-3.51.6-21.7-11.821.93.52.242.372.57.52.69.92.910.93.111.93.413.53.8134.111.94.494.76.54.844.91.5505.1-2.55.3-52021/6/7323、Multiple Regression(多重回归)012YYBXCX1、将多重回归的数据放在Worksheet中2、Worksheet的第一列必须为Y列,后面的列为X列3、拟合时,用鼠标选中所有的X列,Y列不能选Y-Intercept2021/6/7332021/6/734yx1x2某省19781989年消费基金、国民收入使用额和平均人口资料若1990年该省国民收入使用额为67十亿元,平均人口为58百万人,试估计1990年消费基金年份消费基金 国民收入使用额 平均人口数(十亿元)(十亿元)(百万人)1978912.148.219799.512.948.919801016.849.54198110.614.850.25198212.416.451.02198316.220.951.84198417.724.252.76198520.128.156.39198621.830.154.55198725.335.855.35198831.348.556.1619893654.856.982021/6/735二、非线性模型121sinlnbxbxcyaeyaeyabxx例如:求出最佳的参数拟合,1,2,3,iinY XinYXYfX有 组观测数据:设因变量 和自变量 满足:2021/6/736Origin中的非线性拟合功能2021/6/737Origin解非线性拟合的算法 Levenberg-Marquardt(L-M)method (列文伯格-马夸尔特法):LM算法需要对每一个待估参数求偏导。
对于Origin内置的拟合函数,Origin提供了求偏导的解析表达式,因此速度快,拟合时,尽可能使用Origin的提供的内置拟合函数 对于用户自定义的拟合函数,求偏导时,直接使用数值进行,速度较慢Origin也允许用户定义求偏导的表示式Simplex Method(单纯形算法):当L-M算法不能得出最佳的拟合结果时,可尝试使用该算法2021/6/738非线性拟合的结果如何评价?2221222201,degrees of freedomniiiRYYreducednpdofnpRnp确定系数:残差平方对同一组数据,越大越好对同一组数据,越小越好,其中 为参与拟合的数据点的数目,为参数的数目称为自由度置信区间:越窄越好预期区间:和:越窄越好2021/6/739Origin中进行非线性拟合的步骤1、将数据输入worksheet2、做数据的散点图3、进行非线性拟合:A、若有相应的菜单命令,点击相应的菜单命令即可B、使用Origin内置拟合函数,可以使用拟合向导,按向导指示操作即可C、若自定义函数,使用高级非线性拟合工具进行拟合,所有的拟合过程都可以控制2021/6/740A、使用菜单进行非线性拟合2021/6/741Fit Exponential Decay-first order一阶指数衰减拟合2021/6/742Fit Exponential Decay-second order二阶指数衰减拟合2021/6/743Fit Exponential Decay-third order三阶指数衰减拟合2021/6/744上机练习C:Program FilesOriginLabOriginPro75SamplesAnalysisCurve FittingExp Decay.OPJ完成Origin软件自带的指数二阶衰减拟合例题文件:2021/6/745Fit Exponential Growth一阶指数增长拟合2021/6/746Fit Sigmoidal S拟合当x轴为线性坐标时,采用Boltzmann函数拟合当x轴为对数坐标时,采用LogisticLogistic函数拟合2021/6/747S拟合工具使用菜单命令进行线性拟合,很多参数都是选用缺省值,用户无法对整个过程进行干预。
选用【tool】菜单中的【Sigmoidal Fit】可以对S拟合过程中的相关参数进行选择,使拟合过程按要求进行,适合高级用户使用2021/6/748上机练习C:Program FilesOriginLabOriginPro75SamplesAnalysisCurve FittingSigmoidal Fit.OPJ完成Origin软件自带的 S拟合 例题文件:2021/6/749Fit Gaussian 高斯拟合2021/6/750Fit Lorentzian 洛仑兹拟合2021/6/751Fit Multi-peaks 多峰拟合按照峰值分段拟合,每一段采用Gaussion或Lorentzian方法0246810050100150200AmplitudePosition2021/6/752上机练习C:Program FilesOriginLabOriginPro75SamplesAnalysisCurve FittingMulti Peak Fit.OPJ完成Origin软件自带的 多峰拟合 例题文件:2021/6/753B、Fitting Wizard非线性拟合向导2021/6/754第1步:选择要拟合的数据在这里控制参与拟合的数据点自变量(独立变量的)范围,数据点在图形中的显示设置2021/6/755第2步;选择合适的拟合函数函数的类别函数名称函数公式函数图形2021/6/756第3步:选择权重数据没有权重就选择None2021/6/757第4步:拟合控制参数设置显示各测量点的残差图显示置信区间曲线显示预期区间曲线置信区间预期区间22021/6/758第5步:输出结果是否绘制这些曲线?是否输出这些参数?选中的话,会提示把本次拟合的过程保存为一个工具栏上的图标,为以后进行同样的拟合提供方便2021/6/759在此区域右击鼠标,可弹出图示的快捷菜单,可对拟合向导进行一些设置2021/6/760Origin内置函数NLSF拟合C:Program FilesOriginLabOriginPro75 SamplesAnalysisCurve FittingNLSF Built In Func.OPJ完成Origin软件自带的使用内置函数进行NLSF拟合的例题文件:2021/6/76121211?,?b xbbybe拟合向导上机练习2021/6/762C、The NLSF Advanced Fitting Tool Nonlinear Least Squares Fitting NLSF高级拟合工具2021/6/763这是Basic Mode,点击More按钮,即可切换到Advanced ModeNLSF的两种模式2021/6/764Advanced Mode2021/6/7651、选择拟合函数若自定义函数就选择New2021/6/766这里可以写一些参数的线性约束条件,设参数为a,b,c,d,条件可以是:ab;a+2*b=c*2-d;4bc6;a/39支持5种关系:=,=.约束之间用分号分分隔,换行按CTRL+ENTER.2、设置函数参数的、设置函数参数的一些约束条件(没一些约束条件(没有的话就跳过)有的话就跳过)2021/6/7673、拟合过程、拟合过程中一些参数的中一些参数的设置(一般用设置(一般用默认设置即可)默认设置即可)一般不要选中设置参数的有效数字Delta一定程度上会影响拟合的结果221ttTolerance在迭代过程中,若则迭代(拟合结束)设置最大的迭代次数设置权重方法,没有就选None2021/6/7684、选择要、选择要拟合的数据拟合的数据1、选变量2、选数据3、确认将数据赋予变量设X变量的时候也是点左边的按钮,不要点这个按钮!2021/6/769存放模拟曲线的数据点的数据集名称根据这里的参数绘制曲线,选择 Action:Fit,则最后一次选中的参数被传递给Fit程序5、模拟曲线使用Origin进行非线性拟合,必须指定各参数的初始值,使用内置拟合函数时,Origin会自动设置好比较合适的初始值。
使用自定义函数拟合时,用户必须自己指定初始值,初始值选的不好,拟合就有可能不成功好的初始值的选择需要对拟合数据、拟合函数仔细分析,以及用户的经验2021/6/770取消选中的话,则这个参数在迭代过程中保持不变,当函数中某个参数被确定的话,就可以在这里设置误差取值范围是 0,1,越接近 1,则越表明该参数有可能过参数化了这个时候,用户就要考虑拟合的模型是否正确了,是否可以简化模型,除去一些参数拟合的结果6、进行拟合、进行拟合大多数情况下,过参数化的模型都应该认真审视,但并不是所有的过参数化的模型都是坏的模型比如说,绝大多数的指数方程都是这样的模型 2021/6/771执行一次LM iteration执行n次LM迭代,迭代过程中要终止的话,按ESC键即可当LM迭代方法无法进行时,可以尝试进行Simplex迭代方法(一般情况下,此方法不如LM方法好)(downhill simplex method)用这两个按钮可以浏览拟合过程中每次迭代得到的参数迭代过程的输出结果显示在这里2计算并显示2021/6/772创建一个worksheet,将拟合结果写入其中要Find Y,在这里填入x的值,x在数据集内、外都可以要Find X,在这里填入y的值,y必须在数据集之内7、生成结果、生成结果创建一个matrix,将Var-Cov Matrix写入其中2021/6/773自定义拟合函数1.添加一个新的函数类别,将自定义的函数都放置添加一个新的函数类别,将自定义的函数都放置在这个类别里,以便以后重复使用在这个类别里,以便以后重复使用2021/6/7742、定义新函数 用户自定义函数存放在OriginFitFunc 文件夹,文件名为FunctionName.FDF 定义参数和变量时,以下符定义参数和变量时,以下符号不可以使用号不可以使用(Origin内部内部要用要用):x1,x2,xn y1,y2,yn z1,z2,zn i,t,j,e使用Origin C编写函数默认的参数名为P1,P2等,若要使用自定义的符号,选中这里,参数之间用英文逗号分隔开,与C语言相同参数的数目点击这里进行编译2021/6/775自定义函数NLSF拟合上机练习1C:Program FilesOriginLabOriginPro75 SamplesAnalysisCurve FittingNLSF User Def Func.OPJ完成Origin软件自带的使用自定义函数进行NLSF拟合的例题文件:2021/6/776体重约70kg的某人在短时间内喝下2瓶啤酒后,隔一定时间测量他的血液中酒精含量(毫克百毫升),得到数据如左表。
设饮酒后血液中酒精含量的数学模型为:btctya ee试确定,a b c自定义函数NLSF拟合上机练习2时间 酒精含量(小时)(毫克/百毫升)0.25300.5680.75751821.5822772.5683683.5584514.55054163873582892510181115121213101471571642021/6/77722200 xxyyRxy245373249336264303285277308258348242375239416246454266483293504339508373左表中的(x,y)为某次实验测得的数据,理论上满足方程:试确定00,xy R本数据用simplex算法拟合能得到最佳结果自定义函数NLSF拟合上机练习3部分资料从网络收集整理而来,供大家参考,感谢您的关注!。