黑河

[拼音]:quxian nihe

[英文]:curve fitting

用連續曲線近似地刻畫或比擬平面上離散點組所表示的座標之間的函式關係。更廣泛地說,空間或高維空間中的相應問題亦屬此範疇。在數值分析中,曲線擬合就是用解析表示式逼近離散資料,即離散資料的公式化。實踐中,離散點組或資料往往是各種物理問題和統計問題有關量的多次觀測值或實驗值,它們是零散的,不僅不便於處理,而且通常不能確切和充分地體現出其固有的規律。這種缺陷正可由適當的解析表示式來彌補。

數學表述

設給定離散資料

(1)

式中xk為自變數x(標量或向量,即一元或多元變數)的取值;yk為因變數 y(標量)的相應值。曲線擬合要解決的問題是尋求與(1)的背景規律相適應解析表示式

(2)

使它在某種意義下最佳地逼近或擬合(1),ƒ(x,b)稱為擬合模型;

為待定引數,當b)僅在ƒ中線性地出現時,稱模型為線性的,否則為非線性的。量

稱為在xk處擬合的殘差或剩餘,衡量擬合優度的標準通常有

式中ωk>0為權係數或權重(如無特別指定,一般取為平均權重,即

(k=1,2,…,m),此時無需提到權)。當引數b)使T(b))或Q(b))達到最小時,相應的(2)分別稱為在加權切比雪夫意義或加權最小二乘意義下對 (1)的擬合,後者在計算上較簡便且最為常用。

模型中引數的確定

一般的線性模型是以引數 b)為係數的廣義多項式,即

, (3)

式中g0,g1,…,gn稱為基函式。對諸gj的不同選取可構成多種典型的和常用的線性模型。從函式逼近的觀點來看,式(3)還能近似地體現許多非線性模型的性質。

在最小二乘意義下用線性模型(3)擬合離散點組(1),引數b可通過解方程組

(i=0,…,n)來確定,即解關於b0,b1,…,bn的線性代數方程組

(4)

式中

(i,j=0,1,…,n),

方程組(4)通常稱為法方程或正規方程,當m>n時一般有惟一解。

至於非線性模型以及非最小二乘原則的情形,引數b)可通過解非線性方程組或最優化計算中的有關方法來確定(見非線性方程組數值解法、最優化)。

模型的選擇

對於給定的離散資料(1),需恰當地選取一般模型(2)中函式ƒ(x,b))的類別和具體形式,這是擬合效果的基礎。若已知(1)的實際背景規律,即因變數y對自變數 x的依賴關係已有表示式形式確定的經驗公式,則直接取相應的經驗公式為擬合模型。反之,可通過對模型(3)中基函式g0,g1,…,gn(個數和種類)的不同選取,分別進行相應的擬合併擇其效果佳者。函式g0,g1,…,gn對模型的適應性起著測試的作用,故又稱為測試函式。另一種途徑是:在模型(3)中納入個數和種類足夠多的測試函式,藉助於數理統計方法中的相關性分析和顯著性檢驗,對所包含的測試函式逐個或依次進行篩選以建立較適合的模型(見迴歸分析)。當然,上述方法還可對擬合的殘差(視為新的離散資料)再次進行,以彌補初次擬合的不足。總之,當資料中變數之間的內在聯絡不明確時,為選擇到相適應的模型,一般需要反覆地進行擬合試驗和分析鑑別。

參考書目

馮康等編:《數值計算方法》,國防工業出版社,北京,1978。

A.拉爾斯登、H.S.維爾夫著,徐獻瑜等譯:《數字計算機上用的數學方法》,上海科學技術出版社,上海,1963。(A.Ralston and H.S.Wilf,MatheMatical Methods for Digital Computers,John Wiley & Sons, New York, 1960.)