Metóda najmenších štvorcov je jednou z najdôležitejších aplikácií pri aproximácii funkcií. Cieľom je nájsť takú krivku, aby táto funkcia vzhľadom na množinu usporiadaných párov aproximovala údaje. Táto funkcia môže byť priamka, kvadratická krivka, kubická atď.
Myšlienka metódy spočíva v minimalizácii súčtu druhých mocnín rozdielov v súradnici (komponent Y) medzi bodmi vygenerovanými vybranou funkciou a bodmi patriacimi do súboru údajov.

Metóda najmenších štvorcov
Predtým, ako uvedieme metódu, musíme si najprv ujasniť, čo znamená „lepší prístup“. Predpokladajme, že hľadáme priamku y = b + mx, ktorá je tou najlepšou, ktorá predstavuje množinu n bodov, konkrétne {(x1, y1), (x2, y2)…, (xn, yn)}.

Ako je znázornené na predchádzajúcom obrázku, ak by premenné x a y boli spojené priamkou y = b + mx, potom pre x = x1 by zodpovedajúca hodnota y bola b + mx1. Táto hodnota sa však líši od skutočnej hodnoty y, ktorá je y = y1.
Pamätajte, že v rovine je vzdialenosť medzi dvoma bodmi daná nasledujúcim vzorcom:

S ohľadom na to, aby sa určil spôsob výberu priamky y = b + mx, ktorý najlepšie aproximuje dané údaje, sa zdá logické použiť ako kritérium výber priamky, ktorá minimalizuje súčet druhých mocnín vzdialeností medzi bodmi. a rovno.
Pretože vzdialenosť medzi bodmi (x1, y1) a (x1, b + mx1) je y1- (b + mx1), náš problém sa zmenšuje na nájdenie čísel maab tak, že nasledujúci súčet je minimálny:

Čiara, ktorá spĺňa túto podmienku, je známa ako «aproximácia čiary najmenších štvorcov k bodom (x1, y1), (x2, y2),…, (xn, yn)».
Akonáhle sa problém získa, zostáva len vybrať metódu na nájdenie najmenších štvorcov. Ak sú body (x1, y1), (x2, y2), …, (xn, yn) všetky na priamke y = mx + b, mali by sme kolineárne y:

V tomto výraze:

Nakoniec, ak body nie sú kolineárne, potom y-Au = 0 a problém sa môže preniesť do nájdenia vektora u tak, že euklidovská norma je minimálna.

Nájdenie vektora minimalizovania u nie je také ťažké, ako by ste si mohli myslieť. Vzhľadom k tomu, A je NX2 matice a u je 2 x 1 matica, máme, že vektor Au je vektor v R n a patrí do obrazu A, čo je podprostor R n s rozmerom nie väčšie ako dva.
Budeme predpokladať, že n = 3, aby sme ukázali, ktorý postup sa má dodržať. Ak n = 3, obrazom A bude rovina alebo priamka prechádzajúca počiatkom.

Nech v je vektor minimalizujúci. Na obrázku pozorujeme, že y-Au je minimalizovaný, keď je ortogonálny k obrazu A. To znamená, že ak v je minimalizačný vektor, stáva sa, že:

Potom môžeme vyššie uvedené vyjadriť týmto spôsobom:

K tomu môže dôjsť, iba ak:

Nakoniec, riešenie pre v, máme:

Je to možné, pretože A t A je nevratné, pokiaľ n body dané ako údaje nie sú kolineárne.
Teraz, ak by sme namiesto hľadania priamky chceli nájsť parabolu (ktorej výraz by mal tvar y = a + bx + cx 2 ), ktorý by bol lepšou aproximáciou k dátovým bodom n, postup by bol opísaný nižšie.
Keby boli n dátové body v tejto parabole, mali by sme:

potom:

Podobne môžeme napísať y = Au. Ak všetky body nie sú v parabole, máme to, že y-Au sa líši od nuly pre akýkoľvek vektor u a náš problém je znova: nájdite vektor u v R3 tak, aby jeho norma - y-Au - bola čo najmenšia. ,
Opakovaním predchádzajúceho postupu môžeme dospieť k záveru, že hľadaný vektor je:

Riešené cvičenia
Cvičenie 1
Nájdite čiaru, ktorá najlepšie vyhovuje bodom (1,4), (-2,5), (3, -1) a (4,1).
Riešenie
Musíme:

potom:


Dospeli sme preto k záveru, že riadok, ktorý najlepšie vyhovuje týmto bodom, je daný:

Cvičenie 2
Predpokladajme, že predmet spadol z výšky 200 m. Keď padne, podnikajú sa tieto kroky:

Vieme, že výška uvedeného objektu po uplynutí času t je daná:

Ak chceme získať hodnotu g, nájdeme parabolu, ktorý je lepší priblíženie k piatich bodov uvedených v tabuľke, a tak by sme, že koeficient, ktorý sprevádza t 2 bude primeraná aproximácie (-1/2) G Ak merania sú presné.
Musíme:

A neskôr:


Dátové body sa teda zhodujú s týmto kvadratickým výrazom:

Takže musíte:

To je hodnota, ktorá je primerane blízko správne, čo je g = 9,81 m / s 2 . Aby sa dosiahlo presnejšie priblíženie g, bolo by potrebné vychádzať z presnejších pozorovaní.
Načo to je?
V problémoch, ktoré sa vyskytujú v prírodných alebo spoločenských vedách, je vhodné napísať vzťahy, ktoré existujú medzi rôznymi premennými, pomocou nejakého matematického vyjadrenia.
Napríklad v ekonomike môžeme spojiť náklady (C), príjmy (I) a zisky (U) pomocou jednoduchého vzorca:

Vo fyzike môžeme spojiť zrýchlenie spôsobené gravitáciou, časom pádu objektu a výškou objektu podľa zákona:

V predchádzajúcom výraze s o je počiatočná výška uvedeného objektu a v o je jeho počiatočná rýchlosť.
Nájsť také vzorce nie je ľahká úloha; obvykle je povinnosťou profesionála pracovať s množstvom údajov a opakovane vykonávať niekoľko experimentov (aby sa overilo, že získané výsledky sú konštantné), aby našli vzťahy medzi rôznymi údajmi.
Bežným spôsobom, ako to dosiahnuť, je reprezentovať údaje získané v rovine ako body a hľadať súvislú funkciu, ktorá optimálne aproximuje tieto body.
Jedným zo spôsobov, ako nájsť funkciu, ktorá „najlepšie aproximuje“ dané údaje, je metóda najmenších štvorcov.
Okrem toho, ako sme videli aj pri cvičení, vďaka tejto metóde sa môžeme dostať pomerne blízko k fyzikálnym konštantám.
Referencie
- Lineárna algebra Charlesa W Curtisa. Springer-Velarg
- Kai Lai Chung. Teória elementárnej prospešnosti so stochastickými procesmi. Springer-Verlag New York Inc
- Richar L Burden a J.Douglas Faires. Numerická analýza (7ed). Thompson Learning.
- Stanley I. Grossman. Aplikácie lineárnej algebry. MCGRAW-HILL / INTERAMERICANA DE MEXICO
- Stanley I. Grossman. Lineárna algebra. MCGRAW-HILL / INTERAMERICANA DE MEXICO
