FormacijaSrednjoškolsko obrazovanje i škola

Najbliža metoda susjed: primjer rada

najbliže metoda susjed je najlakši metrički klasifikator koji se temelji na procjeni sličnosti različitih objekata.

Analizirano objekt pripada klasi kojoj pripadaju subjekata uzorka obuke. Neka nam otkriti koji je najbliži susjed. Pokušajte razumjeti složenu materiju, primjere različitih tehnika.

metoda hipoteza

Najbliža metoda susjed može smatrati kao najčešći algoritam koji se koristi za klasifikaciju. Objekt prolaze klasifikaciju pripada klasi y_i, na kojoj je najbliži objekt učenja x_i uzorak.

Specifičnost metode susjeda

k najbližem metodu susjed može poboljšati točnost klasifikacije. Analizirano objekt pripada istoj klasi kao i većinu svojih susjeda, to jest, k blizini je objekata analiziranog uzorka x_i. U rješavanju problema s dvije klase broja susjeda će biti čudno da se izbjegne situaciju dvosmislenosti, ako je isti broj susjeda će pripadati različitim klasama.

Tehnika suspendiranih susjeda

PostgreSQL-analizirali način tsvector najbliži susjedi se koristi kada je broj sati najmanje tri, a ne možete koristiti neparan broj. No, neodređenost javlja čak iu tim slučajevima. Zatim, ja-ti susjed dobiva w_i težinu, što smanjuje sa susjedom čin sam. To se odnosi na klasu objekta, koji će imati maksimalnu ukupnu težinu između bliskih susjeda.

Hipoteza kompaktnosti

U srcu svih navedenih metoda je hipoteza o kompaktnosti. To ukazuje na vezu između mjera sličnosti predmeta i njihova pripadaju istoj klasi. U ovoj situaciji, granica između različitih vrsta je jednostavan oblik, i stvoriti klase objekata u prostoru kompaktnom mobilnom području. U takvim područjima u matematičku analizu uzeti kao zatvoren omeđen set. Ova hipoteza se ne odnosi na svakodnevne percepcije riječi.

Osnovni formula

Neka nas ispitati više najbližeg susjeda. Ako je predložena trening tipa uzorak „objektno odgovor» X ^ = m \ {(x_1, y_1) \ točke (x_m, y_m) \}; Ako se više objekata definirati udaljenosti funkcije \ Rho (x, X), koji je predstavljen u obliku odgovarajućeg modela sličnosti objekata povećanjem vrijednosti funkcije smanjuje sličnost između objekata X, X '.

Za bilo koji objekt, u će izgraditi uzorak trening objekata x_i s povećanjem udaljenosti da u:

\ Rho (u, x_ {1; u}) \ leq \ p (u, x_ {2-u}) \ leq \ cdots \ ekv \ p (u, x_ {m, u}),

gdje x_ {i; u} karakterizira uzorak objekt učenja, što je i-susjed izvor u objekt. Kao zapis i odgovoriti na korištenje i-th susjeda: y_ {i; u}. Kao rezultat toga, možemo vidjeti da je bilo koji objekt u provocira ponovno numeriranje vlastiti uzorak.

Određivanje broja k susjedima

Najbliža metoda susjed kad je k = 1 je sposobna dati pogrešnu klasifikaciju, ne samo na objekte-emisije, ali i za druge klase koje su u neposrednoj blizini.

Ako uzmemo k = m, algoritam će biti stabilna i da će izroditi u konstantnoj vrijednosti. Zato pouzdanost je važno da se izbjegne ekstremne indeksi k.

U praksi, kao i optimalna Indeks k korišten kriterij klizna kontrola.

emisija projekcije

Predmet istraživanja su uglavnom nejednake, ali među njima ima i onih koji imaju obilježja klasa i nazivaju standardima. U blizini objekta u idealnom modelu svoje visoke vjerojatnosti pripadaju ovoj klasi.

Kako rezultativen metoda susjeda? Primjer se može vidjeti na osnovi perifernih i ne-informativne kategorije objekata. Pretpostavlja se gusta okoliš objekta ostalih predstavnika ove klase. Kad ih izvadite iz klasifikacije uzorkovanja kakvoće neće patiti.

Uzmite u određeni broj uzoraka može buke izboji koji su „na terenu” od klase. Uklanjanje značajno pozitivan utjecaj na kvalitetu klasifikaciji.

Ako se uzorak uzima iz uninformative i uklanjanje objekata buke, možete računati na nekoliko pozitivnih rezultata u isto vrijeme.

Prvi interpolacija metoda najbližeg susjeda klasifikacija omogućuje poboljšati kvalitetu, smanjiti količinu pohranjenih podataka, smanjiti vrijeme klasifikacije, koji je proveo o izboru slijedećih standarda.

Korištenje ultra-velikim uzorcima

Najbliža metoda susjed se temelji na stvarnom skladištenje objekata učenja. Stvaranje vrlo uzorke velikih pomoću tehnički problem. Cilj je ne samo uštedjeti značajnu količinu informacija, ali također u minimalnom iznosu od vrijeme imati vremena za pronaći bilo koji objekt u K među najbližim susjedima.

Kako se nositi s ovim zadatkom, koriste se dvije metode:

  • prorjede uzorka preko izlaznog non-objekte podataka;
  • učinkovito korištenje posebna struktura podataka i kodovi za trenutak potragu za najbližim susjedima.

Pravila metode selekcije

Navedena klasifikacija smatralo. Najbliža metoda susjed koristi u rješavanju praktičnih problema, koji je poznat unaprijed udaljenosti funkcija \ Rho (x, x „). U opisuju objekte brojčani vektori koristiti Euklidova podatak. Ovaj izbor nema posebno opravdanje, ali uključuje mjerenje svih znakova „u istoj razini.” Ako ovaj faktor ne uzima u obzir, onda je metrički će prevladavati značajku koja najviše brojčane vrijednosti.

Ako postoji znatna količina mogućnosti, izračunavanje udaljenosti kao zbroj odstupanja na određene simptome pojavljuju se ozbiljne dimenziju problema.

U srednjoj dimenzionalnom prostoru udaljene jedna od druge će svi objekti. Na kraju, bilo uzorak će biti pored objekta se proučava k susjedima. izabrani mali broj informativnih mogućnosti kako bi se uklonili taj problem. Algoritmi za izračunavanje procjena graditi na temelju različitih skupova znakova, a za svakog pojedinca izgrade svoje blizine funkciju.

zaključak

Matematički proračuni često uključuju korištenje različitih tehnika koje imaju svoje vlastite posebne karakteristike, prednosti i nedostatke. Gledano najbliži način susjed može riješiti vrlo ozbiljan problem, zbog karakteristika matematičkih objekata. Eksperimentalni koncept koji se temelji na analiziranom metode se aktivno koriste u umjetnoj inteligenciji.

U ekspertnim sustavima potrebno je ne samo klasificirati objekte, ali i pokazati korisniku objašnjenje klasifikaciji u pitanju. U ovoj metodi, objašnjenje ovog fenomena su izraženi u odnosu na objekt određenoj klasi, kao i svog položaja u odnosu na uzorak koristi. Pravni stručnjaci industrije, geolozi, liječnici, uzmi ovaj „presedan” logiku aktivno koristiti u svojim istraživanjima.

Kako bi se analizirati metodom bio najpouzdaniji, učinkovit, dajući željene rezultate, morate uzeti minimalnu slika K, a također bi se izbjeglo emisija među analiziranim predmetima. Zato je primjena standarda i metoda odabira, kao i metrika optimizacije.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 hr.atomiyme.com. Theme powered by WordPress.