uczenie maszynowe
Technologia

Wnioskowanie wysokowymiarowe – tajemniczy termin, który wpłynie na nasze codzienne życie

W naszym codziennym zabieganiu często nie zwracamy uwagi na szczegóły tego, co nas otacza. Tym bardziej też nie wnikamy w to, jak otaczające nas rozwiązania działają i na czym właściwie bazują, a szkoda, ponieważ może to być nie tylko ciekawe, ale i pouczające. Przykładem może być choćby uczenie maszynowe. Jest to technologia mająca swój początek w pracach nad sztuczną inteligencją i stanowi jej nieodłączny element. [1] Pełnoprawne SI nie może się bowiem obyć bez zdobywania nowej wiedzy, a tym samym – rozwijania. Na tym właśnie polega uczenie maszynowe – specjalnie skonstruowane algorytmy pozwalają maszynom i programom nabywać wiedzę, poprzez wyciąganie wniosków na podstawie nowych, świeżo otrzymywanych danych. Choć brzmi to nieco futurystycznie, to już dziś wiele z otaczających nas urządzeń, systemów i programów wykorzystuje to rozwiązanie do swojego działania.

Uczenie maszynowe – do czego?

Zanim przejdziemy do meritum określonego przez tytuł i jego relacji z uczeniem maszynowym, należy najpierw zrozumieć, jak istotne w naszym życiu jest to rozwiązanie. Nie ma ono bowiem związku jedynie z sztuczną inteligencją czy wynalazkami rodem z filmów science fiction. Może być to nieco zaskakujące, ale to dzięki nauczaniu maszynowemu możecie korzystać z wyszukiwarek internetowych i to za jego sprawą otrzymujecie wyniki adekwatne do wpisywanych tam fraz. Co więcej, jest to również podstawa rozpoznawania obrazów, w tym np. twarzy w celu odblokowania smartfona. Kolejnym przykładem jest także rozpoznawanie mowy i przekładanie zarejestrowanego w tym procesie dźwięku na tekst pisany, przetłumaczenie wypowiedzianej frazy na język obcy, czy też reakcja na polecenia głosowe.

Do puli korzyści płynących z tych zaawansowanych algorytmów należy dorzucić także programy antywirusowe i odsiewające spam w naszych skrzynkach mailowych, wszelkiego rodzaju nawigacje, możliwość poruszania się pojazdów autonomicznych, a nawet automatyczne sterowanie procesami produkcyjnymi w fabrykach oraz przedsiębiorstwach. To już dość pokaźna pula, lecz jeszcze nie wszystko. Uczenie maszynowe jest również przydatne w rozwoju Internetu, robotyki, opracowywaniu nowych leków oraz metod diagnostycznych, jak również w monitorowaniu rynków finansowych. [2] W przyszłości obszar zastosowania tej technologii jeszcze wzrośnie, a wszystko to jest prawdopodobnie najlepszym dowodem na to, jak istotne w naszym życiu i w dalszej perspektywie jest to rozwiązanie.

uczenie maszynowe

Skoro zdajemy sobie już sprawę z istotności uczenia maszynowego, to również powinniśmy rozumieć, jak ważny jest dalszy rozwój tej dziedziny oraz jej ulepszanie. Dlatego też badania nad tym rozwiązaniem są nader zintensyfikowane, a najtęższe umysły z całego świata próbują znaleźć sposób na to, aby uczenie maszynowe było wydajniejsze, szybsze i bardzie niezawodne. Jednymi z takowych badaczy są Jean Barbier oraz Ziv Goldfeld z Uniwersytetu Cornella (ang. Cornell University), czyli jednej z najbardziej prestiżowych uczelni w Stanach Zjednoczonych.

Problemy napotyka każdy

Należy wiedzieć, iż uczenie maszynowe nie jest doskonałe i istnieje wiele zastrzeżeń, co do rzetelności jego działania. Dlatego też opracowano konkretne wytyczne, jakie te zaawansowane algorytmy muszą spełniać. Jednym z takowych problematycznych obszarów są wątpliwości dotyczące wiarygodności oraz poprawności wyciąganych w procesie uczenia maszynowego konkluzji. [3] Są one konstruowane na podstawie m.in. wnioskowania statystycznego, czyli nauce wyciągania wniosków o określonym systemie danych, co w przypadku nauczania maszynowego „odbywa się w bardzo dużym wymiarze: bardzo wiele nieznanych cech systemu musi zostać wydedukowanych z wielu zaszumionych danych o wysokim wymiarze”.

Ten „reżim wysokowymiarowy” przypomina mechanikę statystyczną, której celem jest opisanie „makroskopowego zachowania złożonego układu w oparciu o wiedzę o jego mikroskopowych interakcjach”. Oznacza to, że na podstawie informacji w skali mikro, czyli ograniczonych i jednostkowych, wyciągane są wnioski w zakresie makro – w zastosowaniu do szerokiego obszaru. Procesy takie nazywane są wnioskowaniem wielowymiarowym lub zamiennie – wnioskowaniem wysokowymiarowym i jak można się domyślić nie trudno w ich ramach o błędy, a tym samym mało rzetelne wyniki. W swojej pracy na ten temat, Jean Barbier opisuje także, że jest wiele powiązań pomiędzy wnioskowaniem a fizyką statystyczną, co poparte jest opisem „paradygmatycznych modeli wnioskowania wysokowymiarowego w języku mechaniki statystycznej”. Brzmi to bardzo skomplikowanie i takie też jest w istocie, niemniej ustalenia te mogą stanowić punkt wyjścia dla innych badaczy, jak inny, wspomniany już pracownik Uniwersytetu Cornella – Ziv Goldfeld. [4]

uczenie maszynowe

I co dalej?

Ziv Goldfeld pracuje w dziale inżynierii elektrycznej i komputerowej Uniwersytetu Cornella. Naukowiec rozumiejąc kwestie bezpieczeństwa, związane z problemem pozyskiwania wiarygodnych wniosków z „szumu wysokowymiarowego”, postanowił poszukać rozwiązania optymalizującego te procesy. Zauważył on, że ta swoista luka jest „szczególnie wyraźna w systemach, które działają na rzeczywistych, wielowymiarowych danych, dla których najbardziej potrzebne są gwarancje teoretyczne”. Dzięki szczegółowym analizom problemu oraz jego możliwych rozwiązań, badacz opracował gładkie odległości statystyczne, czyli „uregulowane miary rozbieżności między rozkładami prawdopodobieństwa”. Pozwala to zachować wszelkie możliwości procesów wnioskowania wysokowymiarowego, a jednocześnie łagodzi trudności związane z danymi wielowymiarowymi. W największym uproszczeniu, gładkie odległości statystyczne to nowatorskie ramy wnioskowania wysokowymiarowego, wspierające analizę statystyczną nowoczesnych metod uczenia maszynowego. Tym sposobem, uzyskiwane wyniki są doskonalsze i możliwe do udowodnienia, co jest jednym z głównych wymogów stawianych przed uczeniem maszynowym. [5] Opracowanie tego innowacyjnego podejścia pozwoli usprawnić procesy uczenia maszynowego na dużą skalę oraz rozpowszechnić tę wyjątkową technologię, a nawet wesprzeć inne dziedziny nauki, takie jak mechanika statystyczna. [6]

Przez technologię do rozwoju

Uczenie maszynowe stanowi podstawy zaskakująco wielu programów, które na co dzień wspomagają nie tylko nasze działania w sieci oraz pilnują naszego bezpieczeństwa, ale także umożliwiają diagnostykę medyczną, czy też funkcjonowanie pojazdów autonomicznych. Oczywiste więc jest, że technologia ta jest niezwykle istotna. Tym samym każda metoda oraz rozwiązanie ją udoskonalające jest niemal na wagę złota. Szczególnie, gdy znacząco poprawia jej bezpieczeństwo oraz skuteczność. Tak też jest w przypadku wnioskowania wysokowymiarowego i tego, jak bardzo ten niezwykle skomplikowany obszar naukowego zainteresowania usprawni dotychczasowe możliwości działania maszyn oraz różnorodnych systemów. Dobrze więc, że są tacy badacze, jak choćby Ziv Goldfeld, dzięki któremu rozwija się uczenie maszynowe, a wraz z nim nasza wygoda oraz możliwy jest dalszy postęp ludzkości w wielu dziedzinach. Czy wnioskowanie wysokowymiarowe jest więc dla nas korzystne? Bez cienia wątpliwości – tak, a skutki jego zastosowania będą wymierne.

Źródła:

[1], [2], [3], [5] https://pl.wikipedia.org/wiki/Uczenie_maszynowe

[4] https://arxiv.org/abs/2010.14863

[6] https://research.cornell.edu/research/high-dimensional-inference-improved-machine-learning