Кантраляванае, некантраляванае і навучанне з падмацаваннем - гэта тры розныя падыходы ў галіне машыннага навучання. Кожны падыход выкарыстоўвае розныя метады і алгарытмы для вырашэння розных тыпаў праблем і дасягнення канкрэтных мэтаў. Давайце вывучым адрозненні паміж гэтымі падыходамі і дамо поўнае тлумачэнне іх характарыстык і прымянення.
Кантраляванае навучанне - гэта тып машыннага навучання, пры якім алгарытм вучыцца з пазначаных даных. Пазначаныя даныя складаюцца з прыкладаў уводу ў спалучэнні з адпаведным правільным выхадам або мэтавым значэннем. Мэта навучання пад наглядам - навучыць мадэль, якая можа дакладна прагназаваць выхад для новых, нябачных уваходных дадзеных. Алгарытм навучання выкарыстоўвае пазначаныя даныя для высновы аб заканамернасцях і сувязях паміж уваходнымі функцыямі і выходнымі пазнакамі. Затым ён абагульняе гэтыя веды, каб рабіць прагнозы на новых немаркіраваных дадзеных. Кантраляванае навучанне звычайна выкарыстоўваецца ў такіх задачах, як класіфікацыя і рэгрэсія.
Напрыклад, у задачы класіфікацыі алгарытм навучаецца на наборы даных, дзе кожная кропка даных пазначаецца пэўным класам. Алгарытм вучыцца класіфікаваць новыя нябачныя кропкі даных у адзін з загадзя вызначаных класаў на аснове шаблонаў, якія ён даведаўся з пазначаных прыкладаў. У задачы рэгрэсіі алгарытм вучыцца прагназаваць бесперапыннае лікавае значэнне на аснове ўваходных функцый.
З іншага боку, некантраляванае навучанне мае справу з немаркіраванымі дадзенымі. Мэтай некантралюемага навучання з'яўляецца выяўленне схаваных заканамернасцей, структур або сувязей у дадзеных без папярэдняга ведання выходных цэтлікаў. У адрозненне ад навучання пад кантролем, алгарытмы некантралюемага навучання не маюць відавочных мэтавых значэнняў для кіраўніцтва працэсам навучання. Замест гэтага яны сканцэнтраваны на пошуку значных уяўленняў або кластараў у дадзеных. Навучанне без нагляду звычайна выкарыстоўваецца ў такіх задачах, як кластэрызацыя, памяншэнне памернасці і выяўленне анамалій.
Кластэрызацыя - гэта папулярнае прымяненне некантралюемага навучання, дзе алгарытм групуе падобныя кропкі даных на аснове іх унутраных уласцівасцей. Напрыклад, пры сегментацыі кліентаў алгарытм некантраляванага навучання можа быць выкарыстаны для ідэнтыфікацыі асобных груп кліентаў на аснове іх пакупніцкіх паводзін або дэмаграфічнай інфармацыі.
Навучанне з падмацаваннем - гэта іншая парадыгма, пры якой агент вучыцца ўзаемадзейнічаць з навакольным асяроддзем, каб максымізаваць сукупны сігнал узнагароды. Пры навучанні з падмацаваннем алгарытм навучаецца метадам спроб і памылак, выконваючы дзеянні, назіраючы за станам навакольнага асяроддзя і атрымліваючы зваротную сувязь у выглядзе ўзнагароджання або штрафу. Мэта складаецца ў тым, каб знайсці аптымальную палітыку або набор дзеянняў, якія максімізуюць доўгатэрміновую ўзнагароду. Навучанне з падмацаваннем звычайна выкарыстоўваецца ў такіх задачах, як гульня, робататэхніка і аўтаномныя сістэмы.
Напрыклад, у гульні ў шахматы агент навучання з падмацаваннем можа навучыцца гуляць, даследуючы розныя хады, атрымліваючы ўзнагароды або штрафы ў залежнасці ад выніку кожнага ходу і карэкціруючы сваю стратэгію, каб павялічыць шанцы на перамогу.
Кантраляванае навучанне выкарыстоўвае пазначаныя даныя для падрыхтоўкі мадэлі да задач прагназавання, некантраляванае навучанне выяўляе заканамернасці і структуры ў немаркіраваных даных, а навучанне з падмацаваннем вучыцца праз узаемадзеянне з навакольным асяроддзем, каб максымізаваць сігнал узнагароды. Кожны падыход мае свае моцныя і слабыя бакі і падыходзіць для розных тыпаў праблем і прыкладанняў.
Іншыя апошнія пытанні і адказы адносна EITC/AI/GCML Google Cloud Machine Learning:
- Што такое тэкст у маўленне (TTS) і як ён працуе з AI?
- Якія абмежаванні ёсць у працы з вялікімі наборамі даных у машынным навучанні?
- Ці можа машыннае навучанне аказаць некаторую дапамогу ў дыялогу?
- Што такое гульнявая пляцоўка TensorFlow?
- Што насамрэч азначае большы набор даных?
- Якія прыклады гіперпараметраў алгарытму?
- Што такое ансамблевае навучанне?
- Што рабіць, калі абраны алгарытм машыннага навучання не падыходзіць, і як пераканацца, што выбраны правільны?
- Ці патрэбна мадэль машыннага навучання пад наглядам падчас навучання?
- Якія ключавыя параметры выкарыстоўваюцца ў алгарытмах нейронных сетак?
Больш пытанняў і адказаў глядзіце ў EITC/AI/GCML Google Cloud Machine Learning