Пазначаныя даныя ў кантэксце штучнага інтэлекту (ШІ) і, у прыватнасці, у сферы Google Cloud Machine Learning, адносяцца да набору даных, які быў анатаваны або пазначаны пэўнымі цэтлікамі або катэгорыямі. Гэтыя меткі служаць базавай ісцінай або спасылкай для навучання алгарытмаў машыннага навучання. Звязваючы кропкі дадзеных з іх адпаведнымі пазнакамі, мадэль машыннага навучання можа навучыцца распазнаваць заканамернасці і рабіць прагнозы на аснове новых, нябачаных даных.
Пазначаныя даныя гуляюць вырашальную ролю ў навучанні пад кантролем, што з'яўляецца агульным падыходам у машынным навучанні. Пры кантраляваным навучанні мадэль навучаецца на пазначаным наборы даных, каб даведацца пра ўзаемасувязь паміж уваходнымі функцыямі і іх адпаведнымі выходнымі меткамі. Гэты працэс навучання дазваляе мадэлі абагульніць свае веды і зрабіць дакладныя прагнозы на новых, нябачаных дадзеных.
Каб праілюстраваць гэтую канцэпцыю, давайце разгледзім прыклад задачы машыннага навучання ў галіне распазнавання малюнкаў. Выкажам здагадку, што мы хочам пабудаваць мадэль, якая можа класіфікаваць выявы жывёл у розныя катэгорыі, такія як кошкі, сабакі і птушкі. Нам спатрэбіцца пазначаны набор даных, у якім кожная выява будзе звязана са сваёй правільнай пазнакай. Напрыклад, выява кошкі будзе пазначана як "кот", выява сабакі як "сабака" і гэтак далей.
Пазначаны набор даных будзе складацца з калекцыі малюнкаў і адпаведных ім метак. Кожная выява будзе прадстаўлена наборам функцый, такіх як значэнні пікселяў або прадстаўлення больш высокага ўзроўню, вынятыя з выявы. Пазнакі будуць паказваць правільную катэгорыю або клас, да якога належыць кожная выява.
На этапе навучання мадэль машыннага навучання будзе прадстаўлена з пазначаным наборам даных. Ён навучыцца ідэнтыфікаваць заканамернасці і адносіны паміж функцыямі ўводу і адпаведнымі пазнакамі. Мадэль будзе абнаўляць свае ўнутраныя параметры, каб звесці да мінімуму розніцу паміж сваімі прагнозамі і сапраўднымі пазнакамі ў дадзеных навучання.
Пасля навучання мадэлі яе можна выкарыстоўваць для прагназавання новых, нябачаных малюнкаў. Маючы выяву без цэтліка, мадэль будзе аналізаваць яго асаблівасці і прадказваць найбольш верагодную метку на падставе атрыманых ведаў з пазначанага набору даных. Напрыклад, калі мадэль прадказвае, што выява змяшчае котку, гэта азначае, што яна распазнала шаблоны на выяве, якія паказваюць на котку.
Пазначаныя даныя з'яўляюцца фундаментальным кампанентам у навучанні мадэлям машыннага навучання. Ён дае неабходную інфармацыю, з якой мадэль можа вучыцца і рабіць дакладныя прагнозы. Звязваючы кропкі даных з іх адпаведнымі пазнакамі, мадэль можа навучыцца распазнаваць заканамернасці і абагульняць свае веды на нябачныя даныя.
Іншыя апошнія пытанні і адказы адносна EITC/AI/GCML Google Cloud Machine Learning:
- Што такое тэкст у маўленне (TTS) і як ён працуе з AI?
- Якія абмежаванні ёсць у працы з вялікімі наборамі даных у машынным навучанні?
- Ці можа машыннае навучанне аказаць некаторую дапамогу ў дыялогу?
- Што такое гульнявая пляцоўка TensorFlow?
- Што насамрэч азначае большы набор даных?
- Якія прыклады гіперпараметраў алгарытму?
- Што такое ансамблевае навучанне?
- Што рабіць, калі абраны алгарытм машыннага навучання не падыходзіць, і як пераканацца, што выбраны правільны?
- Ці патрэбна мадэль машыннага навучання пад наглядам падчас навучання?
- Якія ключавыя параметры выкарыстоўваюцца ў алгарытмах нейронных сетак?
Больш пытанняў і адказаў глядзіце ў EITC/AI/GCML Google Cloud Machine Learning