AutoML Tables - гэта магутны інструмент машыннага навучання, прадастаўлены Google Cloud, які дазваляе карыстальнікам ствараць і разгортваць мадэлі машыннага навучання без неабходнасці шырокага праграмавання або экспертызы ў галіне навукі аб дадзеных. Ён аўтаматызуе працэс распрацоўкі функцый, выбару мадэлі, налады гіперпараметраў і ацэнкі мадэлі, што робіць яго даступным для карыстальнікаў з розным узроўнем ведаў машыннага навучання.
Што тычыцца тыпаў даных, табліцы AutoML могуць апрацоўваць шырокі спектр тыпаў структураваных даных. Структураваныя даныя адносяцца да даных, арганізаваных у таблічным фармаце з радкамі, якія прадстаўляюць асобнікі або прыклады, і слупкамі, якія прадстаўляюць функцыі або зменныя. Табліцы AutoML могуць апрацоўваць як лікавыя, так і катэгарыяльныя тыпы даных, што дазваляе карыстальнікам працаваць з рознымі наборамі даных.
1. Лікавыя даныя: AutoML Tables падтрымлівае розныя тыпы лікавых даных, у тым ліку цэлыя лікі і лікі з плаваючай коскай. Гэтыя тыпы даных прыдатныя для прадстаўлення бесперапынных або дыскрэтных лікавых значэнняў. Напрыклад, калі ў нас ёсць набор даных аб цэнах на жыллё, слупок коштаў будзе прадстаўлены як лікавы тып даных.
2. Катэгарыяльныя даныя: табліцы AutoML таксама падтрымліваюць катэгарыяльныя тыпы даных, якія прадстаўляюць асобныя значэнні, якія адносяцца да пэўных катэгорый. Катэгарыяльныя даныя можна далей падзяліць на два падтыпы:
а. Намінальныя даныя: намінальныя даныя прадстаўляюць катэгорыі, якія не маюць уласцівага парадку або іерархіі. Напрыклад, калі ў нас ёсць набор даных водгукаў кліентаў, слупок настрояў можа мець такія катэгорыі, як "станоўчыя", "нейтральныя" і "адмоўныя". Табліцы AutoML могуць апрацоўваць такія намінальныя катэгарыяльныя даныя.
б. Парадкавыя даныя: парадкавыя даныя прадстаўляюць катэгорыі, якія маюць пэўны парадак або іерархію. Напрыклад, калі ў нас ёсць набор даных рэйтынгаў фільмаў, у слупку рэйтынгаў могуць быць такія катэгорыі, як «дрэнна», «добра», «добра» і «выдатна». Табліцы AutoML могуць апрацоўваць такія парадкавыя катэгарыяльныя даныя і ўлічваць парадак катэгорый падчас навучання мадэлі.
3. Тэкставыя даныя: AutoML Tables таксама забяспечвае падтрымку тэкставых даных. Тэкставыя даныя звычайна неструктураваныя і патрабуюць папярэдняй апрацоўкі для пераўтварэння іх у структураваны фармат, прыдатны для машыннага навучання. Табліцы AutoML могуць апрацоўваць тэкставыя дадзеныя, выкарыстоўваючы такія метады, як убудаванне тэксту або прадстаўленне пакета слоў. Напрыклад, калі ў нас ёсць набор даных водгукаў кліентаў, тэкст агляду можна пераўтварыць у лікавыя функцыі з дапамогай такіх метадаў, як убудаванне слоў, якія затым могуць выкарыстоўвацца табліцамі AutoML для навучання мадэлям.
4. Даныя часовых шэрагаў: табліцы AutoML могуць апрацоўваць даныя часавых шэрагаў, якія ўяўляюць сабой даныя, сабраныя за паслядоўнасць часавых інтэрвалаў. Даныя часовых шэрагаў звычайна сустракаюцца ў розных галінах, такіх як фінансы, прагноз надвор'я і аналіз фондавага рынку. Табліцы AutoML могуць апрацоўваць дадзеныя часовых шэрагаў, уключаючы функцыі, звязаныя з часам, такія як пазнакі часу і зменныя з адставаннем.
Табліцы AutoML могуць апрацоўваць шырокі спектр тыпаў структураваных даных, у тым ліку лікавыя, катэгарыяльныя (як намінальныя, так і парадкавыя), тэкставыя і даныя часовых шэрагаў. Такая ўніверсальнасць дазваляе карыстальнікам выкарыстоўваць магутнасць табліц AutoML для разнастайных задач машыннага навучання ў розных сферах.
Іншыя апошнія пытанні і адказы адносна Табліцы AutoML:
- Чаму AutoML Tables былі спынены і што іх замяняе?
- Як карыстальнікі могуць разгарнуць сваю мадэль і атрымаць прагнозы ў табліцах AutoML?
- Якія варыянты даступныя для ўстаноўкі бюджэту навучання ў AutoML Tables?
- Якую інфармацыю змяшчае ўкладка "Аналіз" у табліцах AutoML?
- Як карыстальнікі могуць імпартаваць даныя навучання ў табліцы AutoML?