Cloud Machine Learning Engine (CMLE) - гэта магутны інструмент, прадастаўлены Google Cloud Platform (GCP) для навучання мадэлям машыннага навучання размеркаваным і паралельным спосабам. Аднак ён не забяспечвае аўтаматычнага атрымання і канфігурацыі рэсурсаў, а таксама не апрацоўвае адключэнне рэсурсаў пасля завяршэння навучання мадэлі. У гэтым адказе мы разгледзім дэталі CMLE, яго магчымасці і неабходнасць ручнога кіравання рэсурсамі.
CMLE прызначаны для спрашчэння працэсу навучання і разгортвання мадэляў машыннага навучання ў маштабе. Гэта забяспечвае кіраванае асяроддзе, якое дазваляе карыстальнікам сканцэнтравацца на распрацоўцы мадэлі, а не на кіраванні інфраструктурай. CMLE выкарыстоўвае магутнасць інфраструктуры GCP для размеркавання навучальнай нагрузкі на некалькі машын, што дазваляе паскорыць навучанне і апрацоўваць вялікія наборы даных.
Пры выкарыстанні CMLE карыстальнікі могуць гнутка выбіраць тып і колькасць рэсурсаў, неабходных для іх навучальнай працы. Яны могуць выбраць тып машыны, колькасць рабочых і іншыя параметры ў залежнасці ад сваіх канкрэтных патрабаванняў. Аднак CMLE не атрымлівае і не наладжвае гэтыя рэсурсы аўтаматычна. Карыстальнік нясе адказнасць за прадастаўленне неабходных рэсурсаў перад пачаткам навучання.
Каб атрымаць рэсурсы, карыстальнікі могуць выкарыстоўваць сэрвісы GCP, такія як Compute Engine або Kubernetes Engine. Гэтыя сэрвісы забяспечваюць маштабаваную і гнуткую інфраструктуру, якая адпавядае навучальнай нагрузцы. Карыстальнікі могуць ствараць асобнікі віртуальных машын або кантэйнеры, канфігураваць іх з неабходнымі праграмнымі залежнасцямі, а затым выкарыстоўваць іх у якасці рабочых у CMLE.
Пасля завяршэння навучальнага задання CMLE не адключае аўтаматычна рэсурсы, якія выкарыстоўваюцца для навучання. Гэта адбываецца таму, што навучаную мадэль можа спатрэбіцца разгарнуць і абслугоўваць для вываду. Карыстальнік сам вырашае, калі і як спыніць рэсурсы, каб пазбегнуць непатрэбных выдаткаў.
Падводзячы вынік, CMLE прапануе магутную платформу для навучання мадэлі паралельнага машыннага навучання. Аднак ён патрабуе ручнога збору і канфігурацыі рэсурсаў і не апрацоўвае адключэнне рэсурсаў пасля завяршэння навучання. Карыстальнікі павінны прадастаўляць неабходныя рэсурсы з дапамогай сэрвісаў GCP, такіх як Compute Engine або Kubernetes Engine, і кіраваць іх жыццёвым цыклам у адпаведнасці са сваімі канкрэтнымі патрабаваннямі.
Іншыя апошнія пытанні і адказы адносна Поспехі ў машынным навучанні:
- Калі ядро разгалінавана з дадзенымі, а арыгінал з'яўляецца прыватным, ці можа разгалінаванае быць агульнадаступным, і калі так, не з'яўляецца парушэннем прыватнасці?
- Якія абмежаванні ёсць у працы з вялікімі наборамі даных у машынным навучанні?
- Ці можа машыннае навучанне аказаць некаторую дапамогу ў дыялогу?
- Што такое гульнявая пляцоўка TensorFlow?
- Ці перашкаджае рэжым Eager функцыянальнасці размеркаваных вылічэнняў TensorFlow?
- Ці можна выкарыстоўваць воблачныя рашэнні Google для аддзялення вылічэнняў ад сховішча для больш эфектыўнага навучання мадэлі ML з вялікімі дадзенымі?
- Ці можна навучыць мадэлі машыннага навучання на як заўгодна вялікіх наборах даных без збояў?
- Ці патрабуе пры выкарыстанні CMLE стварэнне версіі ўказання крыніцы экспартаванай мадэлі?
- Ці можа CMLE счытваць дадзеныя з воблачнага сховішча Google і выкарыстоўваць для вываду вызначаную падрыхтаваную мадэль?
- Ці можна Tensorflow выкарыстоўваць для навучання і вываду глыбокіх нейронавых сетак (DNN)?
Больш пытанняў і адказаў глядзіце ў раздзеле "Пашырэнне машыннага навучання".