Як мы запаўняем слоўнікі для набораў цягнікоў і тэстаў?

by Акадэмія EITCA / Панядзелак, 07 Жнівень 2023 / Апублікавана ў Штучны Інтэлект, EITC/AI/MLP Машыннае навучанне з Python, Праграмаванне машыннага навучання, Прымяненне ўласнага алгарытму бліжэйшых суседзяў, Экзаменацыйны агляд

Каб запоўніць слоўнікі для набораў цягнікоў і тэстаў у кантэксце прымянення ўласнага алгарытму K бліжэйшых суседзяў (KNN) у машынным навучанні з выкарыстаннем Python, нам трэба прытрымлівацца сістэмнага падыходу. Гэты працэс прадугледжвае пераўтварэнне нашых даных у прыдатны фармат, які можа выкарыстоўвацца алгарытмам KNN.

Спачатку давайце разбярэмся ў асноўнай канцэпцыі слоўнікаў у Python. Слоўнік - гэта неўпарадкаваная калекцыя пар ключ-значэнне, дзе кожны ключ унікальны. У кантэксце машыннага навучання слоўнікі звычайна выкарыстоўваюцца для прадстаўлення набораў даных, дзе ключы адпавядаюць функцыям або атрыбутам, а значэнні ўяўляюць адпаведныя кропкі даных.

Каб запоўніць слоўнікі для цягнікоў і тэставых набораў, нам трэба выканаць наступныя крокі:

1. Падрыхтоўка даных: пачніце са збору і падрыхтоўкі даных для нашай задачы машыннага навучання. Звычайна гэта ўключае ачыстку даных, апрацоўку адсутных значэнняў і пераўтварэнне даных у прыдатны фармат. Пераканайцеся, што даныя належным чынам пазначаны або класіфікаваны, бо гэта важна для задач навучання пад кантролем.

2. Раздзяленне набору даных: далей нам трэба падзяліць наш набор даных на дзве часткі: набор цягнікоў і тэставы набор. Набор цягнікоў будзе выкарыстоўвацца для навучання нашага алгарытму KNN, а тэставы набор будзе выкарыстоўвацца для ацэнкі яго прадукцыйнасці. Гэта раздзяленне дапамагае нам ацаніць, наколькі добра наш алгарытм абагульняе нябачныя даныя.

3. Выманне функцый: пасля таго, як набор даных падзелены, нам трэба вылучыць адпаведныя функцыі з даных і прызначыць іх у якасці ключоў у нашых слоўніках. Прыкметы могуць быць лікавымі або катэгарыяльнымі, у залежнасці ад характару нашых даных. Напрыклад, калі мы працуем з наборам даных малюнкаў, мы можам атрымаць такія функцыі, як каляровыя гістаграмы або дэскрыптары тэкстуры.

4. Прызначэнне значэнняў: пасля вымання функцый нам трэба прысвоіць адпаведныя значэнні кожнаму ключу ў нашых слоўніках. Гэтыя значэнні ўяўляюць фактычныя кропкі даных або асобнікі ў нашым наборы даных. Кожны асобнік павінен быць звязаны з адпаведнымі значэннямі прыкмет.

5. Слоўнік цягніка: Стварыце слоўнік для прадстаўлення цягніка. Ключамі гэтага слоўніка будуць функцыі, а значэннямі - спісы або масівы, якія змяшчаюць адпаведныя значэнні функцый для кожнага асобніка ў наборы цягнікоў. Напрыклад, калі ў нас ёсць набор даных з дзвюма характарыстыкамі (узрост і даход) і трыма асобнікамі, слоўнік набору цягнікоў можа выглядаць так:

train_set = {'узрост': [25, 30, 35], 'даход': [50000, 60000, 70000]}

6. Слоўнік тэставага набору: аналагічным чынам стварыце слоўнік для прадстаўлення тэставага набору. Ключы гэтага слоўніка будуць тымі ж функцыямі, што і ў наборы цягнікоў, а значэнні будуць спісамі або масівамі, якія змяшчаюць адпаведныя значэнні функцый для кожнага асобніка ў тэставым наборы. Напрыклад, калі ў нас ёсць тэставы набор з двума асобнікамі, слоўнік тэставага набору можа выглядаць так:

test_set = {'узрост': [40, 45], 'даход': [80000, 90000]}

7. Выкарыстанне слоўнікаў: пасля таго, як слоўнікі для цягніка і тэставых набораў запоўнены, мы можам выкарыстоўваць іх у якасці ўваходных дадзеных для нашага ўласнага алгарытму KNN. Алгарытм будзе выкарыстоўваць значэнні функцый з набору цягнікоў для прагназавання або класіфікацыі асобнікаў у тэставым наборы.

Выконваючы гэтыя крокі, мы можам эфектыўна запоўніць слоўнікі для цягнікоў і тэставых набораў у кантэксце прымянення нашага ўласнага алгарытму KNN у машынным навучанні з выкарыстаннем Python. Гэтыя слоўнікі служаць асновай для навучання і ацэнкі прадукцыйнасці нашага алгарытму.

Каб запоўніць слоўнікі для навучальных і тэставых набораў, нам трэба падрыхтаваць і падзяліць набор даных, атрымаць адпаведныя функцыі, прызначыць значэнні функцый адпаведным ключам у слоўніках і выкарыстоўваць гэтыя слоўнікі ў нашым уласным алгарытме KNN.

Іншыя апошнія пытанні і адказы адносна Прымяненне ўласнага алгарытму бліжэйшых суседзяў:

Яшчэ пытанні і адказы:

тэгі: Штучны Інтэлект, Падрыхтоўка дадзеных, Слоўнікі, Алгарытм КНН, машыннае навучанне, Пітон

Акадэмія EITCA

Як мы запаўняем слоўнікі для набораў цягнікоў і тэстаў?

Іншыя апошнія пытанні і адказы адносна Прымяненне ўласнага алгарытму бліжэйшых суседзяў:

Яшчэ пытанні і адказы:

Акадэмія EITCA з'яўляецца часткай Еўрапейскай сістэмы ІТ-сертыфікацыі

Права на атрыманне акадэміі EITCA 80% падтрымкі субсідый EITCI DSJC

Акадэмія EITCA

Увайдзіце ў свой рахунак па электроннай пошце альбо па адрасе электроннай пошты

Забыліся?

СТВАРЫЦЬ КОШТ

Як мы запаўняем слоўнікі для набораў цягнікоў і тэстаў?

Іншыя апошнія пытанні і адказы адносна Прымяненне ўласнага алгарытму бліжэйшых суседзяў:

Яшчэ пытанні і адказы:

Права на атрыманне акадэміі EITCA 80% падтрымкі субсідый EITCI DSJC