Каб праграмна здабываць этыкеткі з малюнкаў з дапамогай Python і Vision API, вы можаце выкарыстоўваць магутныя магчымасці Google Cloud Vision API. Vision API забяспечвае шырокі набор функцый аналізу малюнкаў, уключаючы выяўленне этыкетак, што дазваляе аўтаматычна ідэнтыфікаваць і здабываць цэтлікі з малюнкаў.
Каб пачаць, вам трэба будзе наладзіць праект Google Cloud і ўключыць Vision API. Пасля таго, як вы гэта зробіце, вы можаце ўсталяваць неабходныя бібліятэкі Python, выканаўшы наступную каманду:
python pip install google-cloud-vision
Далей вам неабходна прайсці аўтэнтыфікацыю вашага прыкладання для доступу да Vision API. Вы можаце зрабіць гэта, стварыўшы ключ службовага ўліковага запісу і ўсталяваўшы зменную асяроддзя `GOOGLE_APPLICATION_CREDENTIALS`, каб паказваць шлях да файла ключа. Гэта можна зрабіць з дапамогай наступнага кода:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
Цяпер вы можаце выкарыстоўваць Vision API для праграмнага здабывання цэтлікаў з малюнкаў. Наступны фрагмент кода дэманструе, як гэта зрабіць:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
У гэтым кодзе мы спачатку ствараем асобнік класа `ImageAnnotatorClient` з бібліятэкі `google.cloud.vision`. Затым мы чытаем файл выявы, ствараем аб'ект "Image" са змесціва файла і адпраўляем яго ў Vision API для выяўлення цэтліка. Адказ API змяшчае спіс анатацый цэтлікаў, з якіх мы здабываем апісанні цэтлікаў.
Цяпер вы можаце выклікаць функцыю `extract_labels`, перадаўшы шлях да файла выявы, які вы хочаце прааналізаваць. Ён верне спіс метак, вынятых з выявы.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
Гэта вывядзе вынятыя цэтлікі з выявы.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
API Vision выкарыстоўвае перадавыя мадэлі машыннага навучання для аналізу малюнкаў і ідэнтыфікацыі аб'ектаў, сцэн і іншых візуальных функцый. Ён можа дакладна вызначаць шырокі спектр цэтлікаў, што робіць яго каштоўным інструментам для розных прыкладанняў, такіх як класіфікацыя малюнкаў, мадэрацыя кантэнту і візуальны пошук.
Каб праграмна здабываць цэтлікі з малюнкаў з дапамогай Python і Vision API, вам трэба наладзіць праект Google Cloud, уключыць Vision API, усталяваць неабходныя бібліятэкі Python, прайсці аўтэнтыфікацыю вашага прыкладання, а затым выкарыстоўваць Vision API для выяўлення цэтлікаў на выявы. Вынятыя этыкеткі можна выкарыстоўваць для далейшага аналізу або для паляпшэння разумення змесціва выявы.
Іншыя апошнія пытанні і адказы адносна EITC/AI/GVAPI API Google Vision:
- Якія прадвызначаныя катэгорыі для распазнавання аб'ектаў у Google Vision API?
- Ці дазваляе API Google Vision распазнаваць твар?
- Як тэкст можа быць дададзены да выявы пры маляванні межаў аб'екта з дапамогай функцыі "draw_vertices"?
- Якія параметры метаду "draw.line" у прадстаўленым кодзе і як яны выкарыстоўваюцца для малявання ліній паміж значэннямі вяршыняў?
- Як можна выкарыстоўваць бібліятэку падушкі для малявання межаў аб'ектаў у Python?
- Якая мэта функцыі "draw_vertices" у прадстаўленым кодзе?
- Як Google Vision API можа дапамагчы зразумець формы і аб'екты на малюнку?
- Як карыстальнікі могуць даследаваць візуальна падобныя выявы, рэкамендаваныя API?
- Якія розныя элементы прадстаўлены ў аб'екце адказу функцыі вэб-выяўлення Google Vision API?
- Як функцыя Web Detection дапамагае ствараць тэгі для запампаваных малюнкаў?
Больш пытанняў і адказаў глядзіце ў EITC/AI/GVAPI Google Vision API