Каб атрымаць усе анатацыі аб'ектаў з адказу API у галіне штучнага інтэлекту – Google Vision API – Пашыранае разуменне малюнкаў – Выяўленне аб’ектаў, вы можаце выкарыстоўваць фармат адказу, прадастаўлены API, які ўключае спіс выяўленых аб’ектаў разам з іх адпаведнымі абмежавальныя рамкі і ацэнкі даверу. Разбіраючы гэты адказ, вы можаце атрымаць патрэбныя анатацыі аб'екта.
Адказ API звычайна складаецца з аб'екта JSON, які змяшчае розныя палі, у тым ліку поле "localizedObjectAnnotations", якое змяшчае выяўленыя аб'екты. Кожная анатацыя аб'екта ўключае такую інфармацыю, як назва аб'екта, яго каардынаты абмежавальнай рамкі і ацэнка даверу, якая паказвае на ўпэўненасць API у выяўленні.
Каб атрымаць анатацыі аб'екта, вы можаце выканаць наступныя дзеянні:
1. Разбярыце адказ API: пачніце з аналізу адказу JSON, атрыманага ад API. Гэта можна зрабіць з дапамогай бібліятэкі аналізу JSON або ўбудаваных функцый, якія забяспечваюцца вашай мовай праграмавання.
2. Доступ да поля "localizedObjectAnnotations": пасля аналізу адказу атрымайце доступ да поля "localizedObjectAnnotations", якое змяшчае выяўленыя аб'екты. Гэта поле звычайна ўяўляе сабой масіў анатацый аб'ектаў.
3. Ітэрацыя па анатацыях аб'ектаў: ітэрацыя па кожнай анатацыі аб'екта ў масіве. Кожная анатацыя прадстаўляе выяўлены аб'ект на малюнку.
4. Вылучыце рэлевантную інфармацыю: вылучыце рэлевантную інфармацыю з анатацыі кожнага аб'екта, такую як назва аб'екта, каардынаты абмежавальнай рамкі і паказчык даверу. Гэтыя звесткі можна атрымаць як асобныя палі ўнутры кожнай анатацыі аб'екта.
5. Захоўвайце або апрацоўвайце здабытую інфармацыю: у залежнасці ад вашых патрабаванняў вы можаце захоўваць здабытую інфармацыю ў структуры даных або апрацоўваць яе далей для аналізу або іншых мэтаў. Напрыклад, вы можаце захаваць назвы аб'ектаў і іх адпаведныя каардынаты абмежавальнай рамкі ў базе дадзеных або выкарыстоўваць іх для далейшых задач разумення малюнкаў.
Вось спрошчаны прыклад для ілюстрацыі працэсу здабывання:
python import json # Assume 'response' contains the API response in JSON format response =
{
"localizedObjectAnnotations": [
{
"сярэдзіна": "/m/01g317",
"імя": "кошка",
"бал": 0.89271355,
"boundingPoly": {
"нармаваныя вяршыні": [
{"x": 0.1234, "y": 0.5678},
{"x": 0.5678, "y": 0.1234}
]}
},
{
"сярэдзіна": "/m/04rky",
"імя": "сабака",
"бал": 0.8132468,
"boundingPoly": {
"нармаваныя вяршыні": [
{"x": 0.4321, "y": 0.8765},
{"x": 0.8765, "y": 0.4321}
]}
}
]}
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
У гэтым прыкладзе мы мяркуем, што адказ JSON змяшчае два выяўленыя аб'екты: котку і сабаку. Код аналізуе адказ, атрымлівае доступ да поля "localizedObjectAnnotations", перабірае кожную анатацыю аб'екта і здабывае назву аб'екта, каардынаты абмежавальнай рамкі і паказчык даверу. Нарэшце, здабытая інфармацыя друкуецца, але вы можаце змяніць код у адпаведнасці са сваімі патрэбамі.
Выконваючы наступныя крокі, вы можаце эфектыўна здабываць усе анатацыі аб'ектаў з адказу API у галіне штучнага інтэлекту – API Google Vision – Пашыранае разуменне малюнкаў – Выяўленне аб’ектаў.
Іншыя апошнія пытанні і адказы адносна Пашыранае разуменне малюнкаў:
- Якія прадвызначаныя катэгорыі для распазнавання аб'ектаў у Google Vision API?
- Які рэкамендаваны падыход для выкарыстання функцыі выяўлення бяспечнага пошуку ў спалучэнні з іншымі метадамі мадэрацыі?
- Як мы можам атрымаць доступ і адлюстраваць значэнні імавернасці для кожнай катэгорыі ў анатацыі бяспечнага пошуку?
- Як мы можам атрымаць анатацыю бяспечнага пошуку з дапамогай API Google Vision у Python?
- Якія пяць катэгорый уключае функцыя выяўлення бяспечнага пошуку?
- Як функцыя бяспечнага пошуку Google Vision API выяўляе нецэнзурнае змесціва на выявах?
- Як мы можам візуальна вызначыць і вылучыць выяўленыя аб'екты на малюнку з дапамогай бібліятэкі падушак?
- Як мы можам арганізаваць здабытую інфармацыю аб аб'екце ў таблічным фармаце, выкарыстоўваючы фрэйм дадзеных pandas?
- Якія бібліятэкі і мовы праграмавання выкарыстоўваюцца для дэманстрацыі функцыянальнасці API Google Vision?
- Як API Google Vision выконвае выяўленне і лакалізацыю аб'ектаў у малюнках?
Больш пытанняў і адказаў глядзіце ў раздзеле "Пашыранае разуменне малюнкаў".